Публикация в медиа результатов изучения переписки сотрудников Роскомнадзора (РКН) всколыхнула информационную повестку. Среди прочего из нее стало известно, что власти продолжают автоматизировать поиск «запрещенного контента». В РКН подтвердили, что система распознавания образов с запрещенной информацией «Окулус» уже работает, а «Вепрь», который должен собирать посты и публикации в интернете и даже прогнозировать «точки информационной напряженности», на стадии испытаний - пишет Forbes. Источник: https://www.forbes.ru/tekhnologii/485333-sledi-za-rec-u-naskol-ko-mozet-byt-effektiven-monitoring-runeta-ot-roskomnadzora
Комментирую... Согласно официальным данным, "Вепрь" предназначен для выявления "потенциальных точек напряженности в сети, способных перерасти в информационные угрозы". Под этим, вероятнее всего, подразумевается выявление опасных концентраций информации в СМИ и социальных медиа, которые могут спровоцировать народные волнения, массовые акции протеста или иные формы проявления недовольства со стороны большого числа граждан. Исходя из такого описания, можно сказать, что даже на Российском рынке присутствуют системы схожего назначения: Медиалогия, Крибрум, СЕУС, Аваланч, Демон Лапласа. Кроме этого, использование расширенных операторов поиска поисковых систем и генераторов RSS-лент позволяют, буквально "на коленке" и бесплатно, создать схожий по функционалу мониторинговый центр.
Важной проблемой при создании подобных систем является обучение их нейросети оценке той или иной информации, т.е. отнесению ее к категориям риска, а также игнорированию распространения фейковой информации, которая может заставить системы мониторинга постоянно выдавать ложную тревогу практически по любому поводу. Чаще всего проблема "обучения" нейросети решается наймом штата сотрудников, которые руками относят информационные сущности к различным категориям. Следовательно, раз нам так и так нужен штат аналитиков, нет смысла переплачивать за квазиумные системы. По крайней мере, на данном этапе. Особенно после их фактического вчерашнего провала в невыявлении акций т.н. "ЧВК РЕДАН".
Система распознавания образов с запрещённой информацией "Окулус" также не представляет из себя ничего выдающегося. Это тоже простейшая нейросеть, позволяющая идентифицировать на фото и видеозаписях, размещенных в сети Интернет, запрещенные тексты или символы. Подобная система распознавания входит даже в программный комплекс "Охотник", который сейчас ставится на вооружение органов внутренних дел.