Информационные системы и технологии УДК 004.912 А.А. ТОЛКУНОВ АЛГОРИТМЫ ФОРМИРОВАНИЯ ВЫБОРОК ТИПИЧНЫХ И ПОЛЕЗНЫХ КОММЕНТАРИЕВ В ХОДЕ ОБРАБОТКИ РЕЗУЛЬТАТОВ ОБЩЕСТВЕННОГО ОБСУЖДЕНИЯ ЗАКОНОПРОЕКТОВ Рассмотрены подходы к решению задачи повышения оперативности выделения высказываний при обработке массива комментариев интернет-пользователей, полученного в результате общественного обсуждения законопроекта. <...> Предложены алгоритмы формирования выборок комментариев при заданном бюджете времени, учитывающие неравномерность распределения высказываний в комментариях. <...> Ключевые слова: общественное обсуждение законопроектов; массив комментариев; мнение; высказывание; модель оперативной аналитической обработки текстов; детализация; выборка типичных комментариев; выборка полезных комментариев; полнота выделения высказываний. <...> В их число входят порталы министерств, ведомств, а также специально созданные порталы в целях проведения общественного обсуждения, такие, как: zakonoproekt2012.ru, regulation.gov.ru, на которых функционируют специальные интерфейсы для ознакомления с текстом законопроекта и создания комментариев интернет-пользователей [1, 2]. <...> Анализ аналитического обзора, сформированного экспертами к законопроекту «О полиции», показал, что в ходе обработки полученных массивов комментариев группа экспертов классифицирует полученные комментарии по статьям, тональности, выделяет типичные мнения, которые подкрепляет полезными комментариями. <...> Поскольку массив комментариев представляет собой массив текстов, приобретение знаний о содержании предложений осуществляется экспертами по итогам последовательного изучения массива комментариев. <...> В этих условиях возникает потребность в моделировании аналитической обработки комментариев (рис. <...> Задаче анализа мнений посвящено направление Opinion Mining, развивающееся в рамках методологии Text Mining. <...> В рамках данного направления активно применяются методы классификации <...>