Системы телекоммуникаций и сетевые технологии СИСТЕМЫ ТЕЛЕКОММУНИКАЦИЙ И СЕТЕВЫЕ ТЕХНОЛОГИИ УДК 007:681.518.2 ББК 22.18 65.23 65.29 И. М. Ажмухамедов, К. В. Запорожец УСОВЕРШЕНСТВОВАННЫЙ МЕТОД ФИЛЬТРАЦИИ НЕЖЕЛАТЕЛЬНОГО ТРАФИКА I. <...> Zaporozhets IMPROVED METHOD OF FILTRATION OF UNDESIRED TRAFFIC Приведена усовершенствованная методика анализа и фильтрации информационного потока на основе доверительных сетей Байеса, учитывающая тематическую направленность сообщений. <...> Предварительное определение тематики электронного сообщения позволило не только повысить эффективность работы фильтра, основанного на доверительных сетях Байеса, но и снизить ошибки первого и второго рода при принятии решения об отнесении корреспонденции к категории нежелательной рассылки. <...> Был разработан программный продукт, реализующий предложенную методику, и проведена экспериментальная проверка валидности предлагаемого подхода. <...> Полученные результаты свидетельствуют о том, что эффективность разработанной методики при фильтрации спама на 13 % выше, чем эффективность базового варианта. <...> Кроме того, при использовании данного подхода уменьшается вероятность возникновения ошибок первого и второго рода – основных показателей качества спам-фильтров. <...> Ошибка второго рода, когда легитимное сообщение было расценено как спам, оказалась в 2,8 раза меньше, чем при применении базового варианта. <...> Ключевые слова: доверительная сеть Байеса, спам, фильтрация информационного потока, тематика почтовых рассылок. <...> The study provides an improved method of analysis and filtering of information flow based on Bayesian networks, which takes into account the thematic focus of communications. <...> The obtained results show that the effectiveness of the developed method is higher by 13 % than the base case efficiency in filtering spam. <...> In addition, when using this approach the probability of the primary and secondary errors, the main indicators of the quality of spam filters is reducing. <...> Secondary error, when a legitimate message was considered as spam, was 2.8 times less than when using the basic option. <...> Key words: Bayesian network <...>