Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634699)
Контекстум
.
Электросвязь  / №11 2016

ЭФФЕКТИВНОСТЬ АЛГОРИТМОВ ВЫДЕЛЕНИЯ АТРИБУТОВ В ЗАДАЧАХ КЛАССИФИКАЦИИ ПРИЛОЖЕНИЙ ПРИ ИНТЕЛЛЕКТУАЛЬНОМ АНАЛИЗЕ ТРАФИКА (250,00 руб.)

0   0
Первый авторШелухин
АвторыСимонян А.Г., Ванюшина А.В.
Страниц8
ID569380
АннотацияДля оценки эффективности алгоритмов классификации в режиме обучения и тестирования с помощью разработанного программно-аппаратного комплекса была сформирована база данных приложений трафика FTP, Web (http, https), Мail (SMTP, IMAP), SSH, Skype (TCP, UDP). Из полученных потоков трафика 66% исходных данных использовались в режиме обучения, остальные – для тестирования и оценки эффективности алгоритмов классификации методами машинного обучения. Для обоснования выбора признаков классификации применялись оберточный и фильтрующий алгоритмы выявления признаков. Показано, что многие атрибуты, используемые для классификации трафика (в частности, размер и количество пакетов в потоке в прямом и обратном направлении), не несут значимого информационного выигрыша и влияют на эффективность классификации незначительно. Из анализа алгоритмов InfoGain, CFS, Wrapper следует, что использование оберточного алгоритма выбора признаков является ресурсоемкой вычислительной операцией, которая при большом количестве атрибутов занимает длительное время. Среди рассмотренных алгоритмов на этапе обучения C4.5 (J48), SVM, AdaBoost, Bagging, Naïve Bayes предпочтение следует отдать алгоритмам C4.5 (J48)и Baggins. При тестировании классификатора с алгоритмами SVM, C4.5 (J48), AdaBoost, Bagging, наилучшие результаты показали AdaBoost и Bagging в совокупности с C4.5 (J48).
УДК681.324
Шелухин, О.И. ЭФФЕКТИВНОСТЬ АЛГОРИТМОВ ВЫДЕЛЕНИЯ АТРИБУТОВ В ЗАДАЧАХ КЛАССИФИКАЦИИ ПРИЛОЖЕНИЙ ПРИ ИНТЕЛЛЕКТУАЛЬНОМ АНАЛИЗЕ ТРАФИКА / О.И. Шелухин, А.Г. Симонян, А.В. Ванюшина // Электросвязь .— 2016 .— №11 .— С. 47-54 .— URL: https://rucont.ru/efd/569380 (дата обращения: 24.04.2024)

Предпросмотр (выдержки из произведения)

ИНФОКОММУНИКАЦИОННЫЕ СЕТИ И СИСТЕМЫ Эффективность алгоритмов выделения атрибутов в задачах классификации приложений при интеллектуальном анализе трафика О.И. Шелухин, заведующий кафедрой «Информационная безопасность» МТУСИ, профессор, д.т.н. <...> Для оценки эффективности алгоритмов классификации в режиме обучения и тестирования с помощью разработанного программно-аппаратного комплекса была сформирована база данных приложений трафика FTP, Web (http, https), Мail (SMTP, IMAP), SSH, Skype (TCP, UDP). <...> Из полученных потоков трафика 66% исходных данных использовались в режиме обучения, остальные – для тестирования и оценки эффективности алгоритмов классификации методами машинного обучения. <...> Для обоснования выбора признаков классификации применялись оберточный и фильтрующий алгоритмы выявления признаков. <...> Показано, что многие атрибуты, используемые для классификации трафика (в частности, размер и количество пакетов в потоке в прямом и обратном направлении), не несут значимого информационного выигрыша и влияют на эффективность классификации незначительно. <...> Из анализа алгоритмов InfoGain, CFS, Wrapper следует, что использование оберточного алгоритма выбора признаков является ресурсоемкой вычислительной операцией, которая при большом количестве атрибутов занимает длительное время. <...> Среди рассмотренных алгоритмов на этапе обучения C4.5 (J48), SVM, AdaBoost, Bagging, Naпve Bayes предпочтение следует отдать алгоритмам C4.5 (J48)и Baggins. <...> При тестировании классификатора с алгоритмами SVM, C4.5 (J48), AdaBoost, Bagging, наилучшие результаты показали AdaBoost и Bagging в совокупности с C4.5 (J48). <...> ПОСТАНОВКА ЗАДАЧИ При классификации сетевого трафика важное значение имеют обучающие данные (например, экспериментально полученный набор потока сетевых данных), которые используются для корректного выбора атрибутов классификации, что является основанием для создания классификатора. <...> Процедура машинного обучения (МО) может быть разделена на две части: создание модели классификации <...>