УПРАВЛЕНИЕ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМАХ У правление в социально-экономических системах УДК 519.7.007 ПРОСТОЙ АЛГОРИТМ НОМИНАЛЬНОЙ КЛАССИФИКАЦИИ ПО КАЧЕСТВЕННЫМ ПРИЗНАКАМ Е.К. <...> Корноушенко Предложен альтернативный подход к классификации по качественным признакам, отличающийся от известных подходов тем, что вместо сравнения кортежа значений признаков тестового объекта с аналогичными кортежами значений признаков объектов обучающей выборки производится независимое попарное сравнение каждой пары значений соответствующих кортежей признаков сравниваемых объектов. <...> Это позволяет сформировать матрицу весов признаков для каждого тестового объекта, более детальную, чем ближайшая окрестность тестового объекта. <...> В рамках данного подхода предложен простой алгоритм классификации, обладающий рядом важных особенностей в плане интерпретации результатов классификации. <...> На примере несбалансированной выборки из известного репозитория UCI проверено качество алгоритма. <...> Показано, что алгоритм обеспечивает хорошую точность классификации объектов «малых» классов. <...> Ключевые слова: классификация, ближайшая окрестность, метка класса, взвешенное голосование, взвешивание признаков, матрица весов признаков. <...> Различают три вида классификации: — классификация «с учителем» (supervised classification), когда исходные данные, отнесенные к разным категориям, называемым классами, разбиваются на две выборки — на обучающей выборке производится обучение (настройка) применяемого алгоритма, а на контрольной — собственно классификация и оценка его качества; — классификация «без учителя» (unsupervised classification), когда на исходных данных формируются классы с помощью различных процедур группировки данных (как правило, процедур кластеризации); — гибридная классификация, когда сгруппированные данные разбиваются на обучающую и контрольную выборки. <...> Это — метрический подход, базирующийся на использовании той или иной метрики при сравнении <...>