Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634417)
Контекстум
.
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии  / №1 2007

МОДИФИКАЦИЯ АЛГОРИТМА КЛАСТЕРИЗАЦИИ С-СРЕДНИХ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ ОБЪЕМНЫХ ПРОТОТИПОВ И СЛИЯНИЯ СХОЖИХ КЛАСТЕРОВ (90,00 руб.)

0   0
Первый авторТарасова
Страниц7
ID519528
АннотацияАлгоритм кластеризации C–средних (Fuzzy C-Means, FCM) является одним из наиболее часто используемых алгоритмов. Данный алгоритм обладает рядом недостатков, таких как неустойчивость к начальным данным, неспособность распознавать кластеры малого объема. Также существует проблема определения оптимального количества кластеров. В данной работе рассмотрены способы усовершенствования алгоритма FCM с целью устранения этих недостатков
УДК519.237.8
Тарасова, А.С. МОДИФИКАЦИЯ АЛГОРИТМА КЛАСТЕРИЗАЦИИ С-СРЕДНИХ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ ОБЪЕМНЫХ ПРОТОТИПОВ И СЛИЯНИЯ СХОЖИХ КЛАСТЕРОВ / А.С. Тарасова // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2007 .— №1 .— С. 67-73 .— URL: https://rucont.ru/efd/519528 (дата обращения: 16.04.2024)

Предпросмотр (выдержки из произведения)

УДК 519.237.8 МОДИФИКАЦИЯ АЛГОРИТМА КЛАСТЕРИЗАЦИИ С-СРЕДНИХ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ ОБЪЕМНЫХ ПРОТОТИПОВ И СЛИЯНИЯ СХОЖИХ КЛАСТЕРОВ А. С. <...> Тарасова Воронежский государственный университет Алгоритм кластеризации C–средних (Fuzzy C-Means, FCM) является одним из наиболее часто используемых алгоритмов. <...> Данный алгоритм обладает рядом недостатков, таких как неустойчивость к начальным данным, неспособность распознавать кластеры малого объема. <...> Также существует проблема определения оптимального количества кластеров. <...> В данной работе рассмотрены способы усовершенствования алгоритма FCM с целью устранения этих недостатков. <...> Пусть N — количество рассматриваемых объектов, jN = 1, — номер объекта, Xx j N j == {}1 мых объектов, где каждый объект xx xjj 1 ,, — множество рассматриваеj =(,. ), K характеризуется K признаками. <...> Требуется произвести разбиение данных на кластеры (группы данных, которые близки между собой и далеки друг от друга). <...> Пусть произведена кластеризация данных и выделено M кластеров, iM = 1, — номер кластера, Vi M — множество цент-{}n,, ров кластеров, Si — i -й кластер, uij ==1 i принадлежности объекта xj кластеру Si — степень . <...> Исследуемый нами алгоритм С-средних относится к алгоритмам минимизации квадрата ошибки разбиения в группе разбиенческих методов, которые продуцируют только одно разбиение в отличие от иерархических методов, продуцирующих ряды разбиений, вложенные друг в друга. <...> Алгоритм С-средних не относится ни к агломеративным подходам, которые начинают разбиение с каждого паттерна в отдельном кластере (синглтон) и объединяют кластеры, пока не выполнится критерий останова, ни к разделяющим подходам, которые начинают с кластера, содержащего все паттерны, и производят разделение, пока не выполнится критерий останова. <...> В алгоритме С-средних степени принадлежности объектов ко всем кластерам находят одновременно. <...> Алгоритм С-средних явля© Тарасова А. С., 2007 68 ется политетичным алгоритмом, то есть кластеризация основана на сравнении <...>