УДК 001.103:002 СИСТЕМА МОРФОЛОГИЧЕСКОГО АНАЛИЗА РУССКИХ СЛОВ А. А. <...> Седунов Воронежский государственный университет В данной работе рассматривается разработка структур данных, алгоритмов и объектно-ориентированных моделей, обеспечивающих реализацию процесса автоматического морфологического анализа, как одного из важных этапов комплексного анализа текста на естественном языке. <...> Практическим результатом данной работы является программная система, в которой указанные модели реализованы для слов русского языка. <...> ВВЕДЕНИЕ В данной работе рассматриваются основные алгоритмы морфологического анализа текстов, составленных на естественном языке. <...> Задача морфологического анализа возникает в качестве одного из этапов обработки естественноязыковых данных в таких приложениях, как информационно-поисковые системы, машинный перевод, классификация документов. <...> Морфологический анализ — процесс, в ходе которого формы слова, обнаруженные в исходном тексте, ассоциируются с определенным набором грамматических атрибутов, частью речи и основной формой этого слова (т. н. леммой). <...> Морфологический анализ не учитывает контекст и значение слова, поэтому на дано этапе некоторые разновидности неоднозначностей (например, омонимию) разрешить нельзя. <...> Данная работа основана на материалах разработки компьютерной системы морфологического анализа русских слов. <...> Рассматриваются ключевые алгоритмы, составляющие основу информационной модели морфологического анализа. <...> При описании алгоритмов применяется псевдокод, сопровождаемый текстовыми комментариями. <...> РЕАЛИЗАЦИЯ КОНЕЧНЫХ АВТОМАТОВ Конечные автоматы представляют собой основную структуру данных, применяемую в процессе анализа [2]. <...> Конечный автомат может быть представлен в виде ориентированного графа, вершинами которого являются элементы некоторого конечного множества состояний, а дуги имеют символьные метки и соответствуют © Седунов А. А., 2007 переходу из одного <...>