Аспирант и соискатель, № 6, 2010 Табарча А.И., аспирант СанктПетербургского государственного университета информационных технологий, механики и оптики ПОИСК МОРФОЛОГИЧЕСКИХ ШАБЛОНОВ ДЛЯ УСТОЙЧИВЫХ СЛОВОСОЧЕТАНИЙ ПРОИЗВОЛЬНОЙ ДЛИНЫ Введение Задача автоматического выделения устойчивых словосочетаний из текста возникает при решении многих прикладных задач автоматической обработки текстов, таких как индексирование и рубрикация документов, создание терминологических словарей и тезаурусов [1]. <...> Существует множество методов и подходов автоматического извлечения устойчивых словосочетаний из текста. <...> Наиболее универсальными считаются статистические методы ввиду использования минимума лингвистических ресурсов, они же являются и наименее точными [2]. <...> Для повышения точности используются различные модификации с привлечением лингвистических знаний. <...> Из рассмотренных методов автоматического извлечения устойчивых словосочетаний, основывающихся на статистике встречаемости и минимальных лингвистических данных, наилучшие результаты показывают методы, применяющие в дополнение к статистике встречаемости, морфологические шаблоны. <...> Правда, такие исследования проводились лишь для двухсловных словосочетаний [3]. <...> В рассмотренных работах по извлечению устойчивых словосочетаний произвольной длины[4] не использовались морфологические шаблоны. <...> И, как отметили сами исследователи, применение морфологических шаблонов могло бы повысить точность. <...> Постановка задачи В данной работе предлагается провести анализ устойчивых словосочетаний произвольной длины, с целью выявления морфологических шаблонов для них. <...> В качестве источника данных предлагается использование словосочетаний из заголовков статей словарей и энциклопедий. <...> Для достижения цели предлагается провести морфологический анализ словосочетаний и собрать статистику наиболее употребительных морфологических шаблонов. <...> Основная часть Как уже <...>