CОПОСТАВИТЕЛЬНЫЕ ИССЛЕДОВАНИЯ УДК 81’37 ПОСТРОЕНИЕ ЛЕКСИКО-ТИПОЛОГИЧЕСКОЙ АНКЕТЫ С ПОМОЩЬЮ МОДЕЛЕЙ ДИСТРИБУТИВНОЙ СЕМАНТИКИ Д. А. <...> Рыжова Национальный исследовательский университет «Высшая школа экономики» Поступила в редакцию 20 апреля 2015 г. Аннотация: статья посвящена разработке алгоритма автоматического построения анкеты для типологического исследования признаковой лексики. <...> Предлагаемый метод включает несколько этапов: сбор списка существительных, с которыми сочетается изучаемое прилагательное; создание векторов сочетаемости для каждого полученного словосочетания; кластеризация векторного пространства; извлечение из каждого кластера трех ядерных элементов. <...> Достаточно высокое качество работы алгоритма показывает, что задача автоматизации такого рода исследовательских процессов выполнима, и описанный в статье метод – одно из возможных ее решений. <...> Исследования в области лексической типологии всегда трудоемки. <...> Информацию о значениях слов нельзя почерпнуть из грамматик, а словари в большинстве случаев неполны и недостаточно точны (особенно это касается «экзотических» языков, которые, конечно, представляют большой интерес для типологов). <...> Еще меньше можно рассчитывать на корпуса: несмотря на бурное развитие корпусной лингвистики в последние годы, коллекции размеченных текстов достаточного объема (а для анализа лексики нужны значительно более крупные корпуса, чем для грамматических исследований) существуют лишь для очень ограниченного количества языков, преимущественно крупных европейских. <...> Наиболее эффективный метод сбора информации в такой ситуации – анкетирование носителей. <...> Именно на этот метод опирается группа Института имени Макса Планка в Неймегене, чей подход к лексической © Рыжова Д. А., 2015 126 типологии в настоящее время является наиболее популярным. <...> Свои анкеты приверженцы этого подхода строят на основе экстралингвистических стимулов: глаголы разрушения объекта <...>