Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 635050)
Контекстум
Руконтекст антиплагиат система
Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация  / №3 2015

ПОСТРОЕНИЕ ЛЕКСИКО-ТИПОЛОГИЧЕСКОЙ АНКЕТЫ С ПОМОЩЬЮ МОДЕЛЕЙ ДИСТРИБУТИВНОЙ СЕМАНТИКИ (90,00 руб.)

0   0
Первый авторРыжова
Страниц6
ID508418
Аннотациястатья посвящена разработке алгоритма автоматического построения анкеты для типо логического исследования признаковой лексики. Предлагаемый метод включает несколько этапов: сбор списка существительных, с которыми сочетается изучаемое прилагательное; создание векторов соче таемости для каждого полученного словосочетания; кластеризация векторного пространства; извле чение из каждого кластера трех ядерных элементов. Достаточно высокое качество работы алгоритма показывает, что задача автоматизации такого рода исследовательских процессов выполнима, и описан ный в статье метод – одно из возможных ее решений
УДК81’37
Рыжова, Д.А. ПОСТРОЕНИЕ ЛЕКСИКО-ТИПОЛОГИЧЕСКОЙ АНКЕТЫ С ПОМОЩЬЮ МОДЕЛЕЙ ДИСТРИБУТИВНОЙ СЕМАНТИКИ / Д.А. Рыжова // Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация .— 2015 .— №3 .— С. 127-132 .— URL: https://rucont.ru/efd/508418 (дата обращения: 07.05.2024)

Предпросмотр (выдержки из произведения)

CОПОСТАВИТЕЛЬНЫЕ ИССЛЕДОВАНИЯ УДК 81’37 ПОСТРОЕНИЕ ЛЕКСИКО-ТИПОЛОГИЧЕСКОЙ АНКЕТЫ С ПОМОЩЬЮ МОДЕЛЕЙ ДИСТРИБУТИВНОЙ СЕМАНТИКИ Д. А. <...> Рыжова Национальный исследовательский университет «Высшая школа экономики» Поступила в редакцию 20 апреля 2015 г. Аннотация: статья посвящена разработке алгоритма автоматического построения анкеты для типологического исследования признаковой лексики. <...> Предлагаемый метод включает несколько этапов: сбор списка существительных, с которыми сочетается изучаемое прилагательное; создание векторов сочетаемости для каждого полученного словосочетания; кластеризация векторного пространства; извлечение из каждого кластера трех ядерных элементов. <...> Достаточно высокое качество работы алгоритма показывает, что задача автоматизации такого рода исследовательских процессов выполнима, и описанный в статье метод – одно из возможных ее решений. <...> Исследования в области лексической типологии всегда трудоемки. <...> Информацию о значениях слов нельзя почерпнуть из грамматик, а словари в большинстве случаев неполны и недостаточно точны (особенно это касается «экзотических» языков, которые, конечно, представляют большой интерес для типологов). <...> Еще меньше можно рассчитывать на корпуса: несмотря на бурное развитие корпусной лингвистики в последние годы, коллекции размеченных текстов достаточного объема (а для анализа лексики нужны значительно более крупные корпуса, чем для грамматических исследований) существуют лишь для очень ограниченного количества языков, преимущественно крупных европейских. <...> Наиболее эффективный метод сбора информации в такой ситуации – анкетирование носителей. <...> Именно на этот метод опирается группа Института имени Макса Планка в Неймегене, чей подход к лексической © Рыжова Д. А., 2015 126 типологии в настоящее время является наиболее популярным. <...> Свои анкеты приверженцы этого подхода строят на основе экстралингвистических стимулов: глаголы разрушения объекта <...>