Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 610280)
Контекстум
0   0
Первый авторГаршина
АвторыБогоявленская Ю.А.
Страниц9
ID520896
АннотацияРазработка лингвистических парсеров является актуальной задачей современности. В статье собрана общая информация о парсерах, рассмотрены существующие аналоги и представлено собственное решение для русского языка
УДК004.912
Гаршина, В.В. РАЗРАБОТКА ЛИНГВИСТИЧЕСКОГО ПАРСЕРА РУССКОГО ЯЗЫКА / В.В. Гаршина, Ю.А. Богоявленская // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2012 .— №2 .— С. 173-181 .— URL: https://rucont.ru/efd/520896 (дата обращения: 04.04.2025)

Предпросмотр (выдержки из произведения)

Ключевые слова: компьютерная лингвистика, лингвистические парсеры, морфологический анализ, синтаксический анализ, семантический анализ. <...> ВВЕДЕНИЕ В компьютерной лингвистике существует много прикладных задач, которые используют результаты работы специального класса программ – лингвистических парсеров. <...> К таким задачам можно отнести: анализ/синтез предложения на естественном языке (ЕЯ) с целью формирования/распознавания запроса на искусственном языке (SQL, SPARQL, поисковые запросы и др.), преобразование предложения с одного ЕЯ на другой ЕЯ (системы машинного перевода), задачи семантического анализа текстов – TextMining, семантическая классификация текстовых ресурсов и др. <...> Лингвистический парсер – комплекс программных модулей, обеспечивающий разбор линейной последовательности лексем (слов) языка исходного текста во внутреннее представление смысла этого предложения. <...> При этом используется многоуровневый анализ предложения на ЕЯ, реализующий морфологический, синтаксический, семантический (иногда и прагматический) языковой уровень. <...> Морфологический анализатор, используя морфологические словари, строит разбор последовательности входящих в анализируемое © Гаршина В. В., Богоявленская Ю. А., 2012 174 ВЕСТНИК ВГУ, СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, 2012, № 2 предложение слов с указанием части речи и морфологических характеристик. <...> Синтаксичекий анализатор реализует построение дерева зависимостей, в узлах которого стоят слова данного предложения с указанием части речи и грамматических характеристик, а дуги соответствуют специфичным для данного естественного языка отношениям подчинения. <...> Семантический анализатор также часто использует дерево зависимостей, но в его узлах стоят либо предметные имена, либо слова универсального семантического языка (например, имена таблиц, в которых сосредоточены сведения о данной предметной области, атрибуты таблиц, операторные символы). <...> Известным <...>