Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634558)
Контекстум
.
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии  / №1 2011

МОДЕЛЬ IP-СИСТЕМЫ МАШИННОГО ПЕРЕВОДА ТЕКСТА НА БАЗЕ ЧАСТОТНОГО ВЗВЕШИВАНИЯ ТЕРМОВ И СКРЫТОЙ МАРКОВСКОЙ ЦЕПИ (90,00 руб.)

0   0
Первый авторПолянский
Страниц5
ID519958
АннотацияРассмотрен новый подход машинного перевода – IP-перевод, использующий поисковые системы сети Интернет. Предложены алгоритмы частотного взвешивания термов для генерации релевантных текстов на целевом языке. Модифицирована структура скрытой Марковской цепи применительно к задачам машинного IP-перевода.
УДК004.912
Полянский, К.В. МОДЕЛЬ IP-СИСТЕМЫ МАШИННОГО ПЕРЕВОДА ТЕКСТА НА БАЗЕ ЧАСТОТНОГО ВЗВЕШИВАНИЯ ТЕРМОВ И СКРЫТОЙ МАРКОВСКОЙ ЦЕПИ / К.В. Полянский // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2011 .— №1 .— С. 194-198 .— URL: https://rucont.ru/efd/519958 (дата обращения: 18.04.2024)

Предпросмотр (выдержки из произведения)

Рассмотрен новый подход машинного перевода – IP-перевод, использующий поисковые системы сети Интернет. <...> Предложены алгоритмы частотного взвешивания термов для генерации релевантных текстов на целевом языке. <...> Ключевые слова: машинный перевод, частотное взвешивание, скрытая Марковская цепь, обработка текстов. <...> К ним можно отнести достижения в системах искусственного интеллекта (СИИ), а также стремительное развитие информационнопоисковых систем (ИПС). <...> Другой класс систем образуют ТМ-системы (системы машинного перевода, использующие память перевода). <...> Под памятью перевода в таких системах обычно понимают хранящиеся в базе данных (БД) цепочки ранее осуществленных переводов, на основе которых строится вывод предложений целевого языка (ЦЯ). <...> Данная статья рассматривает идею об использовании в ТМ-системах сети Интернет в качестве памяти перевода, так как именно Интернет на сегодняшний день является самым обширным электронным источником лингвистической информации. <...> И именно поэтому стремительное развитие ИПС, способных к обработке такой информации, может повлиять как на развитие ТМ-систем в целом, так и на развтие © Полянский К. В., 2011 IP-систем в частности. IP-системами машинного перевода назовем разновидность ТМ-систем, использующих для перевода ИПС сети Интернет. <...> На основе этих термов будет сгенерирован и отправлен запрос к ИПС для получения коллекции релевантных документов на ЦЯ. <...> Если в классических МТ-системах на стадии поиска цепочек перевода происходит обращение к БД, то IP-СМП обращается за информацией к ИПС сети Интернет. <...> Процедура взвешивания термов позволяет выделить семантически наиболее значимые для данного текста термы и является частотной, так как присваивание весов для термов осуществляется на основе частоты их встречаемости. <...> Существует несколько алгоритмов для вычисления локального веса терма. <...> Самыми простыми являются булево взвешивание (b-взвешивание) и взвешивание по частоте <...>