Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 610204)
Контекстум
0   0
Первый авторВоронина
АвторыКретов А.А., Титова О.С.
Страниц12
ID519685
АннотацияРассматривается задача создания программного комплекса для получения семантически близких слов на базе алгоритма Е. Л. Гинзбурга. Представлены возможности и структура программного комплекса
УДК001.103:002
Воронина, И.Е. ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ / И.Е. Воронина, А.А. Кретов, О.С. Титова // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2008 .— №2 .— С. 109-120 .— URL: https://rucont.ru/efd/519685 (дата обращения: 16.04.2025)

Предпросмотр (выдержки из произведения)

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА УДК 001.103:002 ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ И. Е. <...> Воронина, А. А. Кретов, О. С. Титова Воронежский государственный университет ЗАО НПП РЕЛЭКС Поступила в редакцию 12.04.2008 г. Аннотация. <...> Рассматривается задача создания программного комплекса для получения семантически близких слов на базе алгоритма Е. Л. Гинзбурга. <...> Ключевые слова: автоматическая обработка текста, семантический анализ, алгоритм Е. Л. Гинзбурга Abstract. <...> Задачи обработки текстов возникли практически сразу после появления вычислительной техники. <...> Однако, несмотря на более чем полувековую историю исследований в области искусственного интеллекта, удовлетворительного решения большинства практических задач обработки текста пока нет. <...> Естественный язык (ЕЯ) — сверхсложная семиотическая система, состоящая из неограниченного числа подсистем, каждая из которых конечна, а потому формализуема, при этом сам язык — незамкнутая система, которая не может быть формализована до конца [1]. <...> Семантический анализ — наиболее трудоемкая, тяжело поддающаяся формализации часть исследований по формализа© Воронина И. Е., Кретов А. А., Титова О. С., 2008 ции ЕЯ: проблема кореферентности, снятия неоднозначности, формальная структура текста выходят за рамки предложения [1]. <...> На этапе семантической обработки текста происходит выявление смысла предложения или его отдельных частей. <...> Тезаурус задает набор бинарных отношений на множестве слов естественного языка (например, омонимия, синонимия, антонимия и т.д.) <...> . Для русского языка работа по созданию тезауруса еще не завершена, хотя имеются коммерческие продукты, включающие в себя тезаурус подмножества русского языка, а также отдельные словари синонимов и антонимов для подмножества русского языка. <...> В качестве базы также применима статистическая обработка данных, позволяющая решать практически важные задачи, среди которых выделение ключевых <...>