Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 638309)
Контекстум
Электро-2024
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии  / №2 2015

МЕТОД СЕМАНТИЧЕСКОЙ КЛАСТЕРИЗАЦИИ ГИПЕРТЕКСТОВОЙ СТРУКТУРЫ С ПРИМЕНЕНИЕМ СТАТИСТИКИ ПЕРЕХОДОВ ПОЛЬЗОВАТЕЛЕЙ ПО ВНУТРЕННИМ ССЫЛКАМ (90,00 руб.)

0   0
Первый авторСалин
АвторыПапшев С.В., Сытник А.А.
Страниц11
ID511523
АннотацияКластеризация веб-документов по различным признакам, включая их семантическую близость, лежит в основе различных современных подходов к поиску и извлечению информации в Интернете. В данной статье предложен метод построения семантических кластеров в гипертекстовой структуре веб-сайта на основе статистики переходов пользователей между узлами. Кластеризация документов по отслеживаемым маршрутам пользователей применяется к графовой модели гипертекстовой структуры веб-сайта Приводятся результаты апробации предложенного подхода на реальных веб-сайтах.
УДК004.942
Салин, В.С. МЕТОД СЕМАНТИЧЕСКОЙ КЛАСТЕРИЗАЦИИ ГИПЕРТЕКСТОВОЙ СТРУКТУРЫ С ПРИМЕНЕНИЕМ СТАТИСТИКИ ПЕРЕХОДОВ ПОЛЬЗОВАТЕЛЕЙ ПО ВНУТРЕННИМ ССЫЛКАМ / В.С. Салин, С.В. Папшев, А.А. Сытник // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2015 .— №2 .— С. 138-148 .— URL: https://rucont.ru/efd/511523 (дата обращения: 10.06.2024)

Предпросмотр (выдержки из произведения)

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА УДК 004.942 МЕТОД СЕМАНТИЧЕСКОЙ КЛАСТЕРИЗАЦИИ ГИПЕРТЕКСТОВОЙ СТРУКТУРЫ С ПРИМЕНЕНИЕМ СТАТИСТИКИ ПЕРЕХОДОВ ПОЛЬЗОВАТЕЛЕЙ ПО ВНУТРЕННИМ ССЫЛКАМ В. С. <...> Кластеризация веб-документов по различным признакам, включая их семантическую близость, лежит в основе различных современных подходов к поиску и извлечению информации в Интернете. <...> В данной статье предложен метод построения семантических кластеров в гипертекстовой структуре веб-сайта на основе статистики переходов пользователей между узлами. <...> Кластеризация документов по отслеживаемым маршрутам пользователей применяется к графовой модели гипертекстовой структуры веб-сайта. <...> ВВЕДЕНИЕ Объемы неструктурированной информации, представленной в Интернете, постоянно возрастают, равно как и общее количество веб-сайтов и объемы их содержимого. <...> Задачи поиска релевантной информации и анализа данных, размещенных на веб-страницах, являются неотъемлемой частью при работе со значительными объемами информации. <...> Важным этапом в таких задачах является кластеризация обрабатываемых документов, которая позволяет выявлять группы семантически похожих документов. <...> © Салин В. С., Папшев С. В., Сытник А. А., 2015 Кластеризация веб-страниц по тематике актуальна в различных приложениях поиска и интеллектуального анализа данных, таких как распознавание шаблонов, извлечение ключевых слов [1]. <...> Группировка семантически связанных страниц лежит в основе рекомендательных алгоритмов и адаптивных интерфейсов, которые могут «подсказывать» пользователю наиболее релевантные для него страницы. <...> Также, определение кластеров близких по теме страниц используется в веб-аналитике и поисковой оптимизации, веб-разработке и реинжиниринге. <...> 138 ВЕСТНИК ВГУ, СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, 2015, № 2 Метод семантической кластеризации гипертекстовой структуры с применением статистики . <...> Обычно кластеризация документов <...>