Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 635050)
Контекстум
Руконтекст антиплагиат система
Актуальные проблемы современной науки  / №4 (89) 2016

МОДЕЛИРОВАНИЕ ПОИСКОВОГО ОБРАЗА ДОКУМЕНТА (100,00 руб.)

0   0
Первый авторЛяшко
АвторыПортнов Е.М., Фалкова А.В.
Страниц3
ID454645
АннотацияВ формализованном виде модель поискового образа документа можно представить в виде кортежа Mип = {D,Q, Fd, Fq, ηdq }, (1) где D – используемые типы документов; Q- используемые типы, определяющие запросы пользователей; Fd - модель описания документов; Fq - модель описания запроса пользователей; ηdq – функция, определяющая важность документа .
Ляшко, К.Ю. МОДЕЛИРОВАНИЕ ПОИСКОВОГО ОБРАЗА ДОКУМЕНТА / К.Ю. Ляшко, Е.М. Портнов, А.В. Фалкова // Актуальные проблемы современной науки .— 2016 .— №4 (89) .— С. 211-213 .— URL: https://rucont.ru/efd/454645 (дата обращения: 06.05.2024)

Предпросмотр (выдержки из произведения)

(Национальный МОДЕЛИРОВАНИЕ ПОИСКОВОГО ОБРАЗА ДОКУМЕНТА кортежа: В формализованном виде модель поискового образа документа можно представить в виде Mип = {D,Q, Fd, Fq, ηdq }, (1) <...> где D – используемые типы документов; Q- используемые типы, определяющие запросы пользователей; Fd - модель описания документов; Fq - модель описания запроса пользователей; ηdq – функция, определяющая важность документа . <...> В формализованном виде задача создания поискового образа документа состоит: – в выделении в документе di подмножества Nterms термов termj и определение для них частоту встречаемости в тексте документа di ; – в создании семантической сети (, ), вершин; G ребр – нечеткое множество ребер; верш ребр Ограничениями модели являются:NN termj пороговая величина веса j terms N const G const→→ ; w , имеющая термы termj . , t j terms верш f >1∀∈ . t j term Nterms j j (2) На первой стадии процесса индексирования осуществляется процесс лексического анализа текста. <...> Лексическим анализатором выдается следующая информация: поток основ слов L={li, i=1,…k, k- общее количество лексем в потоке} векторов лексем l, множество LS={ ls i i=1,… <...> Вектор ls стические характеристики лексемы li и множество LV={ lv i динамические характеристики лексем, которые зависят от контекста поиска. <...> Вектор ls i отображается в виде следующего кортежа: ,, , , ls ii i i i где ni – является уникальным идентификатором вектора ls Вектор lv = nl f m pi , (3) i , fi – частота встречаемости лексемы; mi – тип лексем; pi- указатель на группу векторов, которые описывают динамические параметры лексемы. ские параметры лексемы: i включает характеристики, которые отражают синтаксические и морфологичеlv iiv ,, , i i = pn c ai , (4) 213 i , i=1,…k} векторов, описывающих , включает стати– в определении множества N термов termj документа di , являющихся ключевыми. terms⊂∈N при jjj , j terms terms <...>