(Национальный МОДЕЛИРОВАНИЕ ПОИСКОВОГО ОБРАЗА ДОКУМЕНТА кортежа: В формализованном виде модель поискового образа документа можно представить в виде Mип = {D,Q, Fd, Fq, ηdq }, (1) <...> где D – используемые типы документов; Q- используемые типы, определяющие запросы пользователей; Fd - модель описания документов; Fq - модель описания запроса пользователей; ηdq – функция, определяющая важность документа . <...> В формализованном виде задача создания поискового образа документа состоит: – в выделении в документе di подмножества Nterms термов termj и определение для них частоту встречаемости в тексте документа di ; – в создании семантической сети (, ), вершин; G ребр – нечеткое множество ребер; верш ребр Ограничениями модели являются:NN termj пороговая величина веса j terms N const G const→→ ; w , имеющая термы termj . , t j terms верш f >1∀∈ . t j term Nterms j j (2) На первой стадии процесса индексирования осуществляется процесс лексического анализа текста. <...> Лексическим анализатором выдается следующая информация: поток основ слов L={li, i=1,…k, k- общее количество лексем в потоке} векторов лексем l, множество LS={ ls i i=1,… <...> Вектор ls стические характеристики лексемы li и множество LV={ lv i динамические характеристики лексем, которые зависят от контекста поиска. <...> Вектор ls i отображается в виде следующего кортежа: ,, , , ls ii i i i где ni – является уникальным идентификатором вектора ls Вектор lv = nl f m pi , (3) i , fi – частота встречаемости лексемы; mi – тип лексем; pi- указатель на группу векторов, которые описывают динамические параметры лексемы. ские параметры лексемы: i включает характеристики, которые отражают синтаксические и морфологичеlv iiv ,, , i i = pn c ai , (4) 213 i , i=1,…k} векторов, описывающих , включает стати– в определении множества N термов termj документа di , являющихся ключевыми. terms⊂∈N при jjj , j terms terms <...>