Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 616307)
Контекстум
Лесной вестник. Forestry Bulletin  / №6 2015

АЛГОРИТМЫ ПОИСКА, ИСПОЛЬЗУЕМЫЕ В LUCENE.NET (200,00 руб.)

0   0
Первый авторЖердева
Страниц6
ID416975
АннотацияВ статье рассмотрены модели поиска, положенные в основу работы Lucene.Net, и описаны особенности ранжирования документов. Одной из важнейших становится задача поиска по содержимому за конечное время в большом объеме документов. Традиционные системы поиска, как правило, ориентируются на работу со структурированными текстовыми данными и мало приспособлены для обработки мультимедийной и неструктурированной информации. Тогда возникает проблема поиска и выборки необходимой информации из большого неструктурированного массива. Одним из факторов, стимулирующих развитие технологий поиска, является появление огромного количества электронных библиотек, содержащих значительные объемы актуальных знаний. В связи с тем, что выбор алгоритма поиска зависит от особенностей проекта, необходима разработка более совершенных методов, берущих за основу приведенные модели и обеспечивающих высокую релевантность найденных документов по исковому запросу пользователя за возможно более короткие сроки, а также обладающие точно вычисляемым сроком выдачи результата. Требуются особые виды поиска и обработки результата, а также особое количество или формат данных в проекте. В данной статье выделены параметры, которые следует учитывать при выборе поискового механизма. Проанализированы существующие подходы к решению задач поиска и предложено их улучшение, основанное на использовании модификации булевого поиска (метод взвешенного зонного ранжирования). Приведены критерии оценки информационного поиска. Показана концептуальная формула для оценки релевантности поиска Lucene.Net.
Жердева, М.В. АЛГОРИТМЫ ПОИСКА, ИСПОЛЬЗУЕМЫЕ В LUCENE.NET / М.В. Жердева // Лесной вестник. Forestry Bulletin .— 2015 .— №6 .— С. 168-173 .— URL: https://rucont.ru/efd/416975 (дата обращения: 16.07.2025)

Предпросмотр (выдержки из произведения)

42 В статье рассмотрены модели поиска, положенные в основу работы Lucene.Net, и описаны особенности ранжирования документов. <...> Одной из важнейших становится задача поиска по содержимому за конечное время в большом объеме документов. <...> Традиционные системы поиска, как правило, ориентируются на работу со структурированными текстовыми данными и мало приспособлены для обработки мультимедийной и неструктурированной информации. <...> Тогда возникает проблема поиска и выборки необходимой информации из большого неструктурированного массива. <...> Одним из факторов, стимулирующих развитие технологий поиска, является появление огромного количества электронных библиотек, содержащих значительные объемы актуальных знаний. <...> В связи с тем, что выбор алгоритма поиска зависит от особенностей проекта, необходима разработка более совершенных методов, берущих за основу приведенные модели и обеспечивающих высокую релевантность найденных документов по исковому запросу пользователя за возможно более короткие сроки, а также обладающие точно вычисляемым сроком выдачи результата. <...> Требуются особые виды поиска и обработки результата, а также особое количество или формат данных в проекте. <...> В данной статье выделены параметры, которые следует учитывать при выборе поискового механизма. <...> Проанализированы существующие подходы к решению задач поиска и предложено их улучшение, основанное на использовании модификации булевого поиска (метод взвешенного зонного ранжирования). <...> Показана концептуальная формула для оценки релевантности поиска Lucene.Net. <...> Ключевые слова: информационный поиск, документ, критерии, релевантность, поисковые системы В настоящее время происходит повсеместный переход предприятий на электронный документооборот. <...> Количество документов, с которыми сотрудник должен работать за день, увеличивается с каждым годом, поэтому особенно важной становится задача поиска по содержимому за конечное время в большом объеме <...>