А л ф и м ц е в
РАЗВИТИЕ МЕТОДА ОПРЕДЕЛЕНИЯ ВЕСОВ
ДЛЯ ВЗВЕШЕННОГО ЗОННОГО РАНЖИРОВАНИЯ
В ИНФОРМАЦИОННОМ ПОИСКЕ
Информационный поиск на основе взвешенного зонного ранжирования подразумевает присвоение каждой зоне или полю в метаданных
документов весового коэффициента с использованием методов машинного обучения. <...> Рассмотрен метод определения весов, в котором
для вычисления взвешенной зонной релевантности вместо средневзвешенного оператора применен нечеткий интеграл Шоке. <...> Это позволяет учесть при расчетах релевантности возможные взаимозависимости между зонными показателями, что в конечном итоге повысит точность ранжирования. <...> E-mail: sakulin@bmstu.ru
Ключевые слова: информационный поиск, взвешенное зонное ранжирование, машинное обучение, оператор агрегирования, нечеткая мера, нечеткий интеграл Шоке. <...> Поэтому одной
из важных задач информационного поиска является ранжирование
результатов по степени их соответствия запросу. <...> Если при таком ранжировании предполагается использование метаданных документов, то необходимо учитывать экспертные знания о
структуре и особенностях этих метаданных. <...> Здесь под метаданными
понимают поля (например, дата создания документа, вид документа,
стоимость книги и т. п.) и зоны (название, автор, издательство, аннотация, ключевые слова, текст и т. п.) <...> Далее для краткости поля и зоны будем называть
зонами. <...> В работе [1] описан метод определения весов с помощью
машинного обучения на основе обучающих примеров, в котором
каждой отдельной h -й зоне присваивается весовой коэффициент g h . <...> Произвольный текстовый запрос обозначим q, а документ — d . <...> Каждой паре ( q, d ) при взвешенном зонном ранжировании присваивается значение релевантности на единичном отрезке путем вычисления линейной комбинации зонных показателей. <...> В эту комбинацию
каждая зона вносит значение из единичного отрезка. <...> Величина sh может вычисляться по-разному для каждой из зон [1]. <...> Наиболее простой способ ее определения <...>