- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Roman
Subject: Ранг

Максим, а может стоит переделать ранжеровку в dps вот посмотрел на яндекс:
http://company.yandex.ru/articles/romip2004.xml
и гугал оказавается это детка lucene ^))))))
Ранг q документа d определяется следующим образом: 

score(q,d) = sum( tf(t in d) * idf(t) * getBoost(t.field in d) * 
lengthNorm(t.field in d) ) * coord(q,d) * queryNorm(q) 

tf(t in d) - Zend_Search_Lucene_Search_Similarity::tf($freq) - коэффициент 
ранга, основанный на том, насколько часто встречается элемент или фраза в 
документе. 

idf(t) - Zend_Search_Lucene_Search_SimilaritySimilarity::tf($term, $reader) - 
коэффициент ранга для простого элемента применительно к определенному индексу. 

getBoost(t.field in d) - коэффициент усиления для поля элемента. 

lengthNorm($term) - значение нормализации для поля, получаемое из общего 
количества элементов, содержащихся в поле. Это значение хранится внутри 
индекса. Эти значения вместе с коэффициентом усиления поля хранятся в индексе, 
результатом их умножения является ранг для каждого поля. 

Может стоит изменить расчёт ранжировки, а то он очень много времени занимает?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;post=

Reply via email to