[DataparkSearch Forum] Re: Поддержка морфологии в indexer.conf

DataparkSearchForum Mon, 23 Oct 2006 14:39:54 -0700

- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Oleg
Subject: Re: Поддержка морфологии в indexer.conf


Включил query log в мускуле чтоб посмотреть как работает datapark.
1. Для каждого слова генерируются словоформы. Допустим задается AND поиск по 
двум словам у которых соответсвенно N и М словоформ
2. результаты N select-ов для каждой словоформы первого слова обединяются в 
памяти.
3. то же самое для второго слова
4. результаты AND-уются, ранжируются, извлекаются документы с к по 
(к+1)*docs_per_page.

Что если словоформ Много ?
насколько быстро ОR-уются в памяти результаты шага 2 ?
каждый селект из шага 2 содержит ORDER BY url_id,intag. Это накладно, если 
предположить что результат обьединения тоже сортируются в памяти.

select для словоформ которых нет в документах возвращает empty set и работает 
быстро. 

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1161599604

[DataparkSearch Forum] Re: Поддержка морфологии в indexer.conf

Reply via email to