- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Oleg Subject: Re: Поддержка морфологии в indexer.conf
Включил query log в мускуле чтоб посмотреть как работает datapark. 1. Для каждого слова генерируются словоформы. Допустим задается AND поиск по двум словам у которых соответсвенно N и М словоформ 2. результаты N select-ов для каждой словоформы первого слова обединяются в памяти. 3. то же самое для второго слова 4. результаты AND-уются, ранжируются, извлекаются документы с к по (к+1)*docs_per_page. Что если словоформ Много ? насколько быстро ОR-уются в памяти результаты шага 2 ? каждый селект из шага 2 содержит ORDER BY url_id,intag. Это накладно, если предположить что результат обьединения тоже сортируются в памяти. select для словоформ которых нет в документах возвращает empty set и работает быстро. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1161599604
