> > Для комбинаций из трех слов, сначало формируется две пары
> > (WordID1,WordID2), (WordID2,WordID3)
> > потом этим парам назначается идентификатор pairID1, pairID2
>
> Они ж вроде уже должны быть сформированы и назначены уже? Это же
> добавление к _уже_имеющейся_паре_ (word2, word3) слова word1 слева, am
> I right? Или ты для троек слов всё с нуля генеришь?

Комбинация для трех слов - формируется из двух комбинации для двух.

> > эти идентификаторы объединяются в новую пару - (pairID1,pairID2)
> > и она снова добавляется в индекс. Если добавилась, значит пара
> > уникальная - и ей присваивается индекс pairID3. Если не добавилась -
> > значит такая комбинация из трех слов уже была и берется существующий
> > индекс.
>
> Что-то тут я уже потерялся. Горючее (кофе) кончилося. Идентификаторы
> пары слов и пары пар как-нибудь различаются? Хотя... Зачем их
> различать-то... Не, кофе куплю - продолжу.

Идентификаторы пары и отдельного слова ничем не различаются -
назначаются одним генератором.

Я просто решил, что комбинация ((WordID1,WordID2),WordID3) не так
полезна, как (((WordID1,WordID2),(WordID2,WordID3))

> А пока кофе нету - ОВСФ: зачем? Есть первичное создание индекса. Есть
> добавление единичного документа. Со вторым, я так думаю, у тебя
> проблем уже не будет. А первое нужно не каждый день.

Да это я так ... очень сильно увлекся ... захотел поиграть в серверо-
писателей.

О потраченном времени ни капли не жалею  :)

Коваленко Дмитрий.

Ответить