> > Для комбинаций из трех слов, сначало формируется две пары > > (WordID1,WordID2), (WordID2,WordID3) > > потом этим парам назначается идентификатор pairID1, pairID2 > > Они ж вроде уже должны быть сформированы и назначены уже? Это же > добавление к _уже_имеющейся_паре_ (word2, word3) слова word1 слева, am > I right? Или ты для троек слов всё с нуля генеришь?
Комбинация для трех слов - формируется из двух комбинации для двух. > > эти идентификаторы объединяются в новую пару - (pairID1,pairID2) > > и она снова добавляется в индекс. Если добавилась, значит пара > > уникальная - и ей присваивается индекс pairID3. Если не добавилась - > > значит такая комбинация из трех слов уже была и берется существующий > > индекс. > > Что-то тут я уже потерялся. Горючее (кофе) кончилося. Идентификаторы > пары слов и пары пар как-нибудь различаются? Хотя... Зачем их > различать-то... Не, кофе куплю - продолжу. Идентификаторы пары и отдельного слова ничем не различаются - назначаются одним генератором. Я просто решил, что комбинация ((WordID1,WordID2),WordID3) не так полезна, как (((WordID1,WordID2),(WordID2,WordID3)) > А пока кофе нету - ОВСФ: зачем? Есть первичное создание индекса. Есть > добавление единичного документа. Со вторым, я так думаю, у тебя > проблем уже не будет. А первое нужно не каждый день. Да это я так ... очень сильно увлекся ... захотел поиграть в серверо- писателей. О потраченном времени ни капли не жалею :) Коваленко Дмитрий.

