On 3 июл, 13:42, Kovalenko Dmitry <[EMAIL PROTECTED]> wrote: > Нет не правильно. Точнее правильно, но не совсем.
> Для пар слов - так оно и есть. > Для комбинаций из трех слов, сначало формируется две пары > (WordID1,WordID2), (WordID2,WordID3) > потом этим парам назначается идентификатор pairID1, pairID2 Они ж вроде уже должны быть сформированы и назначены уже? Это же добавление к _уже_имеющейся_паре_ (word2, word3) слова word1 слева, am I right? Или ты для троек слов всё с нуля генеришь? > эти идентификаторы объединяются в новую пару - (pairID1,pairID2) > и она снова добавляется в индекс. Если добавилась, значит пара > уникальная - и ей присваивается индекс pairID3. Если не добавилась - > значит такая комбинация из трех слов уже была и берется существующий > индекс. Что-то тут я уже потерялся. Горючее (кофе) кончилося. Идентификаторы пары слов и пары пар как-нибудь различаются? Хотя... Зачем их различать-то... Не, кофе куплю - продолжу. > Конечно, эту последовательность можно свести к сортировке. Но тогда > потребуется два прохода по всем объектам. А этого хочется избежать. > Реально, конечно, можно вообще забить на тот клиентский индекс, > который я хочу построить - просто регистрировать пары в базе и не > парится. К этому, кажется все и идет :) ... "детей не люблю, но сам > процесс ..." > > Или задача именно поддерживать индекс отсортированным в процессе > > генерации пар? > Ага. А пока кофе нету - ОВСФ: зачем? Есть первичное создание индекса. Есть добавление единичного документа. Со вторым, я так думаю, у тебя проблем уже не будет. А первое нужно не каждый день. В общем, моё ИМХО на фоне недостатка кофеина - сделать отдельно высокооборотистый движок и отдельно с большим крутящим моментом. :-)

