On 3 июл, 13:42, Kovalenko Dmitry <[EMAIL PROTECTED]> wrote:

> Нет не правильно. Точнее правильно, но не совсем.

> Для пар слов - так оно и есть.

> Для комбинаций из трех слов, сначало формируется две пары
> (WordID1,WordID2), (WordID2,WordID3)

> потом этим парам назначается идентификатор pairID1, pairID2
Они ж вроде уже должны быть сформированы и назначены уже? Это же
добавление к _уже_имеющейся_паре_ (word2, word3) слова word1 слева, am
I right? Или ты для троек слов всё с нуля генеришь?

> эти идентификаторы объединяются в новую пару - (pairID1,pairID2)

> и она снова добавляется в индекс. Если добавилась, значит пара
> уникальная - и ей присваивается индекс pairID3. Если не добавилась -
> значит такая комбинация из трех слов уже была и берется существующий
> индекс.
Что-то тут я уже потерялся. Горючее (кофе) кончилося. Идентификаторы
пары слов и пары пар как-нибудь различаются? Хотя... Зачем их
различать-то... Не, кофе куплю - продолжу.


> Конечно, эту последовательность можно свести к сортировке. Но тогда
> потребуется два прохода по всем объектам. А этого хочется избежать.

> Реально, конечно, можно вообще забить на тот клиентский индекс,
> который я хочу построить - просто регистрировать пары в базе и не
> парится. К этому, кажется все и идет :) ... "детей не люблю, но сам
> процесс ..."

> > Или задача именно поддерживать индекс отсортированным в процессе
> > генерации пар?

> Ага.

А пока кофе нету - ОВСФ: зачем? Есть первичное создание индекса. Есть
добавление единичного документа. Со вторым, я так думаю, у тебя
проблем уже не будет. А первое нужно не каждый день.

В общем, моё ИМХО на фоне недостатка кофеина - сделать отдельно
высокооборотистый движок и отдельно с большим крутящим моментом. :-)

Ответить