Фи, батенька, да вы мазохист. Прикрути словарик - у тебя задача проще, тебе явно только для русского языка делать надо. Возьми от опенофиса - он нашару и довольно-таки полный. У нас с дохлым словариком от ispell для русского и румынского языков для 70к документов (примерно 700 метров чистого неформатированного текста) получилось 12 с хвостиком лимонов индексных записей. При использовании влоб - было бы больше. Сейчас новый словарик прикрутим - посмотрим, что получится. Запросы работают шустро, народ слегка в ауе, коммерческая прога, которая делает аналогичные вещи, тормознутее примерно в 60 раз и полнотекстового поиска в ней нету :))
А идея вашей проги такая же как у Димы? Т.е. если идет поиск по фразе, то делается джойн таблицы на себя саму? Или же немного хитрее?
Роман

