Я писал подобное ещё на BDE + Paradox. Там получалось ~160 000 слов. Кол.во документов не помню...Примитивная реализация - таблица слов + таблица соответствий документ/слово тормозила не по детски и занимала ~100мб.
Устав мучиться переписал всё на плоский файл. Замапил его в память... И забыл о тормозах. ;-)P.S. Данные там не изменялись конечными пользователями, поэтому вопрос о непротиворечивости не стоял.

