- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Check
Subject: Re: Чем дальше, тем хуже.

Максим  тут дело не столько в скорости выдачи а в скорости индексации датапарк 
даже если проиндексируют ~10 млн документов то он не сможе держать этот индекс 
up-to-date.
Размышлизы:
Заглянул в статистику по трафику акка где стоит датапар и аспик результаты 
следуйщие за 24 часа индексации и там и там в 20 нитей.
Датапарк при пустой базе(вернее до 100 000 документов) 3.50gb
База около 300 000 документов 1.62gb
Аспсик:
Колеблется от 16 до 20гб(это в самом начале) за последний день указано - 
16.27gb.
Скорость индексации заметно лучше не только по результатам ./indexer -S но и по 
трафику.
Если за аспсик взяться то можно из него сделать non-SQL поисковый механизм чем 
я сейчас в принципе то и занимаюсь, надо пофиксить некоторые баги с 
определением урлов в нём и можно браться за кластер, вещь по моему мнению 
стоящая, я её даже могу сравнить с nutch'ем, но увы нету кластера.
Более подробную инфу о сравнение на 3 разных машинах с кластерами и без с 
диаграммами построю чуть позже, сейчас нету времени.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://dataparksearch.org/cgi-bin/simpleforum.cgi?fid=04;topic_id=1151147175;page=2

Reply via email to