- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Check Subject: Re: Чем дальше, тем хуже.
Максим тут дело не столько в скорости выдачи а в скорости индексации датапарк даже если проиндексируют ~10 млн документов то он не сможе держать этот индекс up-to-date. Размышлизы: Заглянул в статистику по трафику акка где стоит датапар и аспик результаты следуйщие за 24 часа индексации и там и там в 20 нитей. Датапарк при пустой базе(вернее до 100 000 документов) 3.50gb База около 300 000 документов 1.62gb Аспсик: Колеблется от 16 до 20гб(это в самом начале) за последний день указано - 16.27gb. Скорость индексации заметно лучше не только по результатам ./indexer -S но и по трафику. Если за аспсик взяться то можно из него сделать non-SQL поисковый механизм чем я сейчас в принципе то и занимаюсь, надо пофиксить некоторые баги с определением урлов в нём и можно браться за кластер, вещь по моему мнению стоящая, я её даже могу сравнить с nutch'ем, но увы нету кластера. Более подробную инфу о сравнение на 3 разных машинах с кластерами и без с диаграммами построю чуть позже, сейчас нету времени. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://dataparksearch.org/cgi-bin/simpleforum.cgi?fid=04;topic_id=1151147175;page=2
