Re: site search engine
On Wed, Mar 28, 2012 at 11:47:47AM +0600, Stanislav Vlasov wrote: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. Custom Search Engine - http://www.google.ru/cse/ И накойхер он нужен в локалке без инета? Это конечно все должны были угадать, ага То есть, указание на то, что поисковик искался для стабильного дебиана не означает, что надо ставить из дистрибутива? Нет. И что локалка без инета - тоже, есличо. -- WBR, wRAR signature.asc Description: Digital signature
Re: site search engine
Hello! Поисковых движков немало, вот еще один: http://sqlite.mobigroup.ru/wiki?name=poisk Имеющиеся в наличии меня не устроили прожорливостью (во время индексирования жрут ОЗУ и, вдобавок, диск дрючат просто-таки, хотя можно написать фильтры документов, не требующие ни того, ни того), хреновой архитектурой (очень оно надо - через DBUS коннектиться к поисковику!), необходимостью врапперов для использования из программ (предпочитаю легкие и быстрые утилиты, которые и в шелле можно использовать, и из любого языка программирования) и т.д. В общем, оказалось проще сделать стемминг и набор фильтров документов и воспользоваться FTS в SQLite (в постгресе тоже FTS есть, но ох кривой... для поиска мало индекса, дергаются записи из таблицы, так что тормозит неслабо, плюс разве что в наличии стеммеров, которые и самому несложно добавить). Для поддержки кодировок достаточно соответствующих скриптов преобразования в plain text. Можно их взять из вышеназванного поисковика - при его написании как раз была задача распознавать и индексировать документы разных форматов в разных кодировках, в т.ч. в архивах. P.S. Рассылку читаю через веб, так что сообщения, адресованные мне, дублируйте в личку. -- Best regards, Alexey Pechnikov. http://pechnikov.tel/
Re: site search engine
26 марта 2012 г. 11:06 пользователь Stanislav Vlasov stanislav@gmail.com написал: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. Custom Search Engine - http://www.google.ru/cse/
Re: site search engine
26 марта 2012 г. 11:06 пользователь Stanislav Vlasov stanislav@gmail.com написал: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. до кучи http://sphinxsearch.com/
Re: site search engine
28 марта 2012 г. 10:37 пользователь Aleksandr Sytar sytar.a...@gmail.com написал: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. Custom Search Engine - http://www.google.ru/cse/ И накойхер он нужен в локалке без инета? -- Stanislav
Re: site search engine
28 марта 2012 г. 10:42 пользователь Dmitry A. Zhiglov dmitry.zhig...@gmail.com написал: 26 марта 2012 г. 11:06 пользователь Stanislav Vlasov stanislav@gmail.com написал: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. до кучи http://sphinxsearch.com/ Хм... Судя по наличию отдельного форума на русском, должен соответствовать :-) Спасибо, что обратили внимание. А то в стабильном дебиане оно несколько не той версии, чтобы имело смысл смотреть. -- Stanislav
Re: site search engine
28 марта 2012 г. 8:43 пользователь Stanislav Vlasov stanislav@gmail.com написал: 28 марта 2012 г. 10:37 пользователь Aleksandr Sytar sytar.a...@gmail.com написал: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. Custom Search Engine - http://www.google.ru/cse/ И накойхер он нужен в локалке без инета? Это конечно все должны были угадать, ага
Re: site search engine
28 марта 2012 г. 11:42 пользователь Aleksandr Sytar sytar.a...@gmail.com написал: 28 марта 2012 г. 8:43 пользователь Stanislav Vlasov stanislav@gmail.com написал: 28 марта 2012 г. 10:37 пользователь Aleksandr Sytar sytar.a...@gmail.com написал: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. Custom Search Engine - http://www.google.ru/cse/ И накойхер он нужен в локалке без инета? Это конечно все должны были угадать, ага То есть, указание на то, что поисковик искался для стабильного дебиана не означает, что надо ставить из дистрибутива? -- Stanislav
site search engine
Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. -- Stanislav
Re: site search engine
On 2012.03.26 at 13:06:47 +0600, Stanislav Vlasov wrote: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. Когда я тут недавно на вики-движки смотрел, обнаружил что они в основном для этой цели употребляют xapian. Русский stemming там в каком-то виде есть. Подробной оценки качества не делал. Еще, насколько я знаю, популярна lucene. -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20120326072030.ga7...@wagner.pp.ru
Re: site search engine
26 марта 2012 г. 13:20 пользователь Victor Wagner vi...@wagner.pp.ru написал: Есть сайт с html-документацией. Надо прикрутить к нему поиск. Какой поиск лучше брать в стабильном дебиане? Раньше пользовал mnogosearch, но в squeeze он отсутствует. Когда я тут недавно на вики-движки смотрел, обнаружил что они в основном для этой цели употребляют xapian. Русский stemming там в каком-то виде есть. Подробной оценки качества не делал. Еще, насколько я знаю, популярна lucene. А что-нибудь про поддержку N кодировок одного языка? Ибо часть документации в cp1251, часть в koi8-r, остальное - utf-8. -- Stanislav
Re: site search engine
On 2012.03.26 at 14:24:16 +0600, Stanislav Vlasov wrote: Когда я тут недавно на вики-движки смотрел, обнаружил что они в основном для этой цели употребляют xapian. Русский stemming там в каком-то виде есть. Подробной оценки качества не делал. Еще, насколько я знаю, популярна lucene. А что-нибудь про поддержку N кодировок одного языка? Ибо часть документации в cp1251, часть в koi8-r, остальное - utf-8. Не знаю. Для wiki это неактуально. Там проще сразу все в utf-8 делать. Ну а для статики вопрос решается простейшей скриптовой оберткой вокруг индексатора. Есть ли она уже готовая - не изучал. -- Stanislav -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20120326093854.ga10...@wagner.pp.ru