Re: site search engine

2012-03-28 Пенетрантность Andrey Rahmatullin
On Wed, Mar 28, 2012 at 11:47:47AM +0600, Stanislav Vlasov wrote:
  Есть сайт с html-документацией.
  Надо прикрутить к нему поиск.
  Какой поиск лучше брать в стабильном дебиане?
  Раньше пользовал mnogosearch, но в squeeze он отсутствует.
 
  Custom Search Engine - http://www.google.ru/cse/
 
  И накойхер он нужен в локалке без инета?
 
  Это конечно все должны были угадать, ага
 
 То есть, указание на то, что поисковик искался для стабильного дебиана
 не означает, что надо ставить из дистрибутива?
Нет.
И что локалка без инета - тоже, есличо.

-- 
WBR, wRAR


signature.asc
Description: Digital signature


Re: site search engine

2012-03-27 Пенетрантность Alexey Pechnikov
Hello!

Поисковых движков немало, вот еще один:
http://sqlite.mobigroup.ru/wiki?name=poisk

Имеющиеся в наличии меня не устроили прожорливостью (во время
индексирования жрут ОЗУ и, вдобавок, диск дрючат просто-таки, хотя можно
написать фильтры документов, не требующие ни того, ни того), хреновой
архитектурой (очень оно надо - через DBUS коннектиться к поисковику!),
необходимостью врапперов для использования из программ (предпочитаю легкие
и быстрые утилиты, которые и в шелле можно использовать, и из любого языка
программирования) и т.д. В общем, оказалось проще сделать стемминг и набор
фильтров документов и воспользоваться FTS в SQLite (в постгресе тоже FTS
есть, но ох кривой... для поиска мало индекса, дергаются записи из таблицы,
так что тормозит неслабо, плюс разве что в наличии стеммеров, которые и
самому несложно добавить).

Для поддержки кодировок достаточно соответствующих скриптов преобразования
в plain text. Можно их взять из вышеназванного поисковика - при его
написании как раз была задача распознавать и индексировать документы разных
форматов в разных кодировках, в т.ч. в архивах.


P.S. Рассылку читаю через веб, так что сообщения, адресованные мне,
дублируйте в личку.

-- 
Best regards, Alexey Pechnikov.
http://pechnikov.tel/


Re: site search engine

2012-03-27 Пенетрантность Aleksandr Sytar
26 марта 2012 г. 11:06 пользователь Stanislav Vlasov
stanislav@gmail.com написал:
 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

Custom Search Engine - http://www.google.ru/cse/


Re: site search engine

2012-03-27 Пенетрантность Dmitry A. Zhiglov
26 марта 2012 г. 11:06 пользователь Stanislav Vlasov
stanislav@gmail.com написал:
 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

до кучи
http://sphinxsearch.com/


Re: site search engine

2012-03-27 Пенетрантность Stanislav Vlasov
28 марта 2012 г. 10:37 пользователь Aleksandr Sytar
sytar.a...@gmail.com написал:

 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

 Custom Search Engine - http://www.google.ru/cse/

И накойхер он нужен в локалке без инета?

-- 
Stanislav


Re: site search engine

2012-03-27 Пенетрантность Stanislav Vlasov
28 марта 2012 г. 10:42 пользователь Dmitry A. Zhiglov
dmitry.zhig...@gmail.com написал:
 26 марта 2012 г. 11:06 пользователь Stanislav Vlasov
 stanislav@gmail.com написал:
 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

 до кучи
 http://sphinxsearch.com/

Хм... Судя по наличию отдельного форума на русском, должен соответствовать :-)
Спасибо, что обратили внимание. А то в стабильном дебиане оно
несколько не той версии, чтобы имело смысл смотреть.

-- 
Stanislav


Re: site search engine

2012-03-27 Пенетрантность Aleksandr Sytar
28 марта 2012 г. 8:43 пользователь Stanislav Vlasov
stanislav@gmail.com написал:
 28 марта 2012 г. 10:37 пользователь Aleksandr Sytar
 sytar.a...@gmail.com написал:

 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

 Custom Search Engine - http://www.google.ru/cse/

 И накойхер он нужен в локалке без инета?

Это конечно все должны были угадать, ага


Re: site search engine

2012-03-27 Пенетрантность Stanislav Vlasov
28 марта 2012 г. 11:42 пользователь Aleksandr Sytar
sytar.a...@gmail.com написал:
 28 марта 2012 г. 8:43 пользователь Stanislav Vlasov
 stanislav@gmail.com написал:
 28 марта 2012 г. 10:37 пользователь Aleksandr Sytar
 sytar.a...@gmail.com написал:

 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

 Custom Search Engine - http://www.google.ru/cse/

 И накойхер он нужен в локалке без инета?

 Это конечно все должны были угадать, ага

То есть, указание на то, что поисковик искался для стабильного дебиана
не означает, что надо ставить из дистрибутива?

-- 
Stanislav


site search engine

2012-03-26 Пенетрантность Stanislav Vlasov
Есть сайт с html-документацией.
Надо прикрутить к нему поиск.
Какой поиск лучше брать в стабильном дебиане?
Раньше пользовал mnogosearch, но в squeeze он отсутствует.

-- 
Stanislav


Re: site search engine

2012-03-26 Пенетрантность Victor Wagner
On 2012.03.26 at 13:06:47 +0600, Stanislav Vlasov wrote:

 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

Когда я тут недавно на вики-движки смотрел, обнаружил что они в основном
для этой цели употребляют xapian. Русский stemming там в каком-то виде
есть. Подробной оценки качества не делал.

Еще, насколько я знаю, популярна lucene.


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/20120326072030.ga7...@wagner.pp.ru



Re: site search engine

2012-03-26 Пенетрантность Stanislav Vlasov
26 марта 2012 г. 13:20 пользователь Victor Wagner vi...@wagner.pp.ru написал:

 Есть сайт с html-документацией.
 Надо прикрутить к нему поиск.
 Какой поиск лучше брать в стабильном дебиане?
 Раньше пользовал mnogosearch, но в squeeze он отсутствует.

 Когда я тут недавно на вики-движки смотрел, обнаружил что они в основном
 для этой цели употребляют xapian. Русский stemming там в каком-то виде
 есть. Подробной оценки качества не делал.

 Еще, насколько я знаю, популярна lucene.

А что-нибудь про поддержку N кодировок одного языка?
Ибо часть документации в cp1251, часть в koi8-r, остальное - utf-8.

-- 
Stanislav


Re: site search engine

2012-03-26 Пенетрантность Victor Wagner
On 2012.03.26 at 14:24:16 +0600, Stanislav Vlasov wrote:

 
  Когда я тут недавно на вики-движки смотрел, обнаружил что они в основном
  для этой цели употребляют xapian. Русский stemming там в каком-то виде
  есть. Подробной оценки качества не делал.
 
  Еще, насколько я знаю, популярна lucene.
 
 А что-нибудь про поддержку N кодировок одного языка?
 Ибо часть документации в cp1251, часть в koi8-r, остальное - utf-8.

Не знаю. Для wiki это неактуально. Там проще сразу все в utf-8 делать.
Ну а для статики вопрос решается простейшей скриптовой оберткой вокруг
индексатора. Есть ли она уже готовая - не изучал.

 -- 
 Stanislav


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive: http://lists.debian.org/20120326093854.ga10...@wagner.pp.ru