- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Oleg Subject: Неправильно индексируются *.doc файлы при кодировке utf8
в indexer.conf: LocalCharset UTF-8 Mime application/msword "text/plain; charset=utf-8" "catdoc -a -dutf-8 $1" Mime application/pdf "text/plain; charset=utf-8" "pdftotext -enc UTF-8 $1 -" PDF индексируются правильно, я вот DOC-и нет: http://search.neonet.md:81/cgi-bin/dp_search.cgi?q=fizic там 3 результата, первый из них PDF, остальные два DOCs. Те же файлы были проиндексированые mnogosearch-ом установленным на том же сервере с теми же настройками парсеров, результат правильный: http://search.neonet.md:81/ebooks.mns?q=fizic (Правда там на один документ меньше, но это уже баг в самом mnogosearch я полагаю) dpsearch-4.46-27032007-mysql - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;post=
