- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Oleg
Subject: Неправильно индексируются *.doc файлы при кодировке utf8

в indexer.conf:
LocalCharset UTF-8
Mime application/msword      "text/plain; charset=utf-8" "catdoc -a -dutf-8 $1"
Mime application/pdf         "text/plain; charset=utf-8" "pdftotext -enc UTF-8 
$1 -"

PDF индексируются правильно, я вот DOC-и нет:
http://search.neonet.md:81/cgi-bin/dp_search.cgi?q=fizic
там 3 результата, первый из них PDF, остальные два DOCs.

Те же файлы были проиндексированые mnogosearch-ом установленным на том же 
сервере с теми же настройками парсеров, результат правильный:
http://search.neonet.md:81/ebooks.mns?q=fizic

(Правда там на один документ меньше, но это уже баг в самом mnogosearch я 
полагаю)

dpsearch-4.46-27032007-mysql
- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;post=

Reply via email to