[DataparkSearch Forum] Re: Узнавание кодировки

DataparkSearchForum Tue, 10 Jan 2006 07:20:45 -0800

- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Dmitry
Subject: Re: Узнавание кодировки


Нет, он вообще путается не на шутку. Я файлы *.lm подключал и через Inclide 
langmap.conf и просто, чтоб самого себя не запутать прямо в основном конфиге 
пишу только 4 русские кодировки. Так он мне файлик в 422 байта, который koi8-r 
пишет, что кодировка - MacCyrillic. А те файлы, которые раньше определял ISO 
8859-1, посколку я оставил только русские кодировки, пишет KOI8-R. И при поиске 
отдаёт именно в этой кодировке! Я использую cached без dostore и глобально 
utf8. Но ни то, ни другое, ни третье роли не играет. Я менял и кодировку, и 
cached на multi...

Почему и спрашиваю - может, как-то можно переопределить этот Guesser прямо на 
компиляции? А то он пишет, как заговорённый только :

[5416]{01} Status: 200 OK
[5416]{01} Store by default
[5416]{01} Guesser: Lang: ru, Charset: MacCyrillic

..и всё. И в базу кладёт результат индексирования именно в этой кодировке (я 
вручную проверял-лазил - файл действительно проиндексровался, но слова лежат в 
неравильно определённой кодировке. Если это было определено в koi8r, то он так 
слова и держит)

PS Максим, спасибо Вам супер-большое за супер-программу
- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1136861335

[DataparkSearch Forum] Re: Узнавание кодировки

Reply via email to