- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Dmitry
Subject: Re: Узнавание кодировки
Нет, он вообще путается не на шутку. Я файлы *.lm подключал и через Inclide
langmap.conf и просто, чтоб самого себя не запутать прямо в основном конфиге
пишу только 4 русские кодировки. Так он мне файлик в 422 байта, который koi8-r
пишет, что кодировка - MacCyrillic. А те файлы, которые раньше определял ISO
8859-1, посколку я оставил только русские кодировки, пишет KOI8-R. И при поиске
отдаёт именно в этой кодировке! Я использую cached без dostore и глобально
utf8. Но ни то, ни другое, ни третье роли не играет. Я менял и кодировку, и
cached на multi...
Почему и спрашиваю - может, как-то можно переопределить этот Guesser прямо на
компиляции? А то он пишет, как заговорённый только :
[5416]{01} Status: 200 OK
[5416]{01} Store by default
[5416]{01} Guesser: Lang: ru, Charset: MacCyrillic
..и всё. И в базу кладёт результат индексирования именно в этой кодировке (я
вручную проверял-лазил - файл действительно проиндексровался, но слова лежат в
неравильно определённой кодировке. Если это было определено в koi8r, то он так
слова и держит)
PS Максим, спасибо Вам супер-большое за супер-программу
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1136861335