[DataparkSearch Forum] Re: Узнавание кодировки

DataparkSearchForum Sat, 14 Jan 2006 00:11:09 -0800

- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Dmitry
Subject: Re: Узнавание кодировки


Нет, Вы знаете, всё то же самое, если не хуже. Я сейчас непрерывно всё 
перепроверял, некоторые файлы, даже 13-15Кб в cp866 (только русский текст!) 
вообще не берёт. Страшная путаница, иногда даже не определяет, что это русский 
(ru). 

В конфиге только
LangMapFile langmap/ru.cp1251.lm
LangMapFile langmap/ru.cp866.lm
LangMapFile langmap/ru.koi8-r.lm
LangMapFile langmap/ru.utf8.lm
Компилирую без aspell, база в  utf8... И по-прежнему, если он определеяет 
неправильно, то и в БД кладёт так же неправильно. (Я пытаюсь объяснить, что 
происходит) Допустим, файл в windows-1251. Он определяется и индексируется(!) 
как KOI8-R (даж с новым снапшотом). И в базе, в таком же перкодированном виде 
так и хранится. Т.е. если я в поисковую форму ввожу заведомо неправильно 
перекодированный (например, хЛОЕПХЪ) текст, то он вытащит этот результат из 
базы. В общем, как бы то ни было, для текстовых файлов не работает. (Кстати, 
концы строк как-то учитываются?)
- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1136861335;page=2

[DataparkSearch Forum] Re: Узнавание кодировки

Reply via email to