- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Dmitry Subject: Re: Узнавание кодировки
Нет, Вы знаете, всё то же самое, если не хуже. Я сейчас непрерывно всё перепроверял, некоторые файлы, даже 13-15Кб в cp866 (только русский текст!) вообще не берёт. Страшная путаница, иногда даже не определяет, что это русский (ru). В конфиге только LangMapFile langmap/ru.cp1251.lm LangMapFile langmap/ru.cp866.lm LangMapFile langmap/ru.koi8-r.lm LangMapFile langmap/ru.utf8.lm Компилирую без aspell, база в utf8... И по-прежнему, если он определеяет неправильно, то и в БД кладёт так же неправильно. (Я пытаюсь объяснить, что происходит) Допустим, файл в windows-1251. Он определяется и индексируется(!) как KOI8-R (даж с новым снапшотом). И в базе, в таком же перкодированном виде так и хранится. Т.е. если я в поисковую форму ввожу заведомо неправильно перекодированный (например, хЛОЕПХЪ) текст, то он вытащит этот результат из базы. В общем, как бы то ни было, для текстовых файлов не работает. (Кстати, концы строк как-то учитываются?) - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1136861335;page=2
