[DataparkSearch Forum] Re: Узнавание кодировки

DataparkSearchForum Sat, 14 Jan 2006 19:46:29 -0800

- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Dmitry
Subject: Re: Узнавание кодировки


40-50% plain-text определяется неправильно (автоматом). Хочу быть правильно 
понятым. Меня всё устраивает. И, конечно же, я понимаю, что кодировку надо бы 
отдавать с сервера, да и сама постановка - plain-text - это не совсем то. Тем 
не менее. Получаю на практике (а "практика" бывает всякой) именно, о чём и 
пишу. Значит, отсюда некоторые вопросы:
1) Попробовал я этот dpguesser, но не до конца понял общий смысл. Т.е. я беру 
некий файл, и делаю по нему карту. А дальше? А дельше у меня другой файл в той 
же кодировке, который тоже... может не определиться... И что? Делать ещё раз 
карту, и так для каждого файла? Это не совсем понятно. В условиях, когда он не 
определяет, к примеру, 15Кб-файл в 866, где вообще, кроме русских букв нет ни 
одного другого знака, это непонятно вдвойне.
2) При прямо указанном DefaultLang ru и поотключенных всех доп. фич - 
aspell/ispell/AccentExtensions и тому подобное, не определить одну из (всего) 4 
кодировок, можно только, по-моему, если он просто не успевает (во время 
определения) читать. Другое на ум не приходит. Т.е. (подсознательно) хотелось 
бы искусственно этому "процессу определения" дать больше времени и приоритета. 
Возможно ли это в прнципе?

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1136861335;page=2

[DataparkSearch Forum] Re: Узнавание кодировки

Reply via email to