- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Dmitry Subject: Re: Узнавание кодировки
40-50% plain-text определяется неправильно (автоматом). Хочу быть правильно понятым. Меня всё устраивает. И, конечно же, я понимаю, что кодировку надо бы отдавать с сервера, да и сама постановка - plain-text - это не совсем то. Тем не менее. Получаю на практике (а "практика" бывает всякой) именно, о чём и пишу. Значит, отсюда некоторые вопросы: 1) Попробовал я этот dpguesser, но не до конца понял общий смысл. Т.е. я беру некий файл, и делаю по нему карту. А дальше? А дельше у меня другой файл в той же кодировке, который тоже... может не определиться... И что? Делать ещё раз карту, и так для каждого файла? Это не совсем понятно. В условиях, когда он не определяет, к примеру, 15Кб-файл в 866, где вообще, кроме русских букв нет ни одного другого знака, это непонятно вдвойне. 2) При прямо указанном DefaultLang ru и поотключенных всех доп. фич - aspell/ispell/AccentExtensions и тому подобное, не определить одну из (всего) 4 кодировок, можно только, по-моему, если он просто не успевает (во время определения) читать. Другое на ум не приходит. Т.е. (подсознательно) хотелось бы искусственно этому "процессу определения" дать больше времени и приоритета. Возможно ли это в прнципе? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1136861335;page=2
