Le Dimanche 27 Mai 2007 14:52, jmt a écrit : > J'ai un fichier html, avec l'indication : > <meta http-equiv="Content-Type" content="text/html; charset=windows-1252"> > mais rien à faire pour le convertir en UTF-8 avec iconv. > > Quand je le visualise avec un éditeur binaire, les caractères supérieurs à > ascii-7 sont représentés par trois octets,
C'est surprenant. winodws 1252 est un jeu de caractères sur un octet. > ce qui explique mes tentatives > infructueuses de conversion : > iconv --from CP --to UTF-8 <fichier> > qui me retourne par exemple un mot dont je m'attends à ce qu'il > s'écrive "général" par g�n�ral Dand utf-8 les caractères accentués peuvent se retrouver sur 3 octets, donc c'est pas franchement surprenant. File un extrait de ton fichier. Il y a de grandes chances qu'il soit mal déclaré dans la balise <meta>. -- Invasion of Irak, death penalty, Guantanamo concentration camp, no ban on weapons: the USA have the violent state that matches their violent society.
