Bonjour,

Le 2007-05-27 14:52, jmt a écrit :
J'ai un fichier html, avec l'indication :
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
mais rien à faire pour le convertir en UTF-8 avec iconv.

Quand je le visualise avec un éditeur binaire, les caractères supérieurs à ascii-7 sont représentés par trois octets, ce qui explique mes tentatives infructueuses de conversion : iconv --from CP --to UTF-8 <fichier> qui me retourne par exemple un mot dont je m'attends à ce qu'il s'écrive "général" par g�n�ral

Des pistes ?

3 octets ? Déjà ce n'est pas le CP 1252 qui a été utilisé (codage à un octet). Il ne serait pas déjà en UTF-8 par hasard ?

--
Thomas Linard
http://www.linard.name/

Répondre à