Bonjour,
Le 2007-05-27 14:52, jmt a écrit :
J'ai un fichier html, avec l'indication :
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
mais rien à faire pour le convertir en UTF-8 avec iconv.
Quand je le visualise avec un éditeur binaire, les caractères supérieurs à
ascii-7 sont représentés par trois octets, ce qui explique mes tentatives
infructueuses de conversion :
iconv --from CP --to UTF-8 <fichier>
qui me retourne par exemple un mot dont je m'attends à ce qu'il
s'écrive "général" par g�n�ral
Des pistes ?
3 octets ? Déjà ce n'est pas le CP 1252 qui a été utilisé (codage à un
octet). Il ne serait pas déjà en UTF-8 par hasard ?
--
Thomas Linard
http://www.linard.name/