Le jeudi 5 juillet 2007, Mitch a écrit :
> pas forcément; on peut transformer un pdf en série de fichiers images
> qui seront ensuite passés sous gocr ou ocram (par exemple), en mode
> utf-8 pour les accents. Si la source est propre, le résultat est assez
> correct.

Oui, il faut vraiment que la source soit propre. Ça fait longtemps que je n'ai 
pas testé, je réessayerai à l'occasion. Mais l'essentiel n'est pas là; ce que 
je voulais dire avant tout c'est que si le document pdf ne contient que 
l'image d'un texte (une page de magazine scannée par exemple), on ne peut pas 
se contenter de faire un copier coller pour récupérer le texte : il faut le 
numériser à l'aide d'un logiciel de reconnaissance de caractères

-- 
Georges Lours
[EMAIL PROTECTED]
Utilisateur Linux (counter 383333)

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Répondre à