Georges Lours a écrit :
>
> Mais, il y a des fichiers pdf qui ne sont que des images, non ?
> Il me semble que ceux-ci ne peuvent être transformés en texte qu'en les 
> faisant passer par un OCR genre OmniPage sous windows et, malheureusement 
> sans équivalent convaincant, à ma connaissance, sous linux.
>   
pas forcément; on peut transformer un pdf en série de fichiers images
qui seront ensuite passés sous gocr ou ocram (par exemple), en mode
utf-8 pour les accents. Si la source est propre, le résultat est assez
correct.

Mitch

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Répondre à