Georges Lours a écrit : > > Mais, il y a des fichiers pdf qui ne sont que des images, non ? > Il me semble que ceux-ci ne peuvent être transformés en texte qu'en les > faisant passer par un OCR genre OmniPage sous windows et, malheureusement > sans équivalent convaincant, à ma connaissance, sous linux. > pas forcément; on peut transformer un pdf en série de fichiers images qui seront ensuite passés sous gocr ou ocram (par exemple), en mode utf-8 pour les accents. Si la source est propre, le résultat est assez correct.
Mitch --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
