On Tue, Feb 22, 2005 at 12:09:30PM +0100, philippe L wrote:
> Bonjour,
> 
> Je cherche une appli qui transforme des PDF en fichier text, ou une
> norme standard le tous en ligne de commande ...
> �� existe ?

Ca depend beaucoup de l'origine du pdf. Le pdf gener'e par latex sera plus
difficile que celui gener'e par firefox->print. C'est li'e a des
consideratons de conception du module impression/conversion  l'appli d'origine, 
s'il supporte du postscript unicode ou pas , ou bien s'il inclut la police dans 
le code postscript gener'e ou l'int`egre sous forme d'images bitmaps de 
caracteres, ...

La "technique" garantie est de transformer le pdf en image 
(avec gs , device pbm), histoire de se liberer de son origine, 
et de faire passer un moteur OCR sur l'image. Ca depend quand meme de la 
precision de l'OCR en question.

Malheureusement, des OCRs sous linux, il y en a pas des milliers. Je connais 
gocr : http://jocr.sourceforge.net/

Nooks,


-- 
Pensez � lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez � rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]

Répondre à