On Tue, Feb 22, 2005 at 12:09:30PM +0100, philippe L wrote: > Bonjour, > > Je cherche une appli qui transforme des PDF en fichier text, ou une > norme standard le tous en ligne de commande ... > �� existe ?
Ca depend beaucoup de l'origine du pdf. Le pdf gener'e par latex sera plus difficile que celui gener'e par firefox->print. C'est li'e a des consideratons de conception du module impression/conversion l'appli d'origine, s'il supporte du postscript unicode ou pas , ou bien s'il inclut la police dans le code postscript gener'e ou l'int`egre sous forme d'images bitmaps de caracteres, ... La "technique" garantie est de transformer le pdf en image (avec gs , device pbm), histoire de se liberer de son origine, et de faire passer un moteur OCR sur l'image. Ca depend quand meme de la precision de l'OCR en question. Malheureusement, des OCRs sous linux, il y en a pas des milliers. Je connais gocr : http://jocr.sourceforge.net/ Nooks, -- Pensez � lire la FAQ de la liste avant de poser une question : http://wiki.debian.net/?DebianFrench Pensez � rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:" To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]

