On 02. 02. 14 23:15, Thibault North wrote:
Hello,

2014-02-02 Cédric BRINER <[email protected]>:
Salut,

Je souhaite trouver une solution me permettant de faire une reconnaissance
de caractère sur des documents PDF issue d'une numérisation.


Au risque de répondre à côté de la plaque, il me semble que 'pdfocr' permet de numériser des documents au format pdf, d'effectuer une reconnaissance de caractère, puis de "fusionner" le texte reconnu avec le pdf original, pour un faire un pdf indexable:

http://ubuntuforums.org/showthread.php?t=1456756

Il me semblait avoir vu un autre script faisant la même chose, malheureusement, je n'arrive pas à retrouver ma note.

Je n'ai pas encore eu l'occasion d'essayer un ou l'autre de ces outils, aussi, je ne sais pas ce qu'ils valent.
_______________________________________________
gull mailing list
[email protected]
http://forum.linux-gull.ch/mailman/listinfo/gull

Répondre à