Voila un message que j'ai fait passé sur une liste de l'Adullact mais ce serait une bonne idée de Plug-IN pour OpenOffice : Un OCR de qualité intégré ...

Christophe


CUNEIFORM : Un moteur OCR digne de ce nom en Open Source (Licence BSD)*

La société Russe Cognitive Technologie http://www.cognitive.ru/about/news/2008/12.htm a libéré son logiciel d'OCR en 2008. Celui ci était en concurrence avec l'autre société Russe ABBY http://france.abbyy.com/ qui garde sont modèle propriétaire mais s'est ouverte sous peu à Linux.
http://www.abbyy.com/ocr_sdk_linux/

Le port de Cuneiform sous Linux a commencé :
https://launchpad.net/cuneiform-linux et des packages debian sont disponibles.


Il n'est pas facile de se plonger dans le code (C et C++) car les commentaires sont en cyrillique... La reconnaissance de texte est équivalente à celles réalisée avec les autres produits commerciaux et dépasse ce qu'on connaissait avec GOCR.

http://en.wikipedia.org/wiki/CuneiForm_(software)

Certaines fonctionnalité de sont pas encore libérées comme la reconnaissance des tableaux (mise en forme des bordures) mais Cognitive Technologie semble s'être engagée à les libérer.

Il reste donc encore du travail pour en faire un produit grand public avec interface en Français sous Linux mais un grand pas vient d'être franchi avec la libération de ce code.

Christophe

*Merci à François Elie pour l'information sur les listes de l'AFUL

Liens :

http://www.cuneiform.ru/eng/
http://en.openocr.org/



-------------------------------------------------------
 [email protected]
 partage des savoirs et des expériences entre les
 services de l'Etat
 http://listes.adullact.org/wws/

------------
[email protected]
partage des savoirs et des expériences entre les services de l'Etat

pour s'abonner à la liste *service-public-libre*
écrire à l'adresse: [email protected]
avec comme sujet: SUBSCRIBE service-public-libre

pour vous désabonner de la liste *service-public-libre*
écrire à l'adresse: [email protected]
avec comme sujet: SIGNOFF service-public-libre

---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]

Répondre à