Hallo,

ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde fragen:

"Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
eingescannten Dokumenten

a) Verzerrungen entfernt
b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht eingescannte Texte für einen Ausdruck vorbereitet werden können.

Für b) gibt es zumindest mit https://github.com/tesseract-ocr schon eine
Grundlage, die Zuverlässigkeit ist allerdings noch gering und es gibt
kein GUI."

Hat jemand für die genannten Kriterien vielleicht einen Hinweis?

Gruß und Danke
Roland

Attachment: OpenPGP_0xBE135DCD5A22CEFB.asc
Description: application/pgp-keys

Attachment: OpenPGP_signature
Description: OpenPGP digital signature

_______________________________________________
FSFE-de mailing list
[email protected]
https://lists.fsfe.org/mailman/listinfo/fsfe-de

Diese Mailingliste wird durch den Verhaltenskodex der FSFE abgedeckt.
Alle Teilnehmer werden gebeten, sich gegenseitig vorbildlich zu
behandeln: https://fsfe.org/about/codeofconduct

Antwort per Email an