Hallo,

sofern die Scans als PDF vorliegen, ist OCRmyPDF [0] ein hübsches Tool.
Es ist in Python(3) geschrieben und damit plattformunabhängig.

Es bettet einen "Textlayer" in das Dokument ein, sodass man anschließend
Copy-and-Paste machen kann.

Man kann sich auch den Text als solchen ausgeben bzw. in eine Datei
schreiben lassen. Auch der Erhalt des Originaldokuments ist möglich.

Auch dieses Tool nutzt tesseract.

Allerdings ist es ein Konsolentool. Ich habe hierzu auch ein GUI
(ebenfalls in Python3) geschrieben, allerdings, da noch nicht ganz
fertig, noch nicht veröffentlicht.

Der bisherige praktische Einsatz gab zu Klagen keinen Anlass.

Mit freundlichem Gruß
Michael (St.)

[0]
https://packages.debian.org/search?suite=all&searchon=names&keywords=ocrmypdf
https://www.heise.de/download/product/ocrmypdf

Attachment: signature.asc
Description: OpenPGP digital signature

_______________________________________________
FSFE-de mailing list
[email protected]
https://lists.fsfe.org/mailman/listinfo/fsfe-de

Diese Mailingliste wird durch den Verhaltenskodex der FSFE abgedeckt.
Alle Teilnehmer werden gebeten, sich gegenseitig vorbildlich zu
behandeln: https://fsfe.org/about/codeofconduct

Antwort per Email an