On Thu, 22 Oct 2020, Roland Hummel wrote:

ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde fragen:

"Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
eingescannten Dokumenten

a) Verzerrungen entfernt
b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht eingescannte Texte für einen Ausdruck vorbereitet werden können.

ScanTailor und neuer ScanTailorAdvanced übernehmen a) und c).

Übrigens nehme ich auch sehr gerne jbig2enc, um Schwarz-Weiß-Dokumente anschließend sehr kompakt zum komprimieren. Auf die JBIG-Kompression bin ich ausgerechnet durch David Kriesels Vortrag über einen schwerwiegenden Fehler in der JBIG-Implementierung von XEROX gestoßen. Bei jbig2enc habe ich aber noch keine Probleme beobachtet.
_______________________________________________
FSFE-de mailing list
[email protected]
https://lists.fsfe.org/mailman/listinfo/fsfe-de

Diese Mailingliste wird durch den Verhaltenskodex der FSFE abgedeckt.
Alle Teilnehmer werden gebeten, sich gegenseitig vorbildlich zu
behandeln: https://fsfe.org/about/codeofconduct

Antwort per Email an