On Thu, 22 Oct 2020, Roland Hummel wrote:
ich hatte neulich eine Anfrage, die ich mangels persönlichem Bedarf an
OCR-Software schlecht beantworten konnte, daher wollte ich mal in die Runde
fragen:
"Es wäre fantastisch, wenn es eine FLOSS-Anwendung gäbe, die aus
eingescannten Dokumenten
a) Verzerrungen entfernt
b) eine zuverlässige, mehrsprachige Texterkennung durchführt und
c) Text, Hintergrund und Kopierartefakte trennt, damit auch schlecht
eingescannte Texte für einen Ausdruck vorbereitet werden können.
ScanTailor und neuer ScanTailorAdvanced übernehmen a) und c).
Übrigens nehme ich auch sehr gerne jbig2enc, um Schwarz-Weiß-Dokumente
anschließend sehr kompakt zum komprimieren. Auf die JBIG-Kompression bin
ich ausgerechnet durch David Kriesels Vortrag über einen schwerwiegenden
Fehler in der JBIG-Implementierung von XEROX gestoßen. Bei jbig2enc habe
ich aber noch keine Probleme beobachtet._______________________________________________
FSFE-de mailing list
[email protected]
https://lists.fsfe.org/mailman/listinfo/fsfe-de
Diese Mailingliste wird durch den Verhaltenskodex der FSFE abgedeckt.
Alle Teilnehmer werden gebeten, sich gegenseitig vorbildlich zu
behandeln: https://fsfe.org/about/codeofconduct