Hi!

Am 22.02.2021 um 09:27 schrieb Bernhard Schiffner <[email protected]>:
> Kann man tesseract einlernen? Was muss man bezüglich Zeichensatz 
> voreinstellen?
tesseract kommt mit sprach-spezifischen Paketen "hartkodierten Wissens": 
https://github.com/tesseract-ocr/langdata . Man muss die Sprache(n) vorgeben, 
sonst kommt Murks raus.

Um noch was dazuzusenfen: mein Favorit ist ocrmypdf: 
https://github.com/jbarlow83/OCRmyPDF , als Kommandozeilen-Komplettlösung.


Viele Grüße
Sebastian

Antwort per Email an