Hi Jonas, TroLuger,

ich fände das ein hervorragendes weil nutzbringendes Thema an dem ich mich gern noch einmal versuchen würde, so es denn diesmal mehr Aussicht auf Erfolg verspricht. Zuletzt hatte ich mir gemäß meinem Install-Log ab 2013-04 einige Zeit ab Version 3.02 die Zähne daran ausgebissen und nach langem zähen Ringen irgendwann die Flinte ins Korn geworfen und seither nie wieder angepackt.

Hoffe nun, das es seither deutlich besser geworden ist und würde ihm nochmal eine zweite Chance einräumen wollen, so es denn nach diesem Vortrag oder Input erfahrener Anwender neuerer Zeit Erfolg verspricht.

Von daher wär ich gespannt und hoch erfreut zugleich...
Full ack von meiner Seite dafür!

Gruß
Andy



Am 24.04.21 um 13:36 schrieb Jonas Stein:
Hallo allerseits,

neulich ging es in der TroLUG ganz kurz auch um Dokumentenverwaltung und OCR.

Ich bin bei Tesseract leider nie so tief eingestiegen, dass ich es produktiv einsetzen konnte.

Mein Traum ist ein PDF ohne Textlayer durch ein Script zu jagen und dann ein durchsuchbares PDF mit wenigen Erkennungsfehlern zu erhalten.

Wie kann man Texte zügig einscannen und mit OCR speichern? Was ist
bei
Wörterbüchern zu beachten? Wie funktioniert das OCR Training?

Kennt jemand gute Dokumentenscanner, die unter Linux gut ansprechbar sind und OCR bereits gut im Scanner erledigen?

Haben auch andere Interesse an dem Thema? Wer kann aus eigener Erfahrung berichten? Wollen wir daraus ein TroLUG Thema machen?

Beste Grüße,


Attachment: OpenPGP_signature
Description: OpenPGP digital signature

Antwort per Email an