Re: Printmedien digitalisieren

2021-02-22 Diskussionsfäden Sebastian Hegler
Hi! Am 22.02.2021 um 09:27 schrieb Bernhard Schiffner : > Kann man tesseract einlernen? Was muss man bezüglich Zeichensatz > voreinstellen? tesseract kommt mit sprach-spezifischen Paketen "hartkodierten Wissens": https://github.com/tesseract-ocr/langdata . Man muss die Sprache(n) vorgeben, sons

Aw: Re: Re: Printmedien digitalisieren

2021-02-22 Diskussionsfäden Ottmar-Schmidt
Hallo Bernd,   im Prinzip habe ich "digital analog" gearbeitet. Alles ande2re auszuknobeln hätte länger gedauert soviel musst eich ja nicht machen.   Tesseract hat zwar diverse Sprachfiles auch deutsch ber das hat irgendwie nicht funktioniert. Ich hab dann aber auch keine Energie darauf verschw

Re: Aw: Re: Printmedien digitalisieren

2021-02-22 Diskussionsfäden vv01f
Ich habe bei einem Vortrag auf dem CLT vor ein paar Jahren von einem Buch (irgendwas über heimat, inkl. Abbildungen) in Fraktur gehört für das Tesseract trainiert wurde (irgendwie meine ich das könnte ein Mitarbeiter der SLUB gewesen sein). Also das geht, aber wie im Detail ist mir auch nicht b

Re: Aw: Re: Printmedien digitalisieren

2021-02-22 Diskussionsfäden Bernhard Schiffner
Danke für die Rückmeldung, klingt ziemlich gut! Kannst Du u.U. mal die Details berichten? Wir wollen uns Mi, 24.2. 20:00 wieder mal virtuell treffen auf https://bbb.schlittermann.de/b/gre-kcf-m77 Kann man tesseract einlernen? Was muss man bezüglich Zeichensatz voreinstellen? Ich habe keine Ahn