On Wed, 2009-04-15 17:53:20 +0200, Johannes Goecke <[email protected]> wrote: > On Wed, Apr 15, 2009 at 01:43:19PM +0200, Jan-Benedict Glaw wrote: > > > > Beim Stichwort "OCR"... > > > ... > > Was ich nun aber suche: Ist es möglich, den OCRten Text irgendwie in > > die PDFs zu packen? Und optimalerweise so, daß der via der > > Such-Funktionen in den PDF-Betrachtern dann auch den einzelnen Seiten > > (also gescannten Bildern dieser) zugeordnet werden kann? > > Ich habe es letztens gelesen ich meine im Linux-Magazin, finde > es aber nicht auf den Webseiten (vielleicht finde ich die Zeitung > nochmal - war nicht meine). > > Aber schau dir mal die "archivista-box" ( www.archivista.ch ) an. > Die tun sowas unter Linux und man kanns dowloaden und anschauen.
Ah, das ist 'nen Tip, der vielleicht Gold wert gewesen ist. Nach 'nem bissl Klicken landet man hier: http://www.exactcode.de/site/open_source/exactimage/hocr2pdf/ Das sieht schon sehr danach aus, was ich suche. Danke! MfG, JBG -- Jan-Benedict Glaw [email protected] +49-172-7608481 Signature of: If it doesn't work, force it. the second : If it breaks, it needed replacing anyway.
signature.asc
Description: Digital signature
-- Linux mailing list [email protected] subscribe/unsubscribe: http://lug-owl.de/mailman/listinfo/linux Hinweise zur Nutzung: http://www.lug-owl.de/Mailingliste/hints.epo
