On Wed, 2009-04-15 17:53:20 +0200, Johannes Goecke <[email protected]> wrote:
> On Wed, Apr 15, 2009 at 01:43:19PM +0200, Jan-Benedict Glaw wrote:
> > 
> > Beim Stichwort "OCR"...
> > 
> ...
> > Was ich nun aber suche: Ist es möglich, den OCRten Text irgendwie in
> > die PDFs zu packen? Und optimalerweise so, daß der via der
> > Such-Funktionen in den PDF-Betrachtern dann auch den einzelnen Seiten
> > (also gescannten Bildern dieser) zugeordnet werden kann?
> 
> Ich habe es letztens gelesen ich meine im Linux-Magazin, finde
> es aber nicht auf den Webseiten (vielleicht finde ich die Zeitung
> nochmal - war nicht meine).
> 
> Aber schau dir mal die "archivista-box" ( www.archivista.ch ) an.
> Die tun sowas unter Linux und man kanns dowloaden und anschauen.

Ah, das ist 'nen Tip, der vielleicht Gold wert gewesen ist. Nach 'nem
bissl Klicken landet man hier:

http://www.exactcode.de/site/open_source/exactimage/hocr2pdf/

Das sieht schon sehr danach aus, was ich suche.

Danke!

MfG, JBG

-- 
      Jan-Benedict Glaw      [email protected]              +49-172-7608481
 Signature of:                            If it doesn't work, force it.
 the second  :                   If it breaks, it needed replacing anyway.

Attachment: signature.asc
Description: Digital signature

--
Linux mailing list [email protected]
subscribe/unsubscribe: http://lug-owl.de/mailman/listinfo/linux
Hinweise zur Nutzung: http://www.lug-owl.de/Mailingliste/hints.epo

Antwort per Email an