Re: Java a OCR

David Smid Tue, 26 Aug 2008 01:07:36 -0700

Leoš Urban napsal(a):
> Ahoj,
> mam na stole zadani na ukladani dokumentu do databaze a rad bych k tomu
> pridal i OCR aby se dalo podle textu vyhledavat. Bohuzel jsem narazil na
> znacne problemy s prevodem do textu.
> 
> Pokud se tyka scanovani tam mam vyhlednute dva produkty, Morena ci
> Asprise JTwain / Asprise JSane. Tam nevidim problem.
> 
> U OCR jsem nasel tri reseni - Asprise OCR, JavaOCR, JOCR.
> Ani jeden z uvedenych produktu pri testu nedosahne (ani zdaleka) kvality
> HP software co je soucasti tiskarny PSC (za asi 1500 Kc). Jediny
> obrazek, ktery se mi podari prevest, je demo obrazek dodany k Asprise
> OCR, kdyz to same vytisknu a naskenuji (ruznymi zpusoby - ruzne
> rozliseni, ruzna barevnost), nedosahnu stejneho vysledku. 
> Uz mne v zoufalstvi napadlo pouzit nejakou DLL s knihovnou pro cecko,
> jestli existuje a udelat JNI most.
> 
> Mate s tim nekdo nejake zkusenosti? Mozna jenom delam neco spatne
> (parametry skenovani?). Nezda se mi, ze by tam drahe produkty (Asprise
> OCR $3000) byly nepouzitelne (JOCR je zdarma ale podle komentaru
> nedosahuje dobrych vysledku - coz u mne tedy ani jeden).
> 
> Dekuji,
> Leos


Tesseract nevypadá špatně (open source), ale pro češtinu by se musel natrénovat:
http://code.google.com/p/tesseract-ocr/

David

Re: Java a OCR

Odpovedet emailem