Leoš Urban napsal(a): > Ahoj, > mam na stole zadani na ukladani dokumentu do databaze a rad bych k tomu > pridal i OCR aby se dalo podle textu vyhledavat. Bohuzel jsem narazil na > znacne problemy s prevodem do textu. > > Pokud se tyka scanovani tam mam vyhlednute dva produkty, Morena ci > Asprise JTwain / Asprise JSane. Tam nevidim problem. > > U OCR jsem nasel tri reseni - Asprise OCR, JavaOCR, JOCR. > Ani jeden z uvedenych produktu pri testu nedosahne (ani zdaleka) kvality > HP software co je soucasti tiskarny PSC (za asi 1500 Kc). Jediny > obrazek, ktery se mi podari prevest, je demo obrazek dodany k Asprise > OCR, kdyz to same vytisknu a naskenuji (ruznymi zpusoby - ruzne > rozliseni, ruzna barevnost), nedosahnu stejneho vysledku. > Uz mne v zoufalstvi napadlo pouzit nejakou DLL s knihovnou pro cecko, > jestli existuje a udelat JNI most. > > Mate s tim nekdo nejake zkusenosti? Mozna jenom delam neco spatne > (parametry skenovani?). Nezda se mi, ze by tam drahe produkty (Asprise > OCR $3000) byly nepouzitelne (JOCR je zdarma ale podle komentaru > nedosahuje dobrych vysledku - coz u mne tedy ani jeden). > > Dekuji, > Leos
Tesseract nevypadá špatně (open source), ale pro češtinu by se musel natrénovat: http://code.google.com/p/tesseract-ocr/ David
