Ernesto Escobar escribió: > Lesman: >>> Cacharreando logré hacer el Reconocimiento Óptico de Caracteres; pero la >>> resolución es pésima, incluso escaneando a 600 dpi. >> como lo hiciste? >>> La solución está en teclear el texto o hacerlo en Windows; el Abby >>> Finder está muy bueno para ello. >> Negativo. >>> Con toda consideración: >>> >>> Delio G. Orozco González. >>> Historiador. >>> Director Archivo Histórico. >>> Manzanillo, Cuba. >> Me interesa eso por el tema de la digitalización en las bibliotecas, >> revisa esto: >> > Este tema me interesa también mucho a mi, Yo realmente he probado 3 > sistemas OCRs en GNU/Linux: > > EL Clara - Realmente no logre nada con el, si quieres un programa > complicado para usar, ahí lo tienes. Me rendí. > el gocr - realmente con resultados pobres, las imágenes tienen que estar > en ppm o pgm y el indice de error es bien grande, > el ocrad - el que mejorcito resultado me dio pero no optimo, también > alto indice de errores, aunque algo ligeramente menor que el gocr, > variando el thresold (no recuerdo su gramática, es solo el umbral) > mejoró algo el reconocimiento, pero cada imagen es un caso aparte. > Además todos tienden a perderse cuando hay combinación de imágenes y texto. > > Las imágenes fueron tomadas con una cámara digital de 3.2 Mp > (2048x1536), esas mismas fotos, procesadas por el ABBYY finereader 8.0 > Professional salen impecables, cero error. Por tanto creo que no está > el kid de la cuestión en la calidad de las fotos, sino en los programas > OCRs disponibles, quizás en documentos en Ingles trabajen mejor, pero en > castellano dejan mucho que desear... > > Atte, > > Ernesto >
aqui explican las distintas opciones http://www.linux.com/feature/138511 optando por Tesseract-OCR _______________________________________________ Cancelar suscripción https://listas.softwarelibre.cu/mailman/listinfo/linux-l Buscar en el archivo http://listas.softwarelibre.cu/buscar/linux-l
