Источник - http://www.linux.org.ru/news/opensource/5404088

Tesseract 3.00 -- новая версия ПО для оптического распознавания текста

   Программисты компании Google выпустили третью версию Tesseract, системы
   оптического распознавания текста.

   В новой версии добавлена поддержка множества языков, включая русский.

   В числе прочих изменений:
     * добавлен новый модуль анализа структуры документа;
     * добавлена поддержка формата HOCR;
     * библиотека Leptonica стала основной для работы с изображениями;
     * переписан код для работы с неоднозначно распознанными символами;
     * удалена поддержка VC++6.

   Загрузить можно [20]здесь.

   >>> [21]Подробности

   Метки: [22]google, [23]ocr, [24]tesseract

References

  20. http://code.google.com/p/tesseract-ocr/downloads/list
  21. http://groups.google.com/group/tesseract-ocr/msg/f240b6c7c5afa08b
  22. http://www.linux.org.ru/view-news.jsp?tag=google
  23. http://www.linux.org.ru/view-news.jsp?tag=ocr
  24. http://www.linux.org.ru/view-news.jsp?tag=tesseract

-- 
Дмитрий Падучих
-- 
Blinux-rus mailing list
Blinux-rus@lists.a11ywiki.org
http://www.a11ywiki.org/cgi-bin/mailman/listinfo/blinux-rus

Ответить