Olá, pessoal. Alguém já usou OCR dentro do Plone? Eu tenho alguns documentos em PDF que são imagens (e não texto), mas que possuem texto na forma de imagens. Gostaria que os tipos de conteúdo que estão armazenando esses PDFs, pudessem ter o texto da imagem indexado pela busca do Plone. É aí
Eu ja fiz busca em conteudo de PDFs mas no com OCR, apenas extraindo o
texto do PDF mesmo.
No seu caso, acho mais fcil voc fazer uma tool para extrair as
imagens do documento PDF primeiro
e depois aplicar alguma ferramenta de OCR em cima das imagens mesmo
resultando em um arquivo texto.
Vlw