El 24 de mayo de 2010 14:04, Chema Cortes <pych...@gmail.com> escribió:

> El día 24 de mayo de 2010 09:35, matt ledding <m...@fifthbiz.com>
> escribió:
>
> > Probablemente hay mejores soluciones por gente más puesto que yo, pero
> otra
> > manera de extraer el texto de archivos PDF es llamar al comando de Linux
> > "pdftotext" y usar el output.  No muy elegante, pero es un apaño...
>
> Al menos ésa es la solución empleada por plone3 para indexar pdfs, por
> lo que sospecho que no hay mucho más dónde elegir.
>
> La utilidad "pdftotext" se instala junto con poppler-utils
> (preferible) y con xpdf.
> _______________________________________________
> Python-es mailing list
> Python-es@python.org
> http://mail.python.org/mailman/listinfo/python-es
> FAQ: http://python-es-faq.wikidot.com/
>

Hay algo que no entiendo ¿porqué dais por hecho que utiliza Linux? En el
mensaje original no dice nada de nada.


Salut


--
_______________________________________________
Python-es mailing list
Python-es@python.org
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/

Responder a