2010/5/25 Rafael Olaechea <[email protected]>:
> Hola,
> Estuve buscando una solucion open source para leer información
> programaticamente (para hacer busquedas  estructuradas en cientos  de
> archivos semejantes) y consulté lucene/solr, que a su vez utiliza el
> projecto http://poi.apache.org/hwpf/quick-guide.html para jalar información
> de los documentos de word.
> Sin embargo este proyecto aún esta en modo experimental segun ellos mismos,
> conocen de algun otro producto open source para leer documentos de word
> programaticamente ? han tenido alguna experience con lucene/solr para
> busqueda dentro de documentos de word que puedan compartir ?
> Se que MS SQL tiene sus propios "filtros" para sacar palabras de word pero
> no quiero usar windows en este proyecto.
> Saludos,
> Rafael

Hola Rafael, aquí dan varias opciones:
http://stackoverflow.com/questions/685533/python-convert-microsoft-office-docs-to-plain-text-on-linux

Saludos
-- 
Linux Registered User # 386081
A menudo unas pocas horas de "Prueba y error" podrán ahorrarte minutos
de leer manuales.
_______________________________________________
Lista de correo Linux-plug
Temática: Discusión general sobre Linux
Peruvian Linux User Group (http://www.linux.org.pe)

Participa suscribiéndote y escribiendo a:  [email protected]
Para darte de alta, de baja  o hacer ajustes a tu suscripción visita:
http://voip2.voip.net.pe/mailman/listinfo/linux-plug

IMPORTANTE: Reglas y recomendaciones
http://www.linux.org.pe/listas/reglas.php
http://www.linux.org.pe/listas/comportamiento.php
http://www.linux.org.pe/listas/recomendaciones.php

Responder a