2010/5/25 Rafael Olaechea <[email protected]>: > Hola, > Estuve buscando una solucion open source para leer información > programaticamente (para hacer busquedas estructuradas en cientos de > archivos semejantes) y consulté lucene/solr, que a su vez utiliza el > projecto http://poi.apache.org/hwpf/quick-guide.html para jalar información > de los documentos de word. > Sin embargo este proyecto aún esta en modo experimental segun ellos mismos, > conocen de algun otro producto open source para leer documentos de word > programaticamente ? han tenido alguna experience con lucene/solr para > busqueda dentro de documentos de word que puedan compartir ? > Se que MS SQL tiene sus propios "filtros" para sacar palabras de word pero > no quiero usar windows en este proyecto. > Saludos, > Rafael
Hola Rafael, aquí dan varias opciones: http://stackoverflow.com/questions/685533/python-convert-microsoft-office-docs-to-plain-text-on-linux Saludos -- Linux Registered User # 386081 A menudo unas pocas horas de "Prueba y error" podrán ahorrarte minutos de leer manuales. _______________________________________________ Lista de correo Linux-plug Temática: Discusión general sobre Linux Peruvian Linux User Group (http://www.linux.org.pe) Participa suscribiéndote y escribiendo a: [email protected] Para darte de alta, de baja o hacer ajustes a tu suscripción visita: http://voip2.voip.net.pe/mailman/listinfo/linux-plug IMPORTANTE: Reglas y recomendaciones http://www.linux.org.pe/listas/reglas.php http://www.linux.org.pe/listas/comportamiento.php http://www.linux.org.pe/listas/recomendaciones.php
