El 29/08/08, L. Paz <[EMAIL PROTECTED]> escribió: > Hola. > > Expongo mi problema. > Necesitaría que me recomendarais un programa/utilidad que permitiera > la indexación del contenido de varios directorios residentes en varias > particiones de varios discos duros de un servidor. Estos directorios > contienen colecciones de ficheros en varios formatos. La mayor parte > -más de un 95%- son ficheros de texto (ascii crudo, documentos de > varias versiones del viejo WordPerrect, documentos de casi todas la > versiones de MsWord, pdf, odt). También hay algunas ficheros de > presentaciones, hojas de calculo, sonido y video. Son ficheros > generados desde mediados de los 80, que estaban dispersos por > diferentes servidores y que estamos tratando de reunir en una sola > máquina para construir una especie de archivo digital. Se trata de > unos 310.000 archivos y, por supuesto, no tenemos recursos para darles > ningún tratamiento documental (p.ej., asignarles metadatos), > organizarlos en colecciones y contruir un repositorio digital al > estilo de los gestionados por DSpace, CDS-Invenio, Archon y similares. > Lo que buscamos es una herramienta que nos permita realizar búsquedas > de texto en el título y/o contenido de los ficheros (para los de > sonido y video, me conformaría que los localizara por el título) y que > tuviera una interfaz de interrogación/presentación de resultados lo > más amigable posible para usuarios finales (no informáticos, ni > documentalistas). Los ideal sería que las consultas se pudieran > realizar a través de una página web. > el único que conozco para eso es htdig, hasta donde recuerdo, no era complicado de instalar y configurar... aunque lo hice hace varios años. Al menos te serviría para los archivos de texto plano, no me acuerdo si podía buscar dentro de los binarios (.doc y esas cosas)... aunque eso ya te toca investigarlo a vos ;-)
-- http://fishblues.blogspot.com/ http://gonzalor.blogspot.com/ Yo estoy en forma: redondo es una forma! :D

