Mmmmm... - ¿Qué gestor de contenidos usáis? - ¿Cuánto tráfico soporta vuestra web? (si hay mucho tráfico, quizá no sólo tengáis que preparar el software, sino además un servidor para el buscador) - ¿Qué volumen de pdfs tratáis, cientos, miles, ...? - ¿Usáis un software diferente del gestor de contenidos para el control del vocabulario? - Las alertas llegarán a su correo electrónico, ¿verdad? - ¿A cada usuario le llegarían alertas distintas, personalizadas? ¿O son las mismas para todos? - ¿Haríais un paquete de queries / búsquedas para un usuario, de forma que las eligiera él? - ¿O de cada resultado de cada query enviáis una alerta distinta, para ese usuario? - ¿O definís vosotros qué se envía a quién, o a quiénes? - ¿Cada cuánto se enviaría, cada vez que haya un resultado nuevo, cada día, cada semana...? - Si es cada vez que haya un resultado nuevo, el sistema debe eliminar los resultados que ya se han enviado a ese usuario, y sólo darle las novedades? - ¿Cuán flexible queréis que sea la búsqueda? (es decir, queréis que el sistema os reporte lo que hay sobre ese término, pero porque lo habéis clasificado previamente así, y sobre todos los conceptos relacionados o jerárquicamente por debajo, o que encuentre la palabra en el texto completo, o que además use sinónimos o conceptos relacionados que no están predefinidos en vuestro control del vocabulario, o...) - ¿Trabajaría en idiomas también? ¿De forma conjunta o por separado? Es decir, vuestro control llega a establecer equivalencias en idiomas, de forma que si le pido "libros", también me da lo que haya incluido bajo "books"...
Todo depende de si te sirve lo que te ofrezcan por defecto los programas que evalúes, o quieres algo más "personalizado". Y por recomendarte gente, llama a http://www.bitext.com/ES/index.html Saludos, -- Jorge Serrano-Cobos http://www.masmedios.com Social: http://es-es.facebook.com/jorgeserrano http://www.linkedin.com/in/jorgeserranocobos http://www.google.com/profiles/jorgeserrano http://www.thinkepi.net Personal: http://twitter.com/serranocobos http://trucosdegoogle.blogspot.com 2010/6/8 Myriam Martinez <[email protected]> > Hola a todos, > > En nuestra editorial queremos iniciar un proyecto > piloto para poderlo aplicarlo en nuestra web, básicamente sería la > opción de búsquedas automáticas sobre pdfs. Es decir, establecer > mediante lenguajes controlados búsquedas de contenidos, en este caso > pdfs, donde a través de alertas avisemos a nuestros usuarios de los > nuevos contenidos con esas búsquedas predeterminadas. Estás serían > predefinidas previamente por nosotros. > > Me han remitido a la > herramienta de minería de datos linguísiticos Xerka( > http://www.diana-teknologia.com/www1/espanol/xerka.htm), y estamos viendo > otras, ¿nos podríais orientar o sugerir otras?, > incluso proyectos similares?. > > Muchas gracias a todos, > > Myriam Martínez San Emeterio > Departamento de Documentación > Grupo > TecniPublicaciones > > > > > > ---------------------------------------------------- > Los archivos de IWETEL pueden ser consultados en: > http://listserv.rediris.es/archives/iwetel.html > ---------------------------------------------------- > ---------------------------------------------------- Los artículos de IWETEL son distribuidos gracias al apoyo y colaboración técnica de RedIRIS - Red Académica española - (http://www.rediris.es) ----------------------------------------------------
