Mmmmm...

- ¿Qué gestor de contenidos usáis?
- ¿Cuánto tráfico soporta vuestra web? (si hay mucho tráfico, quizá no sólo
tengáis que preparar el software, sino además un servidor para el buscador)
- ¿Qué volumen de pdfs tratáis, cientos, miles, ...?
- ¿Usáis un software diferente del gestor de contenidos para el control del
vocabulario?
- Las alertas llegarán a su correo electrónico, ¿verdad?
- ¿A cada usuario le llegarían alertas distintas, personalizadas? ¿O son las
mismas para todos?
- ¿Haríais un paquete de queries / búsquedas para un usuario, de forma que
las eligiera él?
- ¿O de cada resultado de cada query enviáis una alerta distinta, para ese
usuario?
- ¿O definís vosotros qué se envía a quién, o a quiénes?
- ¿Cada cuánto se enviaría, cada vez que haya un resultado nuevo, cada día,
cada semana...?
- Si es cada vez que haya un resultado nuevo, el sistema debe eliminar los
resultados que ya se han enviado a ese usuario, y sólo darle las novedades?
- ¿Cuán flexible queréis que sea la búsqueda? (es decir, queréis que el
sistema os reporte lo que hay sobre ese término, pero porque lo habéis
clasificado previamente así, y sobre todos los conceptos relacionados o
jerárquicamente por debajo, o que encuentre la palabra en el texto completo,
o que además use sinónimos o conceptos relacionados que no están
predefinidos en vuestro control del vocabulario, o...)
- ¿Trabajaría en idiomas también? ¿De forma conjunta o por separado? Es
decir, vuestro control llega a establecer equivalencias en idiomas, de forma
que si le pido "libros", también me da lo que haya incluido bajo "books"...

Todo depende de si te sirve lo que te ofrezcan por defecto los programas que
evalúes, o quieres algo más "personalizado".

Y por recomendarte gente, llama a http://www.bitext.com/ES/index.html

Saludos,

-- 
Jorge Serrano-Cobos
http://www.masmedios.com

Social:
http://es-es.facebook.com/jorgeserrano
http://www.linkedin.com/in/jorgeserranocobos
http://www.google.com/profiles/jorgeserrano
http://www.thinkepi.net

Personal:
http://twitter.com/serranocobos
http://trucosdegoogle.blogspot.com



2010/6/8 Myriam Martinez <[email protected]>

> Hola a todos,
>
> En nuestra editorial queremos iniciar un proyecto
> piloto para poderlo aplicarlo en nuestra web, básicamente sería la
> opción de búsquedas automáticas sobre pdfs. Es decir, establecer
> mediante lenguajes controlados búsquedas de contenidos, en este caso
> pdfs, donde a través de alertas avisemos a nuestros usuarios de los
> nuevos contenidos con esas búsquedas predeterminadas. Estás serían
> predefinidas previamente por nosotros.
>
> Me han remitido a la
> herramienta de minería de datos linguísiticos Xerka(
> http://www.diana-teknologia.com/www1/espanol/xerka.htm), y estamos viendo
> otras, ¿nos podríais orientar o sugerir otras?,
> incluso proyectos similares?.
>
> Muchas gracias a todos,
>
> Myriam Martínez San Emeterio
> Departamento de Documentación
> Grupo
> TecniPublicaciones
>
>
>
>
>
> ----------------------------------------------------
> Los archivos de IWETEL  pueden ser consultados en:
>                http://listserv.rediris.es/archives/iwetel.html
> ----------------------------------------------------
>


----------------------------------------------------
Los artículos de IWETEL son distribuidos gracias al apoyo y colaboración 
técnica de RedIRIS - Red Académica española - (http://www.rediris.es)
----------------------------------------------------

Responder a