ThinkEPI. Primeros pasos hacía la gestión de datos de investigación en las
universidades: la iniciativa DAF

Daniel Torres-Salinas

Abriendo los cajones de los investigadores

En nuestra anterior entrega Thinkepi hablamos del Data Sharing
(Torres-Salinas, 2009) ofreciendo un brevísimo estado de la cuestión sobre
el asunto y apuntando la preocupación común de agencias, instituciones,
investigadores y documentalistas por el destino final de los datos de
investigación. Como comenta Borgman (2007) el interés de estos agentes
radica en que los datos están empezando a ser valorados como un producto
académico final, podríamos decir que estamos en un momento de puesta en
valor de los datos científicos. Concluíamos aquel texto apuntando que quizás
las bibliotecas universitarias tendrían algo que decir y, en ese punto, me
gustaría retomar el tema.

La custodia a cargo de las bibliotecas de los datos de investigación
generados por nuestros centros es una cuestión que ya introdujo y desarrolló
con acierto Martínez-Uribe (2008) del Oxford e-Research Centre; uno de los
aspectos que se deduce de este trabajo es el carácter emergente de estas
nuevas competencias por lo que aún son escasas las bibliotecas que se hagan
cargo de las mismas. Quizás el problema de muchas de ellas sea la falta de
una hoja de ruta que ayude a los bibliotecarios a afrontar o siquiera
plantearse el problema; sin embargo, para todos aquellos bibliotecarios que
se digan “vale los datos de mis usuarios/investigadores son importantes
¿pero por dónde empiezo?” he de animarles diciéndoles que es una duda común
en la mayor parte de las bibliotecas, incluso en las más punteras.

Justamente en el momento en el que nos encontramos se están lanzando las
primeras propuestas, se están experimentando soluciones y se exploran
metodologías para iniciar este tipo de servicios. Precisamente hace poco
concluyó una iniciativa que supone ese primer paso hacía el cambio (Jones,
2008a), la  Data Audit Framework (DAF). En ella no se plantean empezar a
crear a repositorios de datos sino algo más fácil: ver que esconden nuestros
investigadores en sus cajones  y después con tranquilidad ver cómo podemos
ayudarles a poner orden en los mismos.

Las bibliotecas universitarias y los datos: la iniciativa DAF

No voy a contar aquí en detalle el proyecto DAF ya que toda la información
sobre el mismo está perfectamente organizada en su web1  pero si vamos a
esbozar de que va la historia. Esta iniciativa nace de una necesitad
apuntada por Liz Lyon (2007) en un informe encargado por la Information
Systems Committee (JISC) (Reino Unido) y era la creación de un marco de
trabajo que permitiera a las universidades conocer que datos son generados
por sus departamentos y poner en marcha políticas de sensibilización y
preservación de los mismos.

Ante esta necesidad la misma JISC financia el proyecto DAF liderado por la
Universidad de Glasgow para desarrollar dicha  metodología entre 2008 y 2009
y el pasado octubre se presentó la guía final (JISC, 2009). Básicamente en
sus inicios se plantearon los siguientes objetivos:

• Ver donde se generan los datos, de que tipo son, como se almacenan,
gestionan y comparten
• Identificar problemas: pérdidas, mal uso, localizar datos en riesgo,
formatos desfasados
• Conocer las actitudes de los investigadores a la hora de crear y compartir
datos
• Sugerir mejoras para la gestión de datos

Para llevar a cabo estos objetivos de partida diseñaron una auditoría que
consta de cuatro pasos (Jones, 2008b): planificar la auditorita, identificar
y clasificar los datos, evaluar la importancia de los datos localizados y
finalmente ofrecer unas recomendaciones para implementar una gestión
adecuada. Como en toda auditoría la información se obtiene directamente de
gestores e investigadores a través de encuestas, entrevistas o incluso
revisando los papers producidos por los centros.

Para testear esta metodología se realizaron diferentes auditorías en algunas
universidades (Edinburgh, Bath, Glasgow, King´s College, Southampton y
Oxford) en centros muy concretos con líneas temáticas diversas (geociencias,
arqueología, humanidades, etc...). Al final cada universidad presentó un
informe con los resultados; en ellos se explica cómo seguir mejorando la
metodología pero quizás lo más interesante son algunas de las conclusiones
que se apuntan y que responden preguntas como ¿qué está pasando con los
datos de los investigadores? y ¿qué podemos hacer desde la biblioteca para
empezar a ayudarles?

Respuesta a las preguntas y apuntes finales

Cualquiera que esté un poco introducido en el mundo de la investigación sabe
que ocurre con los datos pero es mejor que los bibliotecarios que han
abierto esos cajones con sus auditorías nos lo cuente (Jones et al., 2008c).
En primer lugar  revelan que no existe una política clara entre los
investigadores de cómo conservar sus datos y que éstos suelen estar
dispersos por CDs, DVDs, discos duros externos, PCs (trabajo y domésticos).
Esto provoca pérdidas irrecuperables y en ocasiones poner en marcha
investigaciones paralelas para localizarlos, identificar la última versión o
encontrar a la persona responsable (que a veces ya no trabaja ni en el mismo
centro). Además los investigadores no utilizan ninguna convención para
denominar a sus archivos, ni crean catálogos de las colecciones de datos y
por supuesto tampoco tienen en cuenta su preservación a largo plazo y aunque
algunos se lo plantean no tienen las herramientas y conocimientos para
atajar el problema.

 Se puede decir que en la actualidad los investigadores gestionan sus datos
de forma casera y fragmentada y los informes de la DAF plantean algunas
acciones básicas; la primera implementar políticas institucionales para la
creación y conservación de datos y acompañar éstas de guías para favorecer
buenas prácticas. Éstas versarían sobre cómo gestionar las diferentes
tipologías de datos, como realizar copias a largo plazo o como crear planes
de gestión de datos; en fin toda una serie de cuestiones que están bien
ejemplificadas en la guía realizada por la Australian National University
(ANU, 2008) dentro de su programa de alfabetización informacional y que nos
da una idea bastante clara de por donde van los tiros. Otra opción que se
propone es formar a los nuevos investigadores en técnicas de gestión de
datos, es decir crear pequeños bibliotecarios amateur. Todo esto no es sino
el paso inicial hacía la creación de repositorios institucionales, no
necesariamente abiertos, para la conservación de los datos de nuestros
investigadores.

Está claro que esta auditoría, de muy bajo coste para las bibliotecas porque
no requiere personal especializado, está aún en un estado muy embrionario
pero hemos querido compartirla porque nos parece muy ilustrativa y bastante
realista de ese primer paso hacia la custodia de los datos por parte de las
bibliotecas. Y efectivamente después llegarán los repositorios y
familiarizarnos más profundamente con términos como e-ciencia o
e-infraestructuras pero primero hay que conocer que ocurre en los despachos
de nuestros centros y aprovechar la oportunidad de participar más
activamente en los problemas diarios de los investigadores. Además,
justamente ahora que se quiere y se busca la excelencia, hay que ser
consciente de que junto a una investigación de excelencia debe fomentarse
también una gestión de los datos excelencia que permita su acceso óptimo y
garanticen su reutilización futura. Creemos que la iniciativa DAF es un buen
ejemplo a imitar en la universidad española.

Referencias:

ANU. Data management manual: managing digital research data at the
Australian National University. 2008. Disponible en:
http://ilp.anu.edu.au/dm/ANU_DM_Manual_v1.03.pdf

Borgman, Christine L.  Scholarship in the digital age: information,
infrastructure, and the Internet. Cambridge, Mass: MIT Press, 2007

JISC. Data Assest Framework: Implementation guide. 2009. Disponible en:
http://www.data-audit.eu/docs/DAF_Implementation_Guide.pdf

Jones, Sarah. “The Data Audit Framework: A first step in the data managment
challenge”. The International Journal of Data Curation, 2008, v. 2, n. 3,
112-120.

Jones, Sarah; Ross Seamus y Raivo Ruusalepp. The Data Audit Framework: a
toolkit to identify research assets and improve data management in research
led institutions. 2008a. Disponible en: http://eprints.gla.ac.uk/6240/

Jones, Sarah; Ekmekcioglu, Cuna; Ball, Alex y Grace, Stephen. Data Audit
Framework lessons learned. 2008b. Disponible en:
http://www.data-audit.eu/docs/DAF_lessons_learned.pdf

Lyon, Liz. Dealing with data: Roles, rights, responsibilities and
relationships consultancy Report. 2007. Disponible en:
http://www.jisc.ac.uk/media/documents/programmes/digitalrepositories/dealing_with_data_report-final.pdf

Martínez-Uribe, Luis; Macdonald, Stuart. “Un nuevo cometido para los
bibliotecarios académicos: data curation”. El profesional de la información,
2008, v. 17, n. 3, mayo-junio, pp. 273-280.

Torres-Salinas, Daniel. Compartir datos (data sharing) en ciencia: el
contexto de una oportunidad. 2009. Disponible en:
http://www.thinkepi.net/compartir-datos-data-sharing-en-ciencia-el-contexto-de-una-oportunidad


Enlaces:

1. http://www.data-audit.eu/index.html


Daniel Torres-Salinas
CIMA, Grupo Ec3, Universidad de Navarra
Miembro del grupo ThinkEPI
[email protected]


----------------------------------------------------
Los archivos de IWETEL  pueden ser consultados en: 
                http://listserv.rediris.es/archives/iwetel.html
----------------------------------------------------

Responder a