Ante todo querría felicitar a Karibel Pérez y Eugenia Serra y a todos los que
han participado en el informe Repositori de preservación digital de la
Biblioteca de Catalunya por haber dado a conocer este excelente proyecto que
supone una actualización importante de PADICAT.
No puedo evitar recordar las jornadas dedicadas a La preservación del
patrimonio digital: conceptos básicos y principales iniciativas que tuvieron
lugar en marzo de 2006, es decir hace 4 años, cuando Eugenia Serra presentó el
proyecto PADICAT [http://www.mcu.es/bibliotecas/CE/jppd/index.htm]. También en
aquella ocasión se presentaron proyectos como la Biblioteca Digital Hispánica o
el Directorio y Recolector de Colecciones Digitales, todos los cuales han
experimentado muy importantes variaciones, algunas incluso de nombre pues el
Directorio se denomina ahora Hispana y ha pasado de recoger 55 colecciones
digitales a 516 y de 25 repositorios OAI a 142. El crecimiento de objetos
digitales es aún más asombroso: de 119.014 a 2.591.735. Son cifras de hoy
mismo.
Recuerdo perfectamente que en el turno de preguntas de aquellas históricas
jornadas y tras escuchar a mi querida amiga Eugenia Serra le pregunté acerca de
si el proyecto PADICAT iba a seguir los estándares internacionales de
preservación digital, fundamentalmente PREMIS y OAIS. Y también recuerdo
perfectamente que Eugenia me confirmó que los estándares que yo había
mencionado se acabarían aplicando en PADICAT. Ahora casi cinco años después
podemos comprobar que efectivamente es cierto y no cabe sino felicitar a la
Biblioteca de Cataluña y a las autoras en particular por haber llevado a buen
puerto esa iniciativa ajustada a los estándares internacionales.
Sin embargo, se me permitirá que haga algunas críticas al proyecto desde un
punto de vista técnico y en aras de conseguir que esta iniciativa, que puede
ser modelo de algunas otras, se adecue verdaderamente a los modelos definidos
internacionalmente, pues en mi opinión tiene algunas carencias de cierta
importancia que deberían tenerse en cuenta para irlas resolviendo.
Puede apreciarse por la lectura del documento que el modelo que se está
construyendo intenta no hacer muy compleja la gestión de los diferentes tipos
de metadatos. Quizás en aras de esta simplificación y para evitar redundancias,
según se dice, se va a optar por reducir los metadatos descriptivos al mínimo.
Yo echo a faltar que no se haya considerado también la preservación de estos
metadatos que creo que es la primera acción de preservación ya que suponen la
correcta descripción del objeto intelectual que se quiere preservar. No voy a
extenderme, pero es conocido con qué frecuencia las descripciones de
publicaciones periódicas, sobre todo diarios, sufren modificaciones a medida
que se van analizando, organizando y completando como resultado del proceso de
digitalización y como esto da lugar a numerosos cambios en la descripción. Otro
tanto ocurre con documentos complejos como las páginas web o con documentos
sonoros y audiovisuales que se manifiestan en multitud de versiones. Puede
aducirse que en tiempos de cambios en las reglas de catalogación es mejor optar
por asociar únicamente un identificador, pero mucho me temo que en unos años,
si no es así ya, el meollo de la recuperación de información, lo cual afecta
indudablemente también a los sistemas de preservación digital, esté en la
descripción correcta de versiones. En mi opinión falta, pues, un sistema de
gestión de metadatos descriptivos completos y, sobre todo, un mecanismo de
conexión e intercambio de metadatos con el catálogo bibliográfico de la
Biblioteca de Cataluña que ya dispone de esas descripciones. Y viceversa, sería
muy interesante que el catálogo bibliográfico de la Biblioteca de Cataluña
ofreciera información pública de los ejemplares digitales que preserva. Es
decir, es recomendable una mayor permeabilidad e interoperabilidad entre los
distintos repositorios y catálogos que van a conformar el sistema, máxime si
pertenecen a una única institución, lo cual redundará además en una
simplificación de las tareas de catalogación y mantenimiento. Por otra parte,
el mantenimiento de repositorios y catálogos con descripciones duplicadas y
hasta triplicadas es insostenible a la larga y este coste debe considerarse a
efectos de su mayor facilidad o dificultad de preservación.
Se menciona el uso de Dublin Core como metadatos descriptivos, aunque me ha
parecido que no detalla si se trata de los quince elementos básicos o de DC
cualificado. Esto podría explicar la necesidad de optar por crear elementos
propios del sistema, no normalizados, sobre todo para el uso de
identificadores. Sin embargo, creo que, como se pretende, para garantizar el
futuro mantenimiento cooperativo del sistema hubiera sido más adecuado utilizar
un esquema de metadatos más complejo como MARC 21 (en uso en la Biblioteca de
Cataluña y en el CCUC) o incluso MODS (sobre todo por