Hace ya casi un año que se aprobó la ley que establece la obligación para bibliotecas, museos y archivos de titularidad público de permitir la reutilización de sus datos. A la vista de la norma pueden surgir dudas de diferente índole. ¿Es una obra de arte un dato? ¿Lo es un libro? ¿Qué es un dato? ¿Qué es información? ¿Cómo llegar a los datos abiertos u open data? ¿Open data es sinónimo de reutilización? ¿Qué ventajas, además de cumplir la obligación legal, aporta la reutilización a las instituciones culturales? ¿Es una obligación flexible que puedo adaptar a la estrategia de mi institución?
Partiendo de la digitalización
La catalogación informatizada y la digitalización son los pilares de la gestión de las instituciones culturales que llevan muchos años y muchos recursos invertidos en organizar su información para poder compartirla, al principio internamente y hoy en su mayoría a través de sus webs o servicios y contenidos digitales (buscadores, proyectos conjuntos con otras instituciones, aplicaciones para móviles, interactivos en salas, audiovisuales, etc.). Los avances en este sentido han ido a distintos ritmos y las bibliotecas han liderado la informatización en parte gracias a su mayor estandarización. Archivos y museos, por las características de sus fondos, han sido más lentos en arrancar pero la normalización ya está consolidada y su adopción en marcha.
La reutilización de datos y el Open Data
La reutilización de la información del sector público responde a la creencia de que los datos que las Administraciones Públicas poseen o recogen, y que ya han sido financiados con el dinero del contribuyente, pueden tener una segunda vida en el sector privado en manos tanto de ciudadanos como de empresas. Los datos meteorológicos son el ejemplo clásico para entender esta filosofía puesto que los datos recogidos por los satélites no pueden ser costeados por todos aquellos que ofrecen servicios de previsión meteorológica.
El fomento de esta reutilización responde a un doble objetivo. Uno de carácter social y político, al promover la reutilización se está también favoreciendo la transparencia del sector público. El otro de carácter económico, ya que se considera que la información del sector público supone un potencial de generación de riqueza, un planteamiento pragmático que no se entiende bien ni se comparte desde un enfoque más altruista, especialmente en el ámbito cultural ((Henninger, Maureen (2013). The Value and Challenges of Public Sector Information. Cosmopolitan Civil Societies: An Interdisciplinary Journal, vol. 5, núm. 3, pp. 75-95. https://epress.lib.uts.edu.au/journals/index.php/mcs/article/download/3429/3851)).
El concepto más amplio de Open Data, la puesta a disposición de los datos ((Se pueden encontrar ejemplos en: http://datos.gob.es)) una forma que haga factible, en su caso, la reutilización automática de la información ha sido posible gracias a la web semántica impulsada por el W3C, el World Wide Web Consortium, desde los años 90. El W3C ha desarrollado un método de publicación de datos estructurados e interoperables que permite la consulta de datos de diferentes fuentes, conocido como Linked Data. La aplicación de tecnologías web estándar como el HTTP, RDF y URI aplicadas al ámbito cultural en sentido amplio, LAM (libraries, archives, museums), ha dado lugar al LODLAM o datos enlazados abiertos para bibliotecas, museos y archivos. La adopción de estos métodos en proyectos como Europeana ha permitido no sólo relacionar los metadatos de sus colecciones con otras fuentes de información sino también permitir la reutilización de la información por terceros.
Volvamos a algunas de las preguntas del principio.
¿Qué entendemos por datos, la traducción del término data en inglés?
Un dato representa cualquier información concreta sobre hechos, elementos, etc., que permite estudiarlos, analizarlos o conocerlos. Por lo tanto, no nos referimos, en lo que se refiere a las instituciones culturales, tan sólo a la obra o libro, al contenido o a la información que se suele hacer accesible a través de la página web o los catálogos, sino también a los metadatos. Por tanto las instituciones culturales no pueden limitarse a poner en valor sus contenidos digitalizados sino que necesitan prepararlos para permitir su reutilización.
Cómo llegar a la apertura de datos: del Linked Data al Linked Open Data
La representación de los datos ((Según el Esquema de Desarrollo de 5 estrellas de Datos Abiertos ideado por Tim Berners-Lee http://5stardata.info/es)) en Linked Data es en muchos casos el primer paso para preparar la información y poder abrirla. Proyectos como la nueva web del Museo del Prado, son un ejemplo de datos enlazados internamente que ofrecen un potencial de búsqueda enorme pero que todavía no permiten al usuario descargarlos y reutilizarlos con otros datos.
Aunque técnicamente existen varias cuestiones que no vamos a tratar en este post, la completa apertura de datos consiste en la publicación de los datos mediante una licencia abierta o que permita la reutilización (OL Open License), en datos estructurados o machine-readable (RE readable), en formatos no propietarios (OF open format), ubicados en URIs (para permitir una identificación estándar y unívoca) y por último enlazados (Linked Data para asegurar su integración en la web), tal y como se muestra en la figura.
¿Open Data es sinónimo de reutilización?
El Open Data va más allá del mínimo que la normativa española exige para entender cumplida la exigencia de permitir la reutilización de la información del sector público.
No obstante, el Open Data permite el establecimiento de estrategias para:
- Reducir los costes de atender a las solicitudes de reutilización.
- Incrementar la visibilidad de la institución.
- Reforzar la presencia en Internet de la institución y de sus contenidos.
- Cumplir de una manera más amplia el cometido de las instituciones culturales públicas de hacer accesible sus contenidos a investigadores y el público en general.
- Mejorar la gestión interna de la institución, tanto por la optimización de los procesos internos como por favorecer la toma de decisiones con información más precisa y completa.
- Avanzar de forma significativa en la investigación y conocimiento de los fondos de la entidad.
Este interesante post de A. Ledesma y L. Burgin hace un repaso de estas cuestiones en el ámbito de los museos y ofrece un ejercicio práctico sobre posibles explotaciones en relación a la API de los Museos de Arte de Harvard.
¿Qué ventajas además de cumplir la obligación legal aporta la reutilización a las instituciones culturales? ¿Es una obligación flexible que puedo adaptar a la estrategia de mi institución?
En el establecimiento de estas estrategias, no es un tema menor el de la elección de las licencias bajo las cuales se permitirá el uso de la información. En el ámbito cultural no existe unanimidad aunque algunos intenten restringir los proyectos de open data a aquellos cuyos datos están sometidos a licencias como la licencia CC0 o Public Domain Mark. Hay que tener en cuenta que no todas las legislaciones nacionales en materia de propiedad intelectual permiten someter los datos culturales a dichas licencias más abiertas. El reconocimiento y el uso no comercial en muchos casos se considera un límite bastante razonable y conciliable con la reutilización, aunque no siempre tiene por qué ser el más óptimo.
En este contexto, desde SEDIC estamos ofreciendo cursos en línea y cursos a medida para instituciones culturales ya que el tema es complejo pero requiere ser abordado desde un punto de vista no sólo técnico, sino también estratégico para que toda la organización entienda las implicaciones.
Próximamente tendrá lugar en Madrid la Conferencia Internacional de Datos Abiertos (6 y 7 de octubre de 2016), conocida como IODC. SEDIC está involucrada, junto a la Biblioteca Nacional de España y Red.es, en la organización de un pre-evento centrado en los datos culturales en abierto y su reutilización que tendrá lugar en la Biblioteca Nacional en Madrid el 5 de octubre y que tratará cuestiones y retos en torno a este tema.
[molongui_author_box author=»89″]
ISABEL PEREZ CORRALEJO: El Programa APORTA de la Administración General del Estado lleva años funcionando con estas premisas. A nivel local aun estamos empezando. Habría que analizar todo lo relativo a autoría y privacidad.