Transformación Digital: Open/Linked Data

Javier Espadas Bardón
Jefe de Tecnología
Museo Thyssen-Bornemisza
jespadas@museothyssen.org

Que las instituciones culturales deben subirse al carro de las nuevas tecnologías, que están obsoletas y otras afirmaciones son habituales cuando se habla del futuro del sector cultural. Sin embargo, analizando sin prejuicios la presencia online de las principales instituciones culturales podemos concluir que todas ellas han participado y participan activamente en el mundo digital al mismo ritmo que empresas o instituciones de otros sectores como: medios de comunicación, banca y finanzas, seguros, retail, ocio, turismo, etc.

A lo largo de sus muchos años de trayectoria, las instituciones culturales han acumulado una enorme experiencia digital, han atesorado un gran conocimiento, han incorporado nuevas capacidades, han desarrollado sus redes sociales, también han sufrido reveses de los que han aprendido y lo más importante, continúan en la brecha trabajando en el campo digital a pesar de las dificultades derivadas de una crisis una económica generalizada.

Es evidente que los cambios que se están produciendo en gran medida asociados a la tecnología suponen un riesgo y un reto, pero a la vez dibujan un escenario con inmensas oportunidades que las instituciones culturales deberían afrontar mediante un proceso de transformación digital.

Algunas de las instituciones de referencia a nivel mundial ya han iniciado este proceso de transformación digital marcando un camino a seguir que incluye, entre otras tendencias, las siguientes: centrar el foco en el visitante, ofrecer servicios y contenidos previos a la visita, personalizar contenidos, concebir al usuario como creador de contenidos, georeferenciación de contenidos y del usuario, realidad aumentada, entornos de juego, entornos de colaboración, conversación, contextualización de contenidos, redes sociales, extensión de la relación más allá de la visita, programas de fidelización, aplicaciones móviles, crowdfunding, comercio electrónico, servicios B2B dirigidos a profesionales y estrategias de Open Data/Linked Data.

Open Data/Linked Data

Aunque el concepto de “Open Data” no es nuevo, en los últimos años es una de las tendencias de mayor relevancia en especial con el lanzamiento de iniciativas nacionales y transnacionales como el agregador Europeana siguiendo las iniciativas del Public Sector Information Group creado por la comisión europea en 2002. Se trata de una de las principales líneas de trabajo de la agenda digital de la Comisión Europea que apuesta de forma clara por la explotación de los datos elemento fundamental para todos los sectores económicos no solo el digital.

El principal objetivo de estas iniciativas es la creación de grandes repositorios de contenidos/datos y su apertura a otras instituciones e iniciativas privadas para el desarrollo de un nuevo sector económico basado en los datos.

Podemos encontrar algunos proyectos destacables de datos en Museos e instituciones culturales como: Rijksmuseum, Museo del Prado, Powerhouse Museum, British Museum, Biblioteca Nacional de Francia, Biblioteca Nacional de España, Getty Foundation, Smithsonian, Europeana, DbPedia, Hispana.

Pero más allá de las experiencias destacables o de las ventajas que pueda tener una estrategia de datos abiertos, existe una obligación legal marcada por la directiva 2013/37/UE de la Unión Europea cuya transposición a la legislación española se realizó en diciembre de 2015.

Los datos enlazados y abiertos años presenta un nuevo estadio evolutivo de Internet que ha pasado de ser una red de documentos enlazados a una red de datos enlazados. Incorporar los contenidos de las instituciones culturales a esta enorme red de datos supone, en mi opinión, un gran reto pero a la vez abre un escenario nuevo en el que las instituciones cuenta con la gran ventaja competitiva de las capacidades y amplia experiencia de sus equipos en la creación de contenidos que podrán acceder a un catálogo casi infinito de contenidos multiformato procedente de otras instituciones.

Web semántica, datos enlazados o datos abiertos son términos básicos, no siempre claros, que deben ser entendidos para establecer una estrategia de datos abiertos.

Web semántica

El concepto de web semántica fue utilizado por primera vez por Tim Berners-Lee en el año 2001. La web semántica considera la idea de establecer relaciones entre datos a las que añadir metadatos de forma que las relaciones, que no son un simple enlace, describen de manera formal el contenido y la relación de los datos enlazados.

Para poder representar estas relaciones entre datos, la web semántica hace uso de estándares como Resource Description Framework RDF, Ontology Web Languaje OWL, Dublin Core y ontologías como Europeana Data Model EDM o CIDOC CRM. El foco en los sistemas automáticos más que a las personas es una de las claves de un modelo de datos enlazados que es viable gracias al uso de estos estándares para representar los datos.

Datos enlazados

Los Datos Enlazados son un método de publicación de datos en formato RDF a través del protocolo http de que permite su navegación mediante enlaces por hyperdata lo que en términos de documentos denominamos hyperlinks. La principal referencia de datos abiertos es la DBPedia.

Datos abiertos

Datos abiertos hace referencia a la disponibilidad de los datos sin restricciones de forma que sean accesible para cualquier persona o máquina sin coste y con una licencia poco restrictiva, preferiblemente Public Domain o CC0.

Es relevante destacar que no todos los datos abiertos son datos enlazados al no estar presentados siguiendo los estándares semánticos adecuados.

Cuando se analiza muchas de las iniciativas de instituciones culturales es evidente que aun siendo datos enlazados no son abiertos. De nuevo Tim Berners-Lee propone el siguiente sistema para establecer el grado de apertura de los datos:

Adoptar estrategias de datos abiertos y su re-utilización es sin duda uno de los grandes retos de transformación a los que las instituciones culturales deben enfrentarse, un reto que sin duda supone también una gran oportunidad para la difusión de sus patrimonio y la aproximación a nuevas audiencias a nivel global.

Camino del Museo Thyssen-Bornemisza hacia los datos abiertos

El camino del Museo Thyssen-Bornemisza hacia los datos abiertos se inicia en el año 2014 tras la invitación de Europeana a incorporar su catálogo de obras y su publicación en Europeana.org.

Incorporación a Europeana

El primer reto consistió en tener una descripción clara del contenido que el Museo debía suministrar a Europeana como entrada de su proceso de recolección de datos. Tras diversas reuniones con otras instituciones se identificó que disponer de un servicio OAI-PMH era esencial y la única forma de suministrar datos a Europeana. Por lo tanto, disponer de este servicio fue el primer objetivo.

Lamentablemente, el coste de implantación de este servicio OAI-PMH y la adaptación del software actualmente utilizado por los departamentos de conservación era demasiado alto y excesivamente complejo.

Nuestra reflexión fue, suministrar un catálogo de obras en un formato estándar XML a Europeana no debería ser tan complejo. Trabajando estrechamente con los responsables de recolección de datos de Europeana y la ayuda de expertos del Rijskmuseum finalmente definimos un documento de trabajo con los datos y formatos que el Museo debería suministrar.

Como alternativa a disponer de un servicio OAI-PMH se desarrolló un sencillo servicio web que obtenía el catálogo de las obras de la BD de la web www.museothyssen.org y generaba un fichero XML con el formato necesario. Este servicio ofrece no sólo los metadatos de las obras y los artistas sino también referencias a las imágenes y páginas relacionadas en el sitio web del Museo.

En el siguiente esquema se recoge el servicio que presta el web service desarrollado.

Evidentemente, los datos alojados en la BD WEB son actualizados periódicamente con datos procedentes de otras bases de datos gestionadas por los conservadores del Museo.

Utilizando este sencillo servicio web Europeana incorporó si mayor problema 500 de las principales obras de las colecciones del Museo en octubre de 2015.

Licencias

Abrir los contenidos, compartirlos no significa perder el control, es necesario gestionar las licencias de uso de forma que sea compatible su re-utilización con los intereses generales de cada institución. Respecto a este punto es clave diferenciar entre la licencia que se aplica a los metadatos de los que se aplican a las imágenes y otros contenidos multimedia.

El problema es que no siempre queda claro la diferencia entre que es metadato y que es contenido. Tan sólo dos sencillos ejemplos para ilustrar este problema, ¿Son metadatos o contenidos los siguientes textos?:

  • Textos largos que describen las obras de arte y que aunque su formato pueda parecer sencillo, es un fichero de texto, exigen un trabajo muy arduo y especializado por parte de los equipos de conservación.
  • Textos cortos como las etiquetas iconográficas que requieren de nuevo un gran esfuerzo por parte de profesionales muy especializados.

Los metadatos de las obras del Museo Thyssen-Bornemisza incorporadas a Europeana fueron publicados bajo una licencia Creative Commons CC0 1.0 Universal Public Domain Dedication. Esta es la licencia estándar de Europeana aplica a los metadatos.

Aunque inicialmente la licencia aplicada a las imágenes fue CC By-NC Atribution-Non Commercial, finalmente se aplicó la licencia de libre acceso.

Como en otros muchos ámbitos de la gestión cultural, las licencias de uso y la gestión de derechos es un tema candente que deberá evolucionar en los próximos años o supondrá un lastre para la incorporación de las instituciones a agregadores de contenidos como Europeana.

Siguientes pasos

A partir de esta primera experiencia con Europeana el Museo está trabajando en el desarrollo de una estrategia de datos abiertos y enlazados estructura en 4 líneas de trabajo:

  • Formación: Es fundamental formar y mejorar el conocimiento de los profesionales de la institución sobre los datos abiertos y enlazados: los modelos semánticos, ontologías, aspectos legales, aspectos técnicos, etc.
  • Definición de un modelo de datos semántico: Crear nuevos formatos para disfrutar de contenidos culturales no será posible sin organizar los datos en base a un modelo semántico con un vocabulario bien definido que permita establecer relaciones entre entidades de la misma institución pero también relaciones con repositorios de terceros como la DbPedia.
  • Optimización y enriquecimiento: Los datos que habitualmente son gestionados por aplicaciones no semánticas deben ser adaptados al modelo semántico. Datos básicos como las fechas, técnicas, referencias geográficas y otros deben ser revisados y normalizados. Adicionalmente los datos debería enriquecerse con etiquetas basadas en ontologías y vocabularios estandarizados. Algunos ejemplos de este proceso de enriquecimiento son el etiquetado de obras relacionado con: la iconografía, los estilos o las relaciones entre artistas.
  • Nuevos Servicios: Una vez los datos han sido optimizados y ampliados, será el momento de diseñar y desarrollar nuevos servicios, comenzando por un buscador facetado de uso interno, dirigidos tanto a la propia institución como a sus visitantes.

Aunque aún quedan muchos aspectos por concretar sobre cómo debe ser la presencia de una institución cultural en la Internet de los datos mi recomendación es adoptar el mismo rol de explorador que con los primeros sitios web, las redes sociales o las aplicaciones digitales. Todas ellas tendencias a las que las instituciones culturales se han incorporado de forma exitosa. El tiempo hablará y en unos años veremos resultados pero para que no quede todo en un alarde tecnológico las instituciones debería reflexionar sobre nuevas experiencias basadas en contenidos digitales y plantearse dos preguntas: ¿Qué experiencias nuevas se pueden crear utilizando contenidos/datos de diversas fuentes?, ¿Quién puede crear estas experiencias (la institución, otras instituciones, empresas, los usuarios) ?

Categorías

2 Comentarios

  1. Excelente síntesis, no de un concepto, sino de todo un universo: la transformación digital. Muchos tipos de cambios que se van a producir y que afectan a las instituciones culturales, sin duda. Intentaremos sacar todo el partido posible a esta acumulación de tecnologías, igual que el Museo Thyssen.

  2. Gracias y enhorabuena, Javier, por tu claridad y reflexiones. Trabajar por los datos abiertos debería ser sin duda una de las líneas estratégicas esenciales para los museos y organizaciones culturales. El camino, sin embargo, no está exento de dificultades de toda índole, tecnológicas, legales, económicas, organizativas incluso.
    Creo que podría ser beneficiosos sumar esfuerzos y no que cada museo tenga como que reinventar la rueda… Y también ayuda para “evangelizar” mostrar buenos ejemplos de muchos centros en el mundo que ya han abierto camino.
    Tenemos ¡mucho trabajo por delante!!
    Saludos cordiales

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *