Bibliobuses: las mil y una anécdotas

El pasado día 7 de febrero, SEDIC ofreció una visita profesional a las instalaciones de Bibliobuses de la Comunidad de Madrid. la directora del Servicio, fue la cicerone y habló del trabajo que allí se desarrolla y lo que supone esta extensión bibliotecaria que se inició en 1986 bajo el mandado del entonces presidente de la Comunidad, Joaquín Leguina.

Toda la información recibida fue muy valiosa, sin embargo, mi interés se centró en el equipo humano; por eso, sirvan estas líneas para rendir mi particular homenaje a todos los profesionales del Servicio.

Cuando entré en las dependencias de Bibliobuses, sitas en la Av. Laboral, nº 11 (Madrid), la sensación que percibí fue la de taller de ilusiones, donde los diversos profesionales se mueven como laboriosos duendecillos por las oficinas, el depósito, el hangar y las salas de la gran nave. Nadie les ve, pero su actividad no cesa en pos del beneficio social de acercar la lectura allí donde los usuarios lo necesitan.

La plantilla de Bibliobuses está formada por treinta y nueve profesionales entre bibliotecarios y conductores, un auxiliar administrativo, un auxiliar de servicios generales y un jefe de equipo de los bibliobuses. En cada bibliobús sale un conductor y un bibliotecario para cubrir los 13 bibliobuses con que cuenta el Servicio,  más dos conductores suplentes y tres bibliotecarios suplentes.

Los bibliobuses tienen un total de 177 paradas (entre una y tres paradas cada día) y recorre un total de 119 municipios de la Comunidad de Madrid; incluido Madrid capital, considerada como un municipio más, donde se visitan 16 distritos y se efectúan 40 paradas, que traducido todo a medida de longitud, el viaje con retorno incluido, supone muchos kilómetros.

Villamanta es un municipio donde el bibliobús realiza su visita

 La excelencia del Servicio de Bibliobuses es conocida y reconocida, pero poco se sabe de las andanzas de los bibliotecarios. El día a día puede convertirse, a veces, en algo poco llevadero a causa del clima, pues por muy bien acondicionadas que están los bibliotecas móviles es inevitable que el frío y el calor les afecte; o del entorno, pues por bien ubicadas que estén las paradas, los aseos no siempre están cerca. O también, por muy acogedores que sean los municipios y distritos, y amables los usuarios, es inevitable que los bibliotecarios lleguen a estar desbordados por las necesidades de los mismos, olvidando sus propias necesidades, a bastante distancia de la unidad central del Servicio.

Por fortuna los bibliotecarios no van solos. Los conductores de los bibliobuses son sus compañeros de viaje, siempre pendientes del tráfico, la climatología y de cada ruido que emiten los motores de las bibliotecas móviles. Sin el visto bueno de los conductores y del jefe de equipo, en cuanto a estar todo en orden para realizar los desplazamientos rutinarios y exitosos, las  unidades móviles no pueden salir, por lo que se puede decir que son una parte muy importante del Servicio de Bibliobuses.

Sea como fuere, tanto trabajo, tantas horas, tantas rutas, dan para escribir un libro que bien podría titularse Bibliobuses: las mil y una anécdotas. Animo a ello, pues estoy segura de que siguiendo a Ranganathan en cuanto “a cada lector su libro” y “a cada libro su lector”, lectores y usuarios apreciarían todavía más la labor de los profesionales desplazados “que les ahorran tiempo” y les animan a “usar los libros”. Y es que “la biblioteca es un organismo en crecimiento”, pero quien la hace verdaderamente grande son las personas que trabajan en ella, en este caso, en el Servicio de Bibliobuses de la Comunidad de Madrid.

 

 

Los comparadores y la Documentación

La Documentación es más conocida por su vinculación al entorno bibliotecario y archivístico, que por su directa relación con los servicios de información en la nube que están transformando la economía digital y que nos hacen la vida más fácil. Es el caso de los comparadores. ¿Quién no ha usado el famoso comparador de hoteles, vuelos, seguros, viajes…? Probablemente se piense que son aplicaciones que nada tienen que ver con la Documentación, pero eso no es cierto. Si aprendemos su método de funcionamiento, observaremos que tales programas realizan tareas de consulta, tratamiento, almacenamiento y gestión de la información, similares a las que realizaría un bibliotecario con una colección bibliográfica. Pero, diseccionemos mejor el objeto de este artículo, “los comparadores”.

Un comparador es un programa diseñado para recolectar información sobre un determinado “ítem” u objeto, que consta de unas propiedades informativas y descriptivas concretas, que pueden ser en mayor o menor medida enfrentadas o comparadas cuantitativa o cualitativamente. Por regla general, el objetivo es obtener el precio de un mismo producto en distintos sitios web, o fuentes de información, con el fin de determinar el proveedor más económico. Sin embargo, esta técnica también puede emplearse para comparar libros, artículos, catálogos bibliográficos, recursos de información… lo que convierte a los comparadores en verdaderos buscadores, altamente especializados. Pensemos por un momento que se pudieran comparar las distintas ediciones de un libro y señalar sus diferencias, o bien entre dos o más artículos científicos, identificar sus influencias temáticas, comparar sus referencias bibliográficas y aparato crítico, extensión, palabras clave, conclusiones, o bien comparar la composición bibliográfica de un catálogo en relación al de otras bibliotecas. Ello representa una mínima parte de lo que se puede hacer sólo en el sector bibliotecario. En el sector mediático, podría compararse una misma noticia en los distintos medios de comunicación, determinarse la orientación de la misma a través de sus palabras clave, el análisis de sentimiento e incluso relacionarla con los eventos económicos. Si lo indicado hasta ahora, ya resulta interesante, podemos afirmar que la capacidad para comparar los datos, la información y la documentación son la antesala de la verdadera inteligencia artificial. Dicho de otra forma, una inteligencia artificial compleja es aquella capaz de medir y obtener datos, compararlos y establecer relaciones complejas de forma predefinida, aleatoria o por medio de técnicas de aprendizaje automático. En la práctica, esto ha supuesto que existan programas autónomos capaces de invertir en bolsa, tomar decisiones sobre el tráfico de una ciudad, gestionar puertos y aeropuertos, organizarnos un plan de ocio para el fin de semana, programar un viaje e incluso simular la toma de decisiones gubernamentales según el factor geopolítico y económico. Cuanta mayor es la capacidad para comparar, mayor es el conocimiento de causa y mejores decisiones se pueden tomar.

Ahora bien ¿Cómo funciona un comparador? En primer lugar, se determinará el objeto de comparación. Un “ítem” que figure en diversas fuentes de información o catálogos. Al estar presentes en la web, constan de una estructura HTML que puede ser analizada mediante un programa, denominado “parser”, que rastrea el contenido en el que estamos interesados. Este programa se encarga de extraer toda la información, organizarla y almacenarla en la base de datos. A esta operación, se la puede denominar minería de datos y es fundamental para dotar de una base de conocimiento al programa comparador. La capacidad para identificar los datos e informaciones es clave para realizar operaciones más complejas. Por ejemplo, puede diseñarse un programa parser que consulte una lista de libros a partir de su código ISBN en el catálogo OPAC de una biblioteca y, además, sea capaz de extraer sus campos de descripción, título, autor, editorial, fecha, materia, descripción física, precio, etc. Pero el programa puede mejorarse si utiliza estos datos para realizar una búsqueda más avanzada en los catálogos comerciales, comparando el precio del libro, la edición, o las distintas editoriales que han publicado una obra en particular. En cualquier caso, la información obtenida por los programas parser es registrada mediante consultas SQL, en bases de datos como MariaDB, MySQL, PostGree SQL, Oracle, et.al. Las bases de datos disponen de tablas con una estructura específicamente diseñada para alojar cada dato e información obtenida. Por regla general, albergan capacidad para registrar resultados de búsqueda para un ítem en distintos catálogos, haciendo efectiva cualquier comparación.

Completada la fase de recopilación y minería, el siguiente paso es la fase de inteligencia comparativa, en la que se tiene un programa de comparación, encargado de procesar las consultas del usuario sobre un “ítem” cualquiera, presente en la base de datos. En este punto, se aplican los métodos de recuperación de información para una búsqueda eficaz de los contenidos demandados y, por otra parte, los algoritmos de discriminación y ordenación de resultados según economía, compleción, grado de actualización o adecuación a las necesidades del usuario. Ello puede diseñarse en lenguajes de programación como PHP, con los que establecer el comportamiento, reglas y condiciones de la comparación, así como la identificación de características añadidas mediante reconocimiento por patrones. El resultado de la comparación suele ser una tabla ordenada en la que se destaca el ítem más adecuado en torno a los puntos de comparación indicados por el usuario. Por ejemplo, si se trata de comparar un libro, qué edición proporciona más ilustraciones, cuál tiene mejores críticas, cuántas referencias bibliográficas, aparato crítico. En el caso de los portales de recursos multimedia o “stockfootage media”, qué repositorio gráfico proporciona mejores precios, condiciones de acceso y uso, cuántas imágenes o recursos pueden utilizarse, con qué resoluciones, calidad, etc. Otro hipotético caso, las licitaciones públicas, pueden ser tratadas con el mismo principio. Qué empresa proporciona mejor precio, materiales, qué aspectos del contrato o checklist cumple y cuáles no, cuál es el número de incidencias que tuvo esa empresa, retrasos, contratos cumplidos en tiempo y forma, datos de la empresa, en relación a otras del sector. Otros ejemplos; la comparación de precios de materias primas, commodities, datos fiscales de empresas por sectores, la publicación científica a nivel macro y micro, comparación de patentes y modelos de utilidad, análisis automático de plagios, etc.

En conclusión, los comparadores son una herramienta esencial para convertir la Documentación en una ciencia para la transformación y aprovechamiento inteligente de la información. Nos enfrentamos a un reto sin precedentes, en el que nuestros profesionales tendrán que adaptarse al cambio de paradigma. La actitud proactiva y la capacidad creativa serán el principal valor diferencial, que marcará el desarrollo de modelos de información más eficientes. La información y los contenidos ya se encuentran disponibles en la Web y sólo es necesario aprender la forma de aprovecharlos, organizarlos y relacionarlos para generar nuevos servicios de información. En este sentido el documentalista deberá convertirse en un perfil altamente cualificado con conocimientos de Documentación y Biblioteconomía, pero también y especialmente, en programación orientada a objetos, web dinámica, bases de datos relacionales, recuperación de información, desarrollo de buscadores, minería de datos, procesamiento y clasificación automática de textos, sin olvidar conocimientos en gestión y administración de empresas, desarrollo de servicios web, desarrollo Frontend y Backend, metrías y estadística. Las oportunidades en este contexto son enormes y queda de nuestra parte hacer lo necesario para aprovecharlas.

 

Crónica Actualízate 2017 III sesión y entrega de premios

3ª sesión

En la tercera sesión fue presentada por Virginia Ortiz Repiso y participaron Francisco José Valentín Ruiz de Odilo y Antonio Guillermo Martínez Largo de Libnova, sobre las bibliotecas digitales en la enseñanza y sobre la inteligencia artificial aplicada a la gestión de documentos.

Francisco José Valentín presentó un modelo de cómo las bibliotecas digitales pueden ampliar los servicios que ofrecen a los usuarios, ampliando a su vez las competencias transversales. Para ello se destacan cuatro puntos:

  1. El negocio de las bibliotecas digitales. Las empresas también sacan rentabilidad de la gestión de las bibliotecas. Según datos del MECD el coste de un préstamo físico es casi cuatro veces más que un préstamo digital, ya que las bibliotecas pagan por cada préstamo, puesto que en teoría se deja de vender el libro, pero en digital se paga por uso. Al final esta gestión se revierte en un ahorro para la institución.
  2. Las bibliotecas tradicionales tienen características similares a las digitales, pero se puede ir más allá que emular los servicios físicos de las bibliotecas tradicionales. Aunque cuesta introducir nuevos elementos y nuevas formas de trabajo, cada vez se están extendiendo más cambios en los servicios por ejemplo la autogestión por parte del usuario, acceso exclusivo a contenidos en bibliotecas empresariales, bibliotecas abiertas a ciudadanos y visitantes como impulso turístico, o contenidos geolocalizados en función del interés turístico.
    Las bibliotecas como espacio convencional se transforman, pierden parte de su papel pero tienen que obtener otro, reinventarse. Se centran en prestar el servicio personalizado al usuario.
    El servicio del contenido digital que se ofrece es completo. Además de la entrega del software se hace la puesta en marcha, un entorno seguro, la continuidad de negocio… El modelo de una biblioteca digital es:
  • Plataforma de gestión de contenidos digitales, siendo proveedores de servicios tecnológicos.
  • Proveedores de contenido y de otros servicios adicionales.

Gracias al software como servicio se puede ofrecer este modelo de contenido. No se podría prestar contenido si no hubiera un modelo detrás respaldado por las editoriales.
Además, las apps son fundamentales porque el consumo de contenido se hace ya desde los propios dispositivos personales. Usar solo un pdf para difundir no tiene mucho sentido, por eso el modelo de contenido es otro.

  1. Bibliotecas digitales y educación. Uno de los principales enfoques de las bibliotecas escolares es que los niños lean sin importar el dispositivo o el formato. La forma más sencilla de llevar una biblioteca sin importar donde estén y con contenido de todo tipo a los alumnos es a través de la biblioteca digital. La inversión puede llegar a muchos alumnos sin importar la escala social. Lo que es más difícil es hacer un seguimiento personalizado de cada alumno, aunque si es posible orientar las lecturas de cada uno con las herramientas digitales. Otros servicios adicionales podrían ser el club de lectura o plataformas de lectura colaborativa.
  2. Bibliotecas en educación superior. También se puede extrapolar el modelo anterior, ya que las necesidades son más o menos las mismas. Las campañas específicas o lecturas colaborativas serán diferentes pero se puede enfocar de otra manera. Habrá contenido universitario especializado, transversal, y de ocio.
    Además existe la posibilidad de hacer consorcios: utilizar economías de escala para que el contenido en sí sea más económico. El modelo consorciado consistiría en un catálogo general que todas las bibliotecas adquieren de forma conjunta, compartido en cada uno de los centros universitarios, además adquirir contenido con sus propios recursos y por último cargar contenido generado propio. Lo ideal es que la mayor parte del contenido que se genera en la universidad estuviese en abierto, sobre todo si se financia con fondos públicos.
    Uno de los aspectos más criticados a las universidades es que no preparan profesionales para entrar en el mundo laboral. Esto podría cambiar a través de la biblioteca universitaria si esta potencia otro tipo de competencias o estrategias que no están tan relacionadas con los estudios reglados, como actividades de emprendimiento, autoaprendizaje de determinados contenidos, marketing,…

Los modelos son pago por uso, por tiempo o por límite de licencias. Quizás lo más conveniente es el pago por uso, ya que los costes no tienen por qué ser mayores y se evita tener documentos que no se utilicen.

Al final se tienen unas mismas necesidades tecnológicas, independientemente del tipo de cliente o usuario, con diferentes necesidades de contenido. Se trata de potenciar las competencias digitales en la enseñanza, a través de un modelo basado en contenidos digitales, para democratizar el acceso a la cultura.

 

Antonio Guillermo Martínez Largo realizó una introducción a la inteligencia artificial y a las redes neuronales y porque se incluyen estas tecnologías a la gestión de la información y qué tipo de sistemas da como resultado.

La inteligencia artificial es un campo muy poco conocido, sobre todo en el campo de la documentación, sin embargo está generando una gran oportunidad para los profesionales y una salida laboral muy relevante para los próximos años.

En 2007, a través de un proyecto de digitalización masiva en BNE se detectó un problema técnico muy relevante en cuanto a preservación digital: se invertían grandes cantidades en digitalizar con muy alta resolución, pero esos objetos generaban un pdf en baja resolución y era lo que se subía a la web. Además, el almacenamiento de este proceso era muy grande y generaba dificultades en la búsqueda de información.

En realidad, ese proceso de conservación de información de forma accesible se llama preservación digital. Para hacerla posible de manera eficaz se buscó en el mercado herramientas y alternativas pero lo que había era excesivamente caro, no se ajustaba o no cumplía la necesidad de gestionar estos de grandes volúmenes.

Así se empezaron a crear pequeñas herramientas y asistencias a los distintos procesos, que incluso tenían sentido más allá de la biblioteca, en otras instituciones ya que esta necesidad latente estaba muy extendida. En lugar de enfocarlo como un servicio para un proyecto particular, se enfocó como un producto, un software que acumulaba los distintos procesos.

Hoy Libnova es una de las tres principales compañías del mundo en preservación digital y continúan la expansión. Finalmente se creó un producto que con costes muy bajos aportaba mucho valor, y soluciones extremadamente eficientes al proceso.

Este proyecto es muy interesante y pionero porque es el primero que ha combinado en un solo repositorio, un sistema de preservación digital de información documental, histórica, y patrimonial, con administración electrónica.

Hoy en día, mucha información en las compañías, instituciones y empresas, por no tener los recursos suficientes, no se está archivando y estructurando adecuadamente la información. Cuando se empezó a pensar en que tecnologías emergentes van a cambiar la industria documental de forma disruptiva tal y como la conocemos es, sin duda, la aplicación de procesos de inteligencia artificial, machine learning y redes neuronales profundas.

En el enfoque de resolución de un problema con estos procesos consiste en que la persona selecciona las herramientas de inteligencia artificial que tiene a su disposición y posteriormente ayuda en su entrenamiento. Lo relevante e interesante de esta tecnología es que aunque se cambie un dato, si se ha entrenado a la máquina correctamente, podrá seguir trabajando sin escribir un código nuevo: será capaz de comprender las diferencias y se adaptarse. Este proceso va a cambiar la forma en que procesamos, ordenamos y entendemos información. Los profesionales se centraran en disponer o seleccionar los algoritmos que se van a usar, las herramientas de inteligencia artificial que se pueden utilizar y a entrenar al sistema para que procese esa información.

El conocimiento que hace falta para seleccionar estos algoritmos y entrenar estas redes neuronales no es difícil de adquirir, hay que saber estructurar la información y ordenar los documentos. Por ello, este trabajo es más accesible para un documentalista que para un informático.

Básicamente los algoritmos más utilizados en este sector son los algoritmos supervisados, se dividen en tres tipos:

  • Algoritmos de clasificación: pueden enseñar a una máquina a clasificar documentos. El sistema es capaz, si se definen bien las estructuras de información, de aprender y procesar grandes cantidades de información muy rápidamente.
  • Algoritmos de regresión. Permiten predecir comportamientos conforme a lo que ya ha sucedido, no solo mirando a un sector concreto sino también a otros relacionados que pudieran afectarle.
  • Detección de anomalías en el sistema: hay algoritmos que son capaces de darse cuenta de cuando pasan cosas no habituales. Tiene esa sensibilidad, que está aumentado mucho así como el procesamiento. Se aplica en preservación digital y el sistema advierte, por ejemplo, de páginas en blanco, borrosas o saltos.

En un proceso de preservación clásico esta tecnología es aplicable cuando en una empresa se tienen cientos de miles de documentos en un servidor y estructurados de cualquier forma, incluidos los correos electrónicos. En este caso se siguen unos pasos concretos:

  1. Se hace un proceso para que se fije la información y comprobar posteriormente que no se pierde, atendiendo a criterios de preservación digital.
  2. Se extraen las características de los documentos. Analizándolos de formas distintas hasta obtener representaciones comprensibles o modelos gráficos del tipo de documentos con el que se está trabajando.
  3. Se detectan anomalías. Un paso muy relevante en preservación digital, como saber si está protegido con contraseña o dañado.
  4. Se indexa el texto completo, se extrae todo el texto del documento.
  5. Se hace una clasificación y marcado de los distintos documentos: ficheros problemáticos o información potencialmente sensible,… Se organiza la información.

Existe un vacío laboral enorme entorno a este mercado. Además hay buenas perspectivas en los próximos años para diseñar y entrenar este tipo de sistemas.

El flujo actual en la gestión de la información desde hace unos años es catalogar, digitalizar, preservar y difundir. Con este sistema se puede asegurar que el contenido, la estructura y la recuperación de la información es correcta. Sin embargo, hay que luchar contra la ignorancia de esta necesidad, ya que solo cuando se descubre el daño ya está hecho.

Entre las preguntas del público se plantea que formación es necesaria para introducirse en el campo de la inteligencia artificial vinculada a la gestión documental. Sin duda, los estudios más relevantes son másteres en inglés. Es posible que en un par de años empiece a llegar a España.

A continuación se hizo entrega del IV Premio Universitario Sedic, a cargo de María Teresa Fernández Bajón y Carmen Morales Sanabria, que hizo la lectura del acta.

  1. Irene Calzado Obispo. Universidad Complutense de Madrid. Trabajo fin de grado: Desarrollo de un motor de búsqueda.
  2. Nuria Barrio Santos. Universidad de Salamanca. Trabajo fin de grado: Cuando la historia no está escrita.
  3. Arantxa Martin Becerro. Universidad de Salamanca. Trabajo fin de master: La literatura infantil y juvenil en las plataformas de venta de libros electrónicos.

A lo largo de la jornada, se puso en relevancia la necesidad de preservar, organizar y gestionar el conocimiento para democratizar la cultura, y hacer posible el acceso abierto gracias a la conservación y con la digitalización.

El objetivo es hacer posible que grandes volúmenes de información valiosa esté disponible para toda la sociedad y para largo plazo. Para ello también hay que colaborar entre las empresas privadas y las empresas públicas conjuntamente, y crear modelos válidos de desarrollo. Así mismo es importante ofrecer el apoyo a los autores y editores para el acceso libre al conocimiento.

Además las herramientas para lograr todo esto se dirigen claramente hacia la utilización y adecuación del conocimiento a los dispositivos móviles, con una correcta visualización y una búsqueda adaptada a estos entornos.

Las reflexiones que se llevan a cabo en estas jornadas nos ayudan a ver nuevos horizontes y nuevas líneas de investigación, nuevos perfiles y a abordar mejor nuestros estudios de documentación.

Se agradeció la participación a las empresas que han colaborado, a la Universidad Carlos III y a Sedic, así como a la UCM. Esta colaboración es muy positiva para mejorar en los estudios de documentación y ver nuevos horizontes el mercado laboral.

Crónica Actualízate 2017 II sesión


En la segunda sesión Jose Luis Menéndez expuso la puesta en marcha de una nueva aplicación para bibliotecas. Por su parte, Francisca Hernández Carrascal nos contó algunos de los proyectos más novedosos con Digibis. Por último, Carlos Pérez nos habló de Proview, e-reader para la colección de obras de las editoriales de Thomson en España.

La aplicación My IE Library Account, permite tener en el móvil toda la Biblioteca Virtual IE, a cualquier hora y en cualquier lugar. Además, permite realizar todas las tareas de circulación de las bibliotecas con la que los usuarios son totalmente autónomos: préstamo, devolución, búsqueda de recursos, reserva y pago de multas. No es obligatorio descargarse la aplicación, ya que también habrá terminales comunes en las bibliotecas para hacer el proceso.

Respecto al futuro de los bibliotecarios, tendrán que reciclarse hacia otros niveles de gestión y hacia los datos. La idea es que las tareas iterativas, en la medida de lo posible, deben hacerlas la tecnología.

Digibis es una empresa española referente en digitalización y la creación archivos, museos y bibliotecas digitales, con clientes de entidades públicas y privadas, ya sea en España o en otros países. Estas entidades tienen peculiaridades, contenidas en las siguientes líneas estratégicas:

  1. Contenido de bibliotecas, archivos y museos digitales e híbridos.
  2. Normativa específica de archivos, bibliotecas y museos.
  3. Interoperabilidad y visibilidad, es fundamental y ha aumentado mucho en los últimos años. Proyectos como Hispania y Europeana ha obligado a la uniformidad normativa y una mayor interoperabilidad.
  4. La web actual es la web semántica y los datos enlazados o linked open data.
  5. Evaluación de la usabilidad e impacto de los sistemas de información digitales entre los usuarios. Los esfuerzos de inversión en la creación de colecciones digitales son muy grandes pero el impacto es reducido. Hay que mejorarlas y preguntarse por qué tienen un uso tan restringido, por ejemplo en educación.

Un proyecto muy importante es la Biblioteca Virtual de Polígrafos, mantenida por la Fundación Larramendi. Se trata de un campo de pruebas para programas en desarrollo. Ejerce labores de vigilancia tecnológica muy importantes sobre qué se hace, los proyectos punteros, cuales son tendencia, y cuales se estabilizan. No es productiva pero si importante para la actualización e innovación.

Ente los programas que Digibis tiene se encuentran:

  • Digibib (para bibliotecas). Gestión de la colección física y digital. Tienen 31 bibliotecas virtuales presentes en Europeana utilizando su normativa. Se hizo la compatibilidad entre los programas y permitieron que los contenidos en español tuvieran más cobertura. Esto ofrece una posición de visibilidad muy amplia.
  • Digiarch (para archivos). Programa implantado en 2015 que permite la descripción de fondos archivísticos en un entorno normalizado, basándose en la norma ISAD(G). Es interesante en mantener la jerarquía de los niveles de descripción y el contexto de posición de una unidad dentro de un conjunto más general. Esto se hace con los cuadros de clasificación, aunque presentan dificultades para que se puedan gestionar de una forma usable.
    Digiarchs se ha utilizado en el archivo fundación Norman Foster de imágenes, con objetos de gran resolución y calidad, importante para visualizar en los diferentes dispositivos, ya que permite gran nivel de ampliación y detalle.
  • DigiOAI. Repositorio adaptado al protocolo OAI-PMH, que permite que los registros almacenados en una base de datos, puedan ser agregados por cualquier servicio de recolección de metadatos y soporta distintos formatos. Realiza una transformación dinámica de datos.
  • DigiHub (repositorio Hub-PMH). Programa de agregación de metadatos, también basado en la aplicación del protocolo OAI-PMH, lo que permite la posterior agregación de estos recursos a proyectos nacionales e internacionales. La instalación más importante es Hispana, con gran crecimiento de registros; en metadatos es la primera fuente de información en España.
  • Digimus (para museos). Programa para la descripción de piezas de museos conforme a las especificaciones del ICOM. La instalación más destacada es la del centenario de El Greco. Permite una presentación muy interrelacionada de los datos para mejorar las presentaciones y facilitar a los usuarios que elijan las vías de navegación haciendo propuestas de relaciones, basadas en los vínculos entre los datos con otras obras u otras versiones. Puede importar distintos recursos Linked Open Data

Se están abriendo nuevos servicios con datos abiertos vinculados con fuentes externas y enriquecimiento de datos masivos, para esto es muy importante el Linked Open Data y la web semántica. El desarrollo de procedimientos masivos o semiautomáticos permite realizar la transición entre los datos tradicionales de bibliotecas a los datos abiertos enlazados.

También es muy importante la presencia dentro de Wikipedia, ya que es el 5º sitio de la web y realiza a través de Wikidata un importante trabajo del control de autoridades. En este caso, la biblioteca digital de Castilla y León proporciona identificadores de registro de autoridades, que se usan dentro de la propia Wikipedia.

Con todo este trabajo, se intenta llegar a la filosofía de Tim Berners Lee, que llego a categorizar los diferentes pasos para conseguir datos abiertos, vinculados y presentes en la web semántica y con ello impulsarla:

  1. Publicar los datos en la Web bajo una licencia abierta
  2. Publicar los datos en una estructura reconocible y reutilizable
  3. Usar formatos no propietarios, abiertos.
  4. Usar URLs para referenciar datos
  5. Enlaza tus datos a otros datos, dotándolos de contexto.

Para Thomson Reuters el objetivo principal es ayudar a los clientes en el proceso de transformación digital. A pesar del cambio hacia un entorno digital, se ven reticencias sectores como el editorial. Hay mucho apego al papel y a la manera de trabajar pero el cambio digital es para todos, existen las herramientas y hay que sacarle partido.

En general, aunque el papel no desaparecerá, se da una tendencia clara a lo digital por eficiencia y por las posibilidades que presentan las herramientas digitales. Según datos recientes del MECD la tendencia es que el libro en papel baja pero es permanece estable, y el libro electrónico aumenta pero se mantiene y no alcanza aun al papel.

En Thomson Reuters desde hace un tiempo publican todas las novedades en digital y además han rescatado una serie de obras de su fondo editorial. La demanda de lectura electrónica tiene que ir unida a la calidad de los contenidos. Esto se canaliza con Proview, plataforma de visualización de ebooks, que proporciona acceso y consulta a todas las monografías, códigos y demás obras en la biblioteca digital de Thompson Reuters, en diferentes dispositivos.

Las aportaciones que ofrece Proview son múltiples:

  • Movilidad, en cuanto a la disponibilidad de la información en cualquier momento y lugar. Para ello, se lanzará Proview para el móvil.
  • Búsqueda de información. A veces es difícil encontrar una información en la biblioteca. Esta plataforma trata de que sea sencillo, preciso y rápido entre todos los textos de todas las publicaciones de Thomson Reuters España.
  • Personalización de contenidos: es un punto clave porque supone el salto del paradigma de papel a digital. En los documentos electrónicos se da la falta de sensación táctil del papel, la pertenencia material de libro tradicional, subrayar, tomar notas,… estos son condicionantes importantes a la hora de mejorar la transición de papel a digital.
  • Trabajo colaborativo: compartir la información, enviándola a través de un pdf o con un enlace a una obra. Con el objetivo de que esta información al ser compartida, enriquezca a ambas partes.
  • Calidad de la información: además de la tecnología y la inversión en la evolución de los productos se necesitan publicaciones actualizadas, con los últimos cambios, con referencias a todos los contenidos de las bases de datos asociadas, y su integración. Es importante que haya coherencia entre los datos, lo que aparece en ebook y en las bases de datos. Otra cuestión es que transformar un libro en pdf no es digitalizar, es tener enlaces, datos directos a las bases de datos que refuercen la información,… Es lo que se entiende como calidad de la información.
  • Innovación y tendencias. Aunque es difícil hacer una predicción en los próximos años, para un corto o medio plazo se da un peso muy fuerte en el uso del móvil y la posibilidad de poder llevar contigo toda tu biblioteca.

Como puntos a mejorar en el futuro se encuentran:

  • La información, la interconectividad, y la pertinencia de los resultados de búsqueda con la mejora de algoritmos. Cómo interpretar lo que está buscando el cliente y sacarle el contenido más acertado.
  • La biblioteca internacional: editoriales en todo el mundo conectadas y que ofrecer bibliotecas digitales con contenido internacional.
  • Proview Publishing Services: plataforma de próxima aparición en la que cualquier persona podrá publicar contenido. Es una manera de dar a conocer el trabajo profesional y ser reconocido por el resto del mundo.

El acceso a las bibliotecas o archivos digitales es muy importante, saber en qué medida se hace y cuando no. En un servicio de información se necesita saber que partes hay que mejorar para facilitar un acceso más amplio.

También la monitorización es muy relevante en las bibliotecas porque permite la toma de decisiones. Es un trabajo interno que da cuenta de la experiencia del usuario, que al fin y al cabo son los clientes finales.

A pesar del acceso abierto hay que dar importancia al autor, retribuirle correctamente. Además es posible que en el futuro se vaya hacia modelos de edición masiva en el que el cliente se encargará de separar lo que es importante de lo que no, y en el que primaran los volúmenes de cantidad de contenidos a precios más reducidos.

Crónica Actualízate 2017: Presentación y I sesión

El pasado 12 de Diciembre de 2017 tuvo lugar en la Facultad de Ciencias de la Documentación de la Universidad Complutense de Madrid la Jornada Actualízate, dirigida a estudiantes y profesionales de la información y en la que algunas empresas, relacionadas con la gestión de la información, muestran sus productos o servicios más innovadores con el fin de crear un foro de discusión en torno a la evolución y las tendencias tecnológicas y formativas en el sector de la información documental, buscando así puntos de unión y sinergias entre la actividad profesional y el ámbito universitario (investigador y docente).

Queremos mostraros lo que allí se comentó y se debatió de manera pormenorizada, ¡comenzamos en este post con su inicio y la primera sesión!

La apertura de la jornada corrió a cargo de María Teresa Fernández Bajón y Blanca San José Montano. En esta introducción se destacó la importancia de reflexionar sobre las ciencias de la documentación, conectando a los docentes con el mercado laboral y en definitiva con la profesión de documentalista. Se debe impulsar la idea de integración y colaboración para saber que ocurre en el ámbito documental y difundir los escenarios y herramientas para establecer planteamientos adecuados en los estudios de información y documentación.

1ª Sesión

En la primera sesión participaron Luis Collado y José Antonio Magán Vals, para hablar sobre el proyecto de colaboración en la digitalización del fondo de la colección bibliotecaria de la UCM con Google. El acuerdo comenzó hace 10 años y se han digitalizado unos 150.000 libros.

Al crear una colección digital se pretendía mostrarla a todo tipo de usuario, difundir el conocimiento que contenía la universidad y la investigación que producía; para ello Google era una gran herramienta. Ahora la colección de la UCM se divide en tres apartados: trabajos académicos, materiales de apoyo a la investigación y patrimonio bibliográfico.

En cuanto al proyecto de colaboración Google-Complutense, la universidad fue pionera en Europa, en el mundo no anglosajón, con la digitalización de sus fondos respecto a otras bibliotecas. Hay que destacar que Google puede digitalizar en días lo que a la universidad le costaría años, a pesar de ser la mayor institución que se dedica a digitalizar en España.

Ha sido el proyecto bibliotecario más importante que ha asumido la biblioteca complutense en las ultimas décadas. Para digitalizar los libros tienen que estar en buen estado, y hay que recatalogarlos en un sistema automatizado. En la biblioteca de la UCM además del trabajo diario, había que introducir las obras digitales y al final se priorizaba lo que más se usa; además, la biblioteca histórica no disponía de recursos para catalogarlo todo. En 2006 un 80% del fondo estaba sin catalogar y este proyecto dio un gran impulso para poder hacerlo.

La visibilidad de los textos en Google son en su mayor parte a texto completo pero hay un 15% con vista reducida, debido a derechos de autor. En cuanto a acceso hay 65.000 visualizaciones diarias de libros anteriores a 1870, hasta el momento esto era impensable en una biblioteca histórica. En Google libros, el latín no es una lengua muerta, es la segunda más descargada, solo 8 veces menos que el inglés.

Los libros son accesibles en muchas pasarelas entre ellas Hathitrust. La complutense utilizó esta pasarela por ser una biblioteca digital cooperativa, que evita ser simples recolectores y duplicar la información.

A continuación Luis Collado nos habló de otros proyectos externos y el futuro de la digitalización.

Únicamente desde 2004 se ha empezado a realizar la digitalización de libros, por lo tanto, la información de calidad que a lo largo del tiempo los editores han publicado en papel no aparecía en internet, pero gracias a este proyecto ha sido posible incluirla.

La idea era digitalizar todos los libros del mundo y ponerlos a disposición de la sociedad. Para ello había que plantarse:

  • Esclarecer la situación legal respecto a los derechos de propiedad intelectual. Unos son de dominio público, otros ya no se publican y otros están en un limbo porque el autor es desconocido. Sin dominio público no se puede hacer nada.
  • Decidir cuántos libros se van a digitalizar. Nadie sabía cuántos libros se han impreso. Se hizo una estimación de 180 millones, aunque no se puede contrastar y el ISBN es un sistema muy moderno y optativo.

Conforme pasaba el tiempo, se fueron incluyendo más y más bibliotecas en el proyecto. Mientras tanto, este proyecto no estuvo exento de polémica por digitalizar libros de instituciones públicas. Sin embargo, se llegaron a acuerdos y se avanzó. Hay que recordar que el patrimonio es de la humanidad, la UCM lo preserva para su uso y difusión. Incluso en las leyes de patrimonio se incide en la difusión, el problema en ese momento fue gran la cantidad de libros que albergaba el proyecto.

A día de hoy, se sigue digitalizando aunque cada vez es más difícil encontrar libros sin derechos para procesarlos. El ritmo de digitalización es de un millón al año y en más de 450 idiomas. Este aspecto por si solo es un reto, conlleva una gran complejidad: no es solo una imagen digital, sino un reconocimiento de palabras, textos, orientación de lectura,… es un proceso de digitalizar pero también indexar, identificar y hacer accesible los contenidos.

Al principio la digitalización se hacía cerca de los centros que poseían el material pero ahora solo hay cuatro grandes centros y no se mueven: dos en EEUU, Munich y Roma; son los libros los que se desplazan.

La mayoría de los libros digitalizados son de bibliotecas de EEUU, seguido de acuerdos con editoriales o derechos de autor, que sí tienen en su mayoría copyright y por último con bibliotecas europeas.

Criterios que se siguen a la hora de digitalizar:

  • Preservar y difundir.
  • Universalidad: con la variedad de idiomas.
  • Digitalización no destructiva: si existe algún riesgo no se lleva a cabo.
  • Aprendizaje común.
  • Compartir tecnología y experiencia: con OCR y metadatos.

Actualmente trabajan hacia la mejora del OCR, la disminución de errores y la calidad de la imagen. Pero también continúan retos como: textos en mal estado, libros en miniatura, páginas sueltas, blanquear páginas en sepia, hojas que se traslucen, identificación de caracteres,… Otro problema también es no digitalizar dos veces el mismo ejemplar.

La innovación es un proceso de acometida continua y en la actualidad, el móvil deber ser la fuente de acceso al conocimiento. Aún es muy bajo el número de consultas de libros debido a la baja optimización de los contenidos en estos dispositivos, y la experiencia de usuario no es buena. Se necesita mejorar la calidad de visualización en los diferentes dispositivos digitales y la adaptación de millones de contenidos a ellos. Así mismo, se trabaja en el perfeccionamiento de la tecnología en digitalización, como la iluminación de libros, e incluso en el proceso humano, en cómo los operarios pueden ahorrar segundos en cada libro al colocarlo o pasar páginas.

Líneas de trabajo actuales:

  • OCR: machine learning, que las propias maquinas mejoren la identificación de contenido.
  • Metadatos: técnicas para que mejore la calidad.
  • Algoritmo de búsqueda dentro del contenido de los libros.

En el momento de gran ebullición mediática de la digitalización si se trabajaron con libros del siglo XX, huérfanos o descatalogados; sin embargo fue imposible llevarlo a cabo sin una sentencia favorable que lo permitiera. En cualquier caso, ya hay mucho trabajo con libros en abiertos y con copyright, que al final son los más interesantes para el público.

En el ámbito de la rentabilidad de digitalizar, Google invierte mucho sin beneficio directo. Lo hay indirecto porque más gente usa Google y se dan otras ventajas, como los propios productos y servicios de Google que se alimentan de la digitalización para ofrecer un mejor producto al usuario final, es el caso del traductor o el buscador.

Ahora cada palabra, de cada línea de cada libro se le puede ofrecer a la sociedad, ya que Google Libros lo incluye en el buscador. Aunque es verdad que el usuario no utiliza la plataforma de la propia institución, bien por desconocimiento o por comodidad, la información si está disponible a usuario.

Por último se destacó que el machine learning aplicado a la digitalización de contenido es la principal tendencia como valor añadido al producto. Incluso la efectividad del OCR también ha mejorado de forma exponencial con el machine learning, así como los metadatos.

En cuanto a los derechos de autor se ha retrocedido, porque se van amplían los años de protección de estos derechos y dificultan el acceso libre. A veces hay un limbo en el que las empresas no están interesadas en reeditar el ejemplar y tampoco está en dominio público. Debería hacerse disponible si nadie le saca provecho económico.

 

Querido José Luis La Torre Merino

Lamentablemente, el sábado día 13 de enero nos llegó la triste noticia del fallecimiento de José Luis La Torre Merino, un gran profesional de la archivística, un gran docente y un gran compañero.

Como profesional de los archivos, su actividad se centró en el ámbito de los archivos estatales, en el Archivo General de la Administración al comienzo de su andadura profesional y, posteriormente, como Subdirector del Archivo Histórico Nacional y Vocal de la Junta de Calificación, Valoración y Exportación de Bienes de Patrimonio Histórico Español, como especialista en las áreas de Archivos, Documentos y Patrimonio documental.

En el marco de esta actividad,  desarrolló una importante labor en la formación de los futuros archiveros de Iberoamérica y ejerció una función divulgadora en diferentes congresos y reuniones de carácter científico en los que participó como ponente y conferenciante.

Esta actividad investigadora y divulgadora ha quedado plasmada también en sus numerosos estudios y publicaciones de gran relevancia para el campo de la archivística como su manual Metodología para la identificación y valoración de fondos documentales, escrito en colaboración con Mercedes Martín-Palomino y Benito.

Como profesor del Departamento de Biblioteconomía y Documentación de la Universidad Carlos III impartió las siguientes asignaturas dentro de la Diplomatura, la Licenciatura y el Grado de Información y Documentación: Paleografía y Diplomática, Historia de las Instituciones, Archivística, Gestión de documentos.

Así mismo, en estudios de postgrado, fue profesor del Master de Archivos, Gestión de Documentos y Continuidad Digital y del Máster en Bibliotecas y Patrimonio Documental.

Como profesional curioso e inquieto de una profunda honestidad intelectual, estuvo atento siempre a los aspectos novedosos de su área de conocimiento. Muestra de ello es su contribución como profesor del MOOC: Introducción a la caligrafía y paleografía en archivos hispanos medievales y modernos de esta misma universidad, una innovadora experiencia de aprendizaje que se inscribe dentro de los postulados de las Humanidades Digitales y busca la combinación de Caligrafía y Paleografía.

El perfil que acabo de esbozar avala que era un profesional brillante y riguroso, era también un magnifico docente al que los alumnos adoraban pero, sobre todo, era una persona de una gran calidad humana, generosa y vitalista, siempre con una sonrisa, siempre tan cordial…

Es muy doloroso para mí hablar de José Luis en pasado. Todos los recuerdos que tengo de él son gratos así como todos los comentarios que me llegan de otros compañeros que inciden en su generosidad y su sentido de la amistad.

Querido José Luis, te vamos a echar muchísimo de menos, recordaremos siempre tu alegría de vivir.

Un abrazo para su mujer y sus hijas.