Crónica Actualízate 2017 III sesión y entrega de premios

3ª sesión

En la tercera sesión fue presentada por Virginia Ortiz Repiso y participaron Francisco José Valentín Ruiz de Odilo y Antonio Guillermo Martínez Largo de Libnova, sobre las bibliotecas digitales en la enseñanza y sobre la inteligencia artificial aplicada a la gestión de documentos.

Francisco José Valentín presentó un modelo de cómo las bibliotecas digitales pueden ampliar los servicios que ofrecen a los usuarios, ampliando a su vez las competencias transversales. Para ello se destacan cuatro puntos:

  1. El negocio de las bibliotecas digitales. Las empresas también sacan rentabilidad de la gestión de las bibliotecas. Según datos del MECD el coste de un préstamo físico es casi cuatro veces más que un préstamo digital, ya que las bibliotecas pagan por cada préstamo, puesto que en teoría se deja de vender el libro, pero en digital se paga por uso. Al final esta gestión se revierte en un ahorro para la institución.
  2. Las bibliotecas tradicionales tienen características similares a las digitales, pero se puede ir más allá que emular los servicios físicos de las bibliotecas tradicionales. Aunque cuesta introducir nuevos elementos y nuevas formas de trabajo, cada vez se están extendiendo más cambios en los servicios por ejemplo la autogestión por parte del usuario, acceso exclusivo a contenidos en bibliotecas empresariales, bibliotecas abiertas a ciudadanos y visitantes como impulso turístico, o contenidos geolocalizados en función del interés turístico.
    Las bibliotecas como espacio convencional se transforman, pierden parte de su papel pero tienen que obtener otro, reinventarse. Se centran en prestar el servicio personalizado al usuario.
    El servicio del contenido digital que se ofrece es completo. Además de la entrega del software se hace la puesta en marcha, un entorno seguro, la continuidad de negocio… El modelo de una biblioteca digital es:
  • Plataforma de gestión de contenidos digitales, siendo proveedores de servicios tecnológicos.
  • Proveedores de contenido y de otros servicios adicionales.

Gracias al software como servicio se puede ofrecer este modelo de contenido. No se podría prestar contenido si no hubiera un modelo detrás respaldado por las editoriales.
Además, las apps son fundamentales porque el consumo de contenido se hace ya desde los propios dispositivos personales. Usar solo un pdf para difundir no tiene mucho sentido, por eso el modelo de contenido es otro.

  1. Bibliotecas digitales y educación. Uno de los principales enfoques de las bibliotecas escolares es que los niños lean sin importar el dispositivo o el formato. La forma más sencilla de llevar una biblioteca sin importar donde estén y con contenido de todo tipo a los alumnos es a través de la biblioteca digital. La inversión puede llegar a muchos alumnos sin importar la escala social. Lo que es más difícil es hacer un seguimiento personalizado de cada alumno, aunque si es posible orientar las lecturas de cada uno con las herramientas digitales. Otros servicios adicionales podrían ser el club de lectura o plataformas de lectura colaborativa.
  2. Bibliotecas en educación superior. También se puede extrapolar el modelo anterior, ya que las necesidades son más o menos las mismas. Las campañas específicas o lecturas colaborativas serán diferentes pero se puede enfocar de otra manera. Habrá contenido universitario especializado, transversal, y de ocio.
    Además existe la posibilidad de hacer consorcios: utilizar economías de escala para que el contenido en sí sea más económico. El modelo consorciado consistiría en un catálogo general que todas las bibliotecas adquieren de forma conjunta, compartido en cada uno de los centros universitarios, además adquirir contenido con sus propios recursos y por último cargar contenido generado propio. Lo ideal es que la mayor parte del contenido que se genera en la universidad estuviese en abierto, sobre todo si se financia con fondos públicos.
    Uno de los aspectos más criticados a las universidades es que no preparan profesionales para entrar en el mundo laboral. Esto podría cambiar a través de la biblioteca universitaria si esta potencia otro tipo de competencias o estrategias que no están tan relacionadas con los estudios reglados, como actividades de emprendimiento, autoaprendizaje de determinados contenidos, marketing,…

Los modelos son pago por uso, por tiempo o por límite de licencias. Quizás lo más conveniente es el pago por uso, ya que los costes no tienen por qué ser mayores y se evita tener documentos que no se utilicen.

Al final se tienen unas mismas necesidades tecnológicas, independientemente del tipo de cliente o usuario, con diferentes necesidades de contenido. Se trata de potenciar las competencias digitales en la enseñanza, a través de un modelo basado en contenidos digitales, para democratizar el acceso a la cultura.

 

Antonio Guillermo Martínez Largo realizó una introducción a la inteligencia artificial y a las redes neuronales y porque se incluyen estas tecnologías a la gestión de la información y qué tipo de sistemas da como resultado.

La inteligencia artificial es un campo muy poco conocido, sobre todo en el campo de la documentación, sin embargo está generando una gran oportunidad para los profesionales y una salida laboral muy relevante para los próximos años.

En 2007, a través de un proyecto de digitalización masiva en BNE se detectó un problema técnico muy relevante en cuanto a preservación digital: se invertían grandes cantidades en digitalizar con muy alta resolución, pero esos objetos generaban un pdf en baja resolución y era lo que se subía a la web. Además, el almacenamiento de este proceso era muy grande y generaba dificultades en la búsqueda de información.

En realidad, ese proceso de conservación de información de forma accesible se llama preservación digital. Para hacerla posible de manera eficaz se buscó en el mercado herramientas y alternativas pero lo que había era excesivamente caro, no se ajustaba o no cumplía la necesidad de gestionar estos de grandes volúmenes.

Así se empezaron a crear pequeñas herramientas y asistencias a los distintos procesos, que incluso tenían sentido más allá de la biblioteca, en otras instituciones ya que esta necesidad latente estaba muy extendida. En lugar de enfocarlo como un servicio para un proyecto particular, se enfocó como un producto, un software que acumulaba los distintos procesos.

Hoy Libnova es una de las tres principales compañías del mundo en preservación digital y continúan la expansión. Finalmente se creó un producto que con costes muy bajos aportaba mucho valor, y soluciones extremadamente eficientes al proceso.

Este proyecto es muy interesante y pionero porque es el primero que ha combinado en un solo repositorio, un sistema de preservación digital de información documental, histórica, y patrimonial, con administración electrónica.

Hoy en día, mucha información en las compañías, instituciones y empresas, por no tener los recursos suficientes, no se está archivando y estructurando adecuadamente la información. Cuando se empezó a pensar en que tecnologías emergentes van a cambiar la industria documental de forma disruptiva tal y como la conocemos es, sin duda, la aplicación de procesos de inteligencia artificial, machine learning y redes neuronales profundas.

En el enfoque de resolución de un problema con estos procesos consiste en que la persona selecciona las herramientas de inteligencia artificial que tiene a su disposición y posteriormente ayuda en su entrenamiento. Lo relevante e interesante de esta tecnología es que aunque se cambie un dato, si se ha entrenado a la máquina correctamente, podrá seguir trabajando sin escribir un código nuevo: será capaz de comprender las diferencias y se adaptarse. Este proceso va a cambiar la forma en que procesamos, ordenamos y entendemos información. Los profesionales se centraran en disponer o seleccionar los algoritmos que se van a usar, las herramientas de inteligencia artificial que se pueden utilizar y a entrenar al sistema para que procese esa información.

El conocimiento que hace falta para seleccionar estos algoritmos y entrenar estas redes neuronales no es difícil de adquirir, hay que saber estructurar la información y ordenar los documentos. Por ello, este trabajo es más accesible para un documentalista que para un informático.

Básicamente los algoritmos más utilizados en este sector son los algoritmos supervisados, se dividen en tres tipos:

  • Algoritmos de clasificación: pueden enseñar a una máquina a clasificar documentos. El sistema es capaz, si se definen bien las estructuras de información, de aprender y procesar grandes cantidades de información muy rápidamente.
  • Algoritmos de regresión. Permiten predecir comportamientos conforme a lo que ya ha sucedido, no solo mirando a un sector concreto sino también a otros relacionados que pudieran afectarle.
  • Detección de anomalías en el sistema: hay algoritmos que son capaces de darse cuenta de cuando pasan cosas no habituales. Tiene esa sensibilidad, que está aumentado mucho así como el procesamiento. Se aplica en preservación digital y el sistema advierte, por ejemplo, de páginas en blanco, borrosas o saltos.

En un proceso de preservación clásico esta tecnología es aplicable cuando en una empresa se tienen cientos de miles de documentos en un servidor y estructurados de cualquier forma, incluidos los correos electrónicos. En este caso se siguen unos pasos concretos:

  1. Se hace un proceso para que se fije la información y comprobar posteriormente que no se pierde, atendiendo a criterios de preservación digital.
  2. Se extraen las características de los documentos. Analizándolos de formas distintas hasta obtener representaciones comprensibles o modelos gráficos del tipo de documentos con el que se está trabajando.
  3. Se detectan anomalías. Un paso muy relevante en preservación digital, como saber si está protegido con contraseña o dañado.
  4. Se indexa el texto completo, se extrae todo el texto del documento.
  5. Se hace una clasificación y marcado de los distintos documentos: ficheros problemáticos o información potencialmente sensible,… Se organiza la información.

Existe un vacío laboral enorme entorno a este mercado. Además hay buenas perspectivas en los próximos años para diseñar y entrenar este tipo de sistemas.

El flujo actual en la gestión de la información desde hace unos años es catalogar, digitalizar, preservar y difundir. Con este sistema se puede asegurar que el contenido, la estructura y la recuperación de la información es correcta. Sin embargo, hay que luchar contra la ignorancia de esta necesidad, ya que solo cuando se descubre el daño ya está hecho.

Entre las preguntas del público se plantea que formación es necesaria para introducirse en el campo de la inteligencia artificial vinculada a la gestión documental. Sin duda, los estudios más relevantes son másteres en inglés. Es posible que en un par de años empiece a llegar a España.

A continuación se hizo entrega del IV Premio Universitario Sedic, a cargo de María Teresa Fernández Bajón y Carmen Morales Sanabria, que hizo la lectura del acta.

  1. Irene Calzado Obispo. Universidad Complutense de Madrid. Trabajo fin de grado: Desarrollo de un motor de búsqueda.
  2. Nuria Barrio Santos. Universidad de Salamanca. Trabajo fin de grado: Cuando la historia no está escrita.
  3. Arantxa Martin Becerro. Universidad de Salamanca. Trabajo fin de master: La literatura infantil y juvenil en las plataformas de venta de libros electrónicos.

A lo largo de la jornada, se puso en relevancia la necesidad de preservar, organizar y gestionar el conocimiento para democratizar la cultura, y hacer posible el acceso abierto gracias a la conservación y con la digitalización.

El objetivo es hacer posible que grandes volúmenes de información valiosa esté disponible para toda la sociedad y para largo plazo. Para ello también hay que colaborar entre las empresas privadas y las empresas públicas conjuntamente, y crear modelos válidos de desarrollo. Así mismo es importante ofrecer el apoyo a los autores y editores para el acceso libre al conocimiento.

Además las herramientas para lograr todo esto se dirigen claramente hacia la utilización y adecuación del conocimiento a los dispositivos móviles, con una correcta visualización y una búsqueda adaptada a estos entornos.

Las reflexiones que se llevan a cabo en estas jornadas nos ayudan a ver nuevos horizontes y nuevas líneas de investigación, nuevos perfiles y a abordar mejor nuestros estudios de documentación.

Se agradeció la participación a las empresas que han colaborado, a la Universidad Carlos III y a Sedic, así como a la UCM. Esta colaboración es muy positiva para mejorar en los estudios de documentación y ver nuevos horizontes el mercado laboral.

Sara Guiu Garrido
Documentalista

Deja un comentario