Socios de SEDIC visitan la Biblioteca del Ministerio de Agricultura. 20 febrero 2018

El Archivo y la Biblioteca  dependen del Ministerio de Agricultura según el reglamento, que establece su estructura,  publicado en 1902.

En 1908, aparece el Reglamento Interior de la Biblioteca de la Dirección General de Agricultura.

Actualmente la BIBLIOTECA se encuentra situada en la segunda planta del conocido Palacio de Fomento, situado en el Paseo de Infanta Isabel número 1. Es un edificio que data del siglo XIX. Su autor es el arquitecto Ricardo Velázquez Bosco y está ubicado en el espacio que entonces ocupaba el Huerto del Botánico. Este detalle es importante por  los fondos históricos, documentos que proceden de esa época, actualmente conservados  en el Archivo.

La Biblioteca especializada en temas de agricultura, pesca, alimentación y fundamentalmente del desarrollo rural, contiene publicaciones desde 1604.

A la izquierda podemos ver un DETALLE de la escalera en la Sala de Lectura que da acceso a los libros conservados  en los tramos superiores.

Se accede  por unas fantásticas pero estrechas escaleras de caracol en hierro forjado de la época de construcción del edificio.

En el Palacio de Fomento, al estar declarado Bien de Interés Cultural, no se puede hacer ninguna intervención que facilite el acceso a la zona superior de la sala al personal que atiende las peticiones de los  lectores.

Este inconveniente es soslayado por el personal bibliotecario con sentido común y mucho cuidado por el riesgo de posibles caídas si no llevan un calzado adecuado.

ARCHIVO

En los dos archivos centrales del Ministerio de Agricultura y Pesca, Alimentación y Medio Ambiente, se custodian los documentos administrativos que transfieren los archivos de oficina de las distintas unidades del Departamento.

El Archivo Central del Área de Agricultura y Alimentación, aparte de las transferencias de documentos recientes, custodia documentación  anterior al siglo XX relativa a Pósitos, Agricultura y Montes y Aprovechamientos forestales, junto con gran cantidad de documentación administrativa fechada desde principios del siglo XX hasta nuestros días.  Esta documentación de incalculable valor histórico, actualmente en proceso de tratamiento archivístico en los depósitos de San Fernando de Henares.

En el Ministerio también existen Colecciones específicas de gran interés histórico como los archivos del Fondo Documental del Monte o los archivos de Vías Pecuarias.

Como todo el edificio, la singularidad y belleza de su biblioteca se enmarcan en un espacio que constituye un referente arquitectónico y bibliográfico de primer orden. Haber podido visitar algunas de sus áreas con la información y acompañamiento de los técnicos de dicho Ministerio, nos ha otorgado una visita muy esclarecedora de un fondo patrimonial de incalculable valor, no solo para los profesionales interesados en su conocimiento, sino también para toda aquella persona interesada en conocer una riqueza, muchas veces no suficientemente valorada, de la enorme importancia de nuestros campos y  costas y áreas marítimas propias.

Todo eso es lo que nos da esa situación de privilegio y primacía en el mundo en tantos epígrafes económico-agrícolas.

La página web del Ministerio ofrece visitas guiadas para conocer, incluso con visitas teatralizadas, el magnifico Palacio de Fomento.

Sobre la utilidad del Código de Ética

La existencia de un código deontológico, además de por lo que representa al promover la reflexión sobre los principios con los que los profesionales de la información pueden establecer políticas y afrontar dilemas, mejorar la autoconciencia profesional y proporcionar transparencia a los usuarios y a la sociedad en general, tiene para mí un valor específico en sí mismo, un trascendental montante suplementario en cuanto a la reafirmación que supone de una profesión. La identidad profesional es un tema muy recurrente en nuestro campo y contar con elementos de este tipo significa que la gestión y el acceso a la información representan  un papel relevante en la sociedad.

El marco ético de la profesión que nos ofrece la IFLA en el preámbulo de su “Código de ética de la IFLA para bibliotecarios y otros trabajadores de la información” ya rechaza explícitamente la censura y cualquier restricción en el acceso a la información. Ese documento formula normas y valores y regula un comportamiento del que ejerce la profesión. El problema está en que muchas veces es la organización, entidad o corporación a la que pertenece el profesional de la información, la que actúa contra los principios éticos del profesional. De ahí la importancia de que las bibliotecas y cualquier unidad de información haga todo lo que pueda por esmerarse en reproducir estos códigos éticos de manera personalizada. Los profesionales son responsables de convertir la deontología en un afán de la entidad en la que desempeñan su labor. Un ejemplo a seguir nos lo da la Biblioteca Universitaria de Valladolid, en cuya revisión en 2017 del código original de 2013, introduce como disposición final la pauta de renovar de manera permanente el documento como garantía de la validez del mismo.

En esta tarea de generación de documentos deontológicos, los profesionales cuentan, como no podría ser de otra manera, con la colaboración y, si lo desean, con las propuestas aportadas por las asociaciones profesionales como SEDIC. El “Código deontológico de SEDIC” fue una de las primeras manifestaciones formales, dentro del estado español, en este campo. El fruto de una labor muy bien articulada por el grupo de trabajo sobre ética creado a propósito, e integrado por profesionales y académicos.

Además de estos dos argumentos, la reafirmación de la profesión y la necesidad de replicar las normas deontológicas de manera particular, quisiera señalar una manifestación más del valor de los códigos, y es en todo lo que se refiere a los derechos de autor.

La defensa de la propiedad intelectual es cada vez más trascendente, por la llegada del entorno digital. A través de los códigos deontológicos los profesionales ponemos continuamente el foco en la necesidad de que los políticos actúen y los derechos de autor se regulen de acuerdo con los tiempos, y sean sensibles  a la falta de un equilibrio que de seguridad a todos los agentes implicados: creadores, bibliotecas y usuarios.

Os propongo daros una vuelta por este espacio del sitio web de IFLA: “Código de Etica Nacionales para bibliotecarios”, donde encontraréis decenas de muestras de códigos de ética profesiones para bibliotecarios, buscad la inspiración… en esos textos y en nuestro querido Forges.

 

Bibliografía recomendada:

CÓDIGO DE ÉTICA DE LA IFLA PARA BIBLIOTECARIOS Y OTROS TRABAJADORES DE LA INFORMACIÓN. IFLA. Disponible en: https://www.ifla.org/files/assets/faife/codesofethics/spanishcodeofethicsfull.pdf. [Consulta: 28.02.2018]

Rodríguez-Yunta, Luis (2014). “Dos códigos deontológicos globales para profesionales de información y documentación: IFLA Y SEDIC-FESABID”. Anuario ThinkEPI, v. 8, pp. 59-63. Disponible en: http://digital.csic.es/bitstream/10261/98845/1/059-063_Rodriguez-Yunta.pdf. [Consulta: 28.02.2018]

Pérez-Salmerón, Gloria (2014). “Las bibliotecas y su necesidad de protección ante los derechos de autor”. Anuario ThinkEPI, v. 8, pp. 126- 131. Disponible en: https://recyt.fecyt.es/index.php/ThinkEPI/article/viewFile/29566/15675 [Consulta: 28.02.2018]

SEDIC – Asociación Española de Documentación e Información (2013). Código deontológico de la SEDIC. Disponible en: http://www.sedic.es/codigo_deontologico_sedic.pdf [Consulta: 28.02.2018]

Bibliobuses: las mil y una anécdotas

El pasado día 7 de febrero, SEDIC ofreció una visita profesional a las instalaciones de Bibliobuses de la Comunidad de Madrid. la directora del Servicio, fue la cicerone y habló del trabajo que allí se desarrolla y lo que supone esta extensión bibliotecaria que se inició en 1986 bajo el mandado del entonces presidente de la Comunidad, Joaquín Leguina.

Toda la información recibida fue muy valiosa, sin embargo, mi interés se centró en el equipo humano; por eso, sirvan estas líneas para rendir mi particular homenaje a todos los profesionales del Servicio.

Cuando entré en las dependencias de Bibliobuses, sitas en la Av. Laboral, nº 11 (Madrid), la sensación que percibí fue la de taller de ilusiones, donde los diversos profesionales se mueven como laboriosos duendecillos por las oficinas, el depósito, el hangar y las salas de la gran nave. Nadie les ve, pero su actividad no cesa en pos del beneficio social de acercar la lectura allí donde los usuarios lo necesitan.

La plantilla de Bibliobuses está formada por treinta y nueve profesionales entre bibliotecarios y conductores, un auxiliar administrativo, un auxiliar de servicios generales y un jefe de equipo de los bibliobuses. En cada bibliobús sale un conductor y un bibliotecario para cubrir los 13 bibliobuses con que cuenta el Servicio,  más dos conductores suplentes y tres bibliotecarios suplentes.

Los bibliobuses tienen un total de 177 paradas (entre una y tres paradas cada día) y recorre un total de 119 municipios de la Comunidad de Madrid; incluido Madrid capital, considerada como un municipio más, donde se visitan 16 distritos y se efectúan 40 paradas, que traducido todo a medida de longitud, el viaje con retorno incluido, supone muchos kilómetros.

Villamanta es un municipio donde el bibliobús realiza su visita

 La excelencia del Servicio de Bibliobuses es conocida y reconocida, pero poco se sabe de las andanzas de los bibliotecarios. El día a día puede convertirse, a veces, en algo poco llevadero a causa del clima, pues por muy bien acondicionadas que están los bibliotecas móviles es inevitable que el frío y el calor les afecte; o del entorno, pues por bien ubicadas que estén las paradas, los aseos no siempre están cerca. O también, por muy acogedores que sean los municipios y distritos, y amables los usuarios, es inevitable que los bibliotecarios lleguen a estar desbordados por las necesidades de los mismos, olvidando sus propias necesidades, a bastante distancia de la unidad central del Servicio.

Por fortuna los bibliotecarios no van solos. Los conductores de los bibliobuses son sus compañeros de viaje, siempre pendientes del tráfico, la climatología y de cada ruido que emiten los motores de las bibliotecas móviles. Sin el visto bueno de los conductores y del jefe de equipo, en cuanto a estar todo en orden para realizar los desplazamientos rutinarios y exitosos, las  unidades móviles no pueden salir, por lo que se puede decir que son una parte muy importante del Servicio de Bibliobuses.

Sea como fuere, tanto trabajo, tantas horas, tantas rutas, dan para escribir un libro que bien podría titularse Bibliobuses: las mil y una anécdotas. Animo a ello, pues estoy segura de que siguiendo a Ranganathan en cuanto “a cada lector su libro” y “a cada libro su lector”, lectores y usuarios apreciarían todavía más la labor de los profesionales desplazados “que les ahorran tiempo” y les animan a “usar los libros”. Y es que “la biblioteca es un organismo en crecimiento”, pero quien la hace verdaderamente grande son las personas que trabajan en ella, en este caso, en el Servicio de Bibliobuses de la Comunidad de Madrid.

 

 

Los comparadores y la Documentación

La Documentación es más conocida por su vinculación al entorno bibliotecario y archivístico, que por su directa relación con los servicios de información en la nube que están transformando la economía digital y que nos hacen la vida más fácil. Es el caso de los comparadores. ¿Quién no ha usado el famoso comparador de hoteles, vuelos, seguros, viajes…? Probablemente se piense que son aplicaciones que nada tienen que ver con la Documentación, pero eso no es cierto. Si aprendemos su método de funcionamiento, observaremos que tales programas realizan tareas de consulta, tratamiento, almacenamiento y gestión de la información, similares a las que realizaría un bibliotecario con una colección bibliográfica. Pero, diseccionemos mejor el objeto de este artículo, “los comparadores”.

Un comparador es un programa diseñado para recolectar información sobre un determinado “ítem” u objeto, que consta de unas propiedades informativas y descriptivas concretas, que pueden ser en mayor o menor medida enfrentadas o comparadas cuantitativa o cualitativamente. Por regla general, el objetivo es obtener el precio de un mismo producto en distintos sitios web, o fuentes de información, con el fin de determinar el proveedor más económico. Sin embargo, esta técnica también puede emplearse para comparar libros, artículos, catálogos bibliográficos, recursos de información… lo que convierte a los comparadores en verdaderos buscadores, altamente especializados. Pensemos por un momento que se pudieran comparar las distintas ediciones de un libro y señalar sus diferencias, o bien entre dos o más artículos científicos, identificar sus influencias temáticas, comparar sus referencias bibliográficas y aparato crítico, extensión, palabras clave, conclusiones, o bien comparar la composición bibliográfica de un catálogo en relación al de otras bibliotecas. Ello representa una mínima parte de lo que se puede hacer sólo en el sector bibliotecario. En el sector mediático, podría compararse una misma noticia en los distintos medios de comunicación, determinarse la orientación de la misma a través de sus palabras clave, el análisis de sentimiento e incluso relacionarla con los eventos económicos. Si lo indicado hasta ahora, ya resulta interesante, podemos afirmar que la capacidad para comparar los datos, la información y la documentación son la antesala de la verdadera inteligencia artificial. Dicho de otra forma, una inteligencia artificial compleja es aquella capaz de medir y obtener datos, compararlos y establecer relaciones complejas de forma predefinida, aleatoria o por medio de técnicas de aprendizaje automático. En la práctica, esto ha supuesto que existan programas autónomos capaces de invertir en bolsa, tomar decisiones sobre el tráfico de una ciudad, gestionar puertos y aeropuertos, organizarnos un plan de ocio para el fin de semana, programar un viaje e incluso simular la toma de decisiones gubernamentales según el factor geopolítico y económico. Cuanta mayor es la capacidad para comparar, mayor es el conocimiento de causa y mejores decisiones se pueden tomar.

Ahora bien ¿Cómo funciona un comparador? En primer lugar, se determinará el objeto de comparación. Un “ítem” que figure en diversas fuentes de información o catálogos. Al estar presentes en la web, constan de una estructura HTML que puede ser analizada mediante un programa, denominado “parser”, que rastrea el contenido en el que estamos interesados. Este programa se encarga de extraer toda la información, organizarla y almacenarla en la base de datos. A esta operación, se la puede denominar minería de datos y es fundamental para dotar de una base de conocimiento al programa comparador. La capacidad para identificar los datos e informaciones es clave para realizar operaciones más complejas. Por ejemplo, puede diseñarse un programa parser que consulte una lista de libros a partir de su código ISBN en el catálogo OPAC de una biblioteca y, además, sea capaz de extraer sus campos de descripción, título, autor, editorial, fecha, materia, descripción física, precio, etc. Pero el programa puede mejorarse si utiliza estos datos para realizar una búsqueda más avanzada en los catálogos comerciales, comparando el precio del libro, la edición, o las distintas editoriales que han publicado una obra en particular. En cualquier caso, la información obtenida por los programas parser es registrada mediante consultas SQL, en bases de datos como MariaDB, MySQL, PostGree SQL, Oracle, et.al. Las bases de datos disponen de tablas con una estructura específicamente diseñada para alojar cada dato e información obtenida. Por regla general, albergan capacidad para registrar resultados de búsqueda para un ítem en distintos catálogos, haciendo efectiva cualquier comparación.

Completada la fase de recopilación y minería, el siguiente paso es la fase de inteligencia comparativa, en la que se tiene un programa de comparación, encargado de procesar las consultas del usuario sobre un “ítem” cualquiera, presente en la base de datos. En este punto, se aplican los métodos de recuperación de información para una búsqueda eficaz de los contenidos demandados y, por otra parte, los algoritmos de discriminación y ordenación de resultados según economía, compleción, grado de actualización o adecuación a las necesidades del usuario. Ello puede diseñarse en lenguajes de programación como PHP, con los que establecer el comportamiento, reglas y condiciones de la comparación, así como la identificación de características añadidas mediante reconocimiento por patrones. El resultado de la comparación suele ser una tabla ordenada en la que se destaca el ítem más adecuado en torno a los puntos de comparación indicados por el usuario. Por ejemplo, si se trata de comparar un libro, qué edición proporciona más ilustraciones, cuál tiene mejores críticas, cuántas referencias bibliográficas, aparato crítico. En el caso de los portales de recursos multimedia o “stockfootage media”, qué repositorio gráfico proporciona mejores precios, condiciones de acceso y uso, cuántas imágenes o recursos pueden utilizarse, con qué resoluciones, calidad, etc. Otro hipotético caso, las licitaciones públicas, pueden ser tratadas con el mismo principio. Qué empresa proporciona mejor precio, materiales, qué aspectos del contrato o checklist cumple y cuáles no, cuál es el número de incidencias que tuvo esa empresa, retrasos, contratos cumplidos en tiempo y forma, datos de la empresa, en relación a otras del sector. Otros ejemplos; la comparación de precios de materias primas, commodities, datos fiscales de empresas por sectores, la publicación científica a nivel macro y micro, comparación de patentes y modelos de utilidad, análisis automático de plagios, etc.

En conclusión, los comparadores son una herramienta esencial para convertir la Documentación en una ciencia para la transformación y aprovechamiento inteligente de la información. Nos enfrentamos a un reto sin precedentes, en el que nuestros profesionales tendrán que adaptarse al cambio de paradigma. La actitud proactiva y la capacidad creativa serán el principal valor diferencial, que marcará el desarrollo de modelos de información más eficientes. La información y los contenidos ya se encuentran disponibles en la Web y sólo es necesario aprender la forma de aprovecharlos, organizarlos y relacionarlos para generar nuevos servicios de información. En este sentido el documentalista deberá convertirse en un perfil altamente cualificado con conocimientos de Documentación y Biblioteconomía, pero también y especialmente, en programación orientada a objetos, web dinámica, bases de datos relacionales, recuperación de información, desarrollo de buscadores, minería de datos, procesamiento y clasificación automática de textos, sin olvidar conocimientos en gestión y administración de empresas, desarrollo de servicios web, desarrollo Frontend y Backend, metrías y estadística. Las oportunidades en este contexto son enormes y queda de nuestra parte hacer lo necesario para aprovecharlas.

 

Crónica Actualízate 2017 III sesión y entrega de premios

3ª sesión

En la tercera sesión fue presentada por Virginia Ortiz Repiso y participaron Francisco José Valentín Ruiz de Odilo y Antonio Guillermo Martínez Largo de Libnova, sobre las bibliotecas digitales en la enseñanza y sobre la inteligencia artificial aplicada a la gestión de documentos.

Francisco José Valentín presentó un modelo de cómo las bibliotecas digitales pueden ampliar los servicios que ofrecen a los usuarios, ampliando a su vez las competencias transversales. Para ello se destacan cuatro puntos:

  1. El negocio de las bibliotecas digitales. Las empresas también sacan rentabilidad de la gestión de las bibliotecas. Según datos del MECD el coste de un préstamo físico es casi cuatro veces más que un préstamo digital, ya que las bibliotecas pagan por cada préstamo, puesto que en teoría se deja de vender el libro, pero en digital se paga por uso. Al final esta gestión se revierte en un ahorro para la institución.
  2. Las bibliotecas tradicionales tienen características similares a las digitales, pero se puede ir más allá que emular los servicios físicos de las bibliotecas tradicionales. Aunque cuesta introducir nuevos elementos y nuevas formas de trabajo, cada vez se están extendiendo más cambios en los servicios por ejemplo la autogestión por parte del usuario, acceso exclusivo a contenidos en bibliotecas empresariales, bibliotecas abiertas a ciudadanos y visitantes como impulso turístico, o contenidos geolocalizados en función del interés turístico.
    Las bibliotecas como espacio convencional se transforman, pierden parte de su papel pero tienen que obtener otro, reinventarse. Se centran en prestar el servicio personalizado al usuario.
    El servicio del contenido digital que se ofrece es completo. Además de la entrega del software se hace la puesta en marcha, un entorno seguro, la continuidad de negocio… El modelo de una biblioteca digital es:
  • Plataforma de gestión de contenidos digitales, siendo proveedores de servicios tecnológicos.
  • Proveedores de contenido y de otros servicios adicionales.

Gracias al software como servicio se puede ofrecer este modelo de contenido. No se podría prestar contenido si no hubiera un modelo detrás respaldado por las editoriales.
Además, las apps son fundamentales porque el consumo de contenido se hace ya desde los propios dispositivos personales. Usar solo un pdf para difundir no tiene mucho sentido, por eso el modelo de contenido es otro.

  1. Bibliotecas digitales y educación. Uno de los principales enfoques de las bibliotecas escolares es que los niños lean sin importar el dispositivo o el formato. La forma más sencilla de llevar una biblioteca sin importar donde estén y con contenido de todo tipo a los alumnos es a través de la biblioteca digital. La inversión puede llegar a muchos alumnos sin importar la escala social. Lo que es más difícil es hacer un seguimiento personalizado de cada alumno, aunque si es posible orientar las lecturas de cada uno con las herramientas digitales. Otros servicios adicionales podrían ser el club de lectura o plataformas de lectura colaborativa.
  2. Bibliotecas en educación superior. También se puede extrapolar el modelo anterior, ya que las necesidades son más o menos las mismas. Las campañas específicas o lecturas colaborativas serán diferentes pero se puede enfocar de otra manera. Habrá contenido universitario especializado, transversal, y de ocio.
    Además existe la posibilidad de hacer consorcios: utilizar economías de escala para que el contenido en sí sea más económico. El modelo consorciado consistiría en un catálogo general que todas las bibliotecas adquieren de forma conjunta, compartido en cada uno de los centros universitarios, además adquirir contenido con sus propios recursos y por último cargar contenido generado propio. Lo ideal es que la mayor parte del contenido que se genera en la universidad estuviese en abierto, sobre todo si se financia con fondos públicos.
    Uno de los aspectos más criticados a las universidades es que no preparan profesionales para entrar en el mundo laboral. Esto podría cambiar a través de la biblioteca universitaria si esta potencia otro tipo de competencias o estrategias que no están tan relacionadas con los estudios reglados, como actividades de emprendimiento, autoaprendizaje de determinados contenidos, marketing,…

Los modelos son pago por uso, por tiempo o por límite de licencias. Quizás lo más conveniente es el pago por uso, ya que los costes no tienen por qué ser mayores y se evita tener documentos que no se utilicen.

Al final se tienen unas mismas necesidades tecnológicas, independientemente del tipo de cliente o usuario, con diferentes necesidades de contenido. Se trata de potenciar las competencias digitales en la enseñanza, a través de un modelo basado en contenidos digitales, para democratizar el acceso a la cultura.

 

Antonio Guillermo Martínez Largo realizó una introducción a la inteligencia artificial y a las redes neuronales y porque se incluyen estas tecnologías a la gestión de la información y qué tipo de sistemas da como resultado.

La inteligencia artificial es un campo muy poco conocido, sobre todo en el campo de la documentación, sin embargo está generando una gran oportunidad para los profesionales y una salida laboral muy relevante para los próximos años.

En 2007, a través de un proyecto de digitalización masiva en BNE se detectó un problema técnico muy relevante en cuanto a preservación digital: se invertían grandes cantidades en digitalizar con muy alta resolución, pero esos objetos generaban un pdf en baja resolución y era lo que se subía a la web. Además, el almacenamiento de este proceso era muy grande y generaba dificultades en la búsqueda de información.

En realidad, ese proceso de conservación de información de forma accesible se llama preservación digital. Para hacerla posible de manera eficaz se buscó en el mercado herramientas y alternativas pero lo que había era excesivamente caro, no se ajustaba o no cumplía la necesidad de gestionar estos de grandes volúmenes.

Así se empezaron a crear pequeñas herramientas y asistencias a los distintos procesos, que incluso tenían sentido más allá de la biblioteca, en otras instituciones ya que esta necesidad latente estaba muy extendida. En lugar de enfocarlo como un servicio para un proyecto particular, se enfocó como un producto, un software que acumulaba los distintos procesos.

Hoy Libnova es una de las tres principales compañías del mundo en preservación digital y continúan la expansión. Finalmente se creó un producto que con costes muy bajos aportaba mucho valor, y soluciones extremadamente eficientes al proceso.

Este proyecto es muy interesante y pionero porque es el primero que ha combinado en un solo repositorio, un sistema de preservación digital de información documental, histórica, y patrimonial, con administración electrónica.

Hoy en día, mucha información en las compañías, instituciones y empresas, por no tener los recursos suficientes, no se está archivando y estructurando adecuadamente la información. Cuando se empezó a pensar en que tecnologías emergentes van a cambiar la industria documental de forma disruptiva tal y como la conocemos es, sin duda, la aplicación de procesos de inteligencia artificial, machine learning y redes neuronales profundas.

En el enfoque de resolución de un problema con estos procesos consiste en que la persona selecciona las herramientas de inteligencia artificial que tiene a su disposición y posteriormente ayuda en su entrenamiento. Lo relevante e interesante de esta tecnología es que aunque se cambie un dato, si se ha entrenado a la máquina correctamente, podrá seguir trabajando sin escribir un código nuevo: será capaz de comprender las diferencias y se adaptarse. Este proceso va a cambiar la forma en que procesamos, ordenamos y entendemos información. Los profesionales se centraran en disponer o seleccionar los algoritmos que se van a usar, las herramientas de inteligencia artificial que se pueden utilizar y a entrenar al sistema para que procese esa información.

El conocimiento que hace falta para seleccionar estos algoritmos y entrenar estas redes neuronales no es difícil de adquirir, hay que saber estructurar la información y ordenar los documentos. Por ello, este trabajo es más accesible para un documentalista que para un informático.

Básicamente los algoritmos más utilizados en este sector son los algoritmos supervisados, se dividen en tres tipos:

  • Algoritmos de clasificación: pueden enseñar a una máquina a clasificar documentos. El sistema es capaz, si se definen bien las estructuras de información, de aprender y procesar grandes cantidades de información muy rápidamente.
  • Algoritmos de regresión. Permiten predecir comportamientos conforme a lo que ya ha sucedido, no solo mirando a un sector concreto sino también a otros relacionados que pudieran afectarle.
  • Detección de anomalías en el sistema: hay algoritmos que son capaces de darse cuenta de cuando pasan cosas no habituales. Tiene esa sensibilidad, que está aumentado mucho así como el procesamiento. Se aplica en preservación digital y el sistema advierte, por ejemplo, de páginas en blanco, borrosas o saltos.

En un proceso de preservación clásico esta tecnología es aplicable cuando en una empresa se tienen cientos de miles de documentos en un servidor y estructurados de cualquier forma, incluidos los correos electrónicos. En este caso se siguen unos pasos concretos:

  1. Se hace un proceso para que se fije la información y comprobar posteriormente que no se pierde, atendiendo a criterios de preservación digital.
  2. Se extraen las características de los documentos. Analizándolos de formas distintas hasta obtener representaciones comprensibles o modelos gráficos del tipo de documentos con el que se está trabajando.
  3. Se detectan anomalías. Un paso muy relevante en preservación digital, como saber si está protegido con contraseña o dañado.
  4. Se indexa el texto completo, se extrae todo el texto del documento.
  5. Se hace una clasificación y marcado de los distintos documentos: ficheros problemáticos o información potencialmente sensible,… Se organiza la información.

Existe un vacío laboral enorme entorno a este mercado. Además hay buenas perspectivas en los próximos años para diseñar y entrenar este tipo de sistemas.

El flujo actual en la gestión de la información desde hace unos años es catalogar, digitalizar, preservar y difundir. Con este sistema se puede asegurar que el contenido, la estructura y la recuperación de la información es correcta. Sin embargo, hay que luchar contra la ignorancia de esta necesidad, ya que solo cuando se descubre el daño ya está hecho.

Entre las preguntas del público se plantea que formación es necesaria para introducirse en el campo de la inteligencia artificial vinculada a la gestión documental. Sin duda, los estudios más relevantes son másteres en inglés. Es posible que en un par de años empiece a llegar a España.

A continuación se hizo entrega del IV Premio Universitario Sedic, a cargo de María Teresa Fernández Bajón y Carmen Morales Sanabria, que hizo la lectura del acta.

  1. Irene Calzado Obispo. Universidad Complutense de Madrid. Trabajo fin de grado: Desarrollo de un motor de búsqueda.
  2. Nuria Barrio Santos. Universidad de Salamanca. Trabajo fin de grado: Cuando la historia no está escrita.
  3. Arantxa Martin Becerro. Universidad de Salamanca. Trabajo fin de master: La literatura infantil y juvenil en las plataformas de venta de libros electrónicos.

A lo largo de la jornada, se puso en relevancia la necesidad de preservar, organizar y gestionar el conocimiento para democratizar la cultura, y hacer posible el acceso abierto gracias a la conservación y con la digitalización.

El objetivo es hacer posible que grandes volúmenes de información valiosa esté disponible para toda la sociedad y para largo plazo. Para ello también hay que colaborar entre las empresas privadas y las empresas públicas conjuntamente, y crear modelos válidos de desarrollo. Así mismo es importante ofrecer el apoyo a los autores y editores para el acceso libre al conocimiento.

Además las herramientas para lograr todo esto se dirigen claramente hacia la utilización y adecuación del conocimiento a los dispositivos móviles, con una correcta visualización y una búsqueda adaptada a estos entornos.

Las reflexiones que se llevan a cabo en estas jornadas nos ayudan a ver nuevos horizontes y nuevas líneas de investigación, nuevos perfiles y a abordar mejor nuestros estudios de documentación.

Se agradeció la participación a las empresas que han colaborado, a la Universidad Carlos III y a Sedic, así como a la UCM. Esta colaboración es muy positiva para mejorar en los estudios de documentación y ver nuevos horizontes el mercado laboral.

Crónica Actualízate 2017 II sesión


En la segunda sesión Jose Luis Menéndez expuso la puesta en marcha de una nueva aplicación para bibliotecas. Por su parte, Francisca Hernández Carrascal nos contó algunos de los proyectos más novedosos con Digibis. Por último, Carlos Pérez nos habló de Proview, e-reader para la colección de obras de las editoriales de Thomson en España.

La aplicación My IE Library Account, permite tener en el móvil toda la Biblioteca Virtual IE, a cualquier hora y en cualquier lugar. Además, permite realizar todas las tareas de circulación de las bibliotecas con la que los usuarios son totalmente autónomos: préstamo, devolución, búsqueda de recursos, reserva y pago de multas. No es obligatorio descargarse la aplicación, ya que también habrá terminales comunes en las bibliotecas para hacer el proceso.

Respecto al futuro de los bibliotecarios, tendrán que reciclarse hacia otros niveles de gestión y hacia los datos. La idea es que las tareas iterativas, en la medida de lo posible, deben hacerlas la tecnología.

Digibis es una empresa española referente en digitalización y la creación archivos, museos y bibliotecas digitales, con clientes de entidades públicas y privadas, ya sea en España o en otros países. Estas entidades tienen peculiaridades, contenidas en las siguientes líneas estratégicas:

  1. Contenido de bibliotecas, archivos y museos digitales e híbridos.
  2. Normativa específica de archivos, bibliotecas y museos.
  3. Interoperabilidad y visibilidad, es fundamental y ha aumentado mucho en los últimos años. Proyectos como Hispania y Europeana ha obligado a la uniformidad normativa y una mayor interoperabilidad.
  4. La web actual es la web semántica y los datos enlazados o linked open data.
  5. Evaluación de la usabilidad e impacto de los sistemas de información digitales entre los usuarios. Los esfuerzos de inversión en la creación de colecciones digitales son muy grandes pero el impacto es reducido. Hay que mejorarlas y preguntarse por qué tienen un uso tan restringido, por ejemplo en educación.

Un proyecto muy importante es la Biblioteca Virtual de Polígrafos, mantenida por la Fundación Larramendi. Se trata de un campo de pruebas para programas en desarrollo. Ejerce labores de vigilancia tecnológica muy importantes sobre qué se hace, los proyectos punteros, cuales son tendencia, y cuales se estabilizan. No es productiva pero si importante para la actualización e innovación.

Ente los programas que Digibis tiene se encuentran:

  • Digibib (para bibliotecas). Gestión de la colección física y digital. Tienen 31 bibliotecas virtuales presentes en Europeana utilizando su normativa. Se hizo la compatibilidad entre los programas y permitieron que los contenidos en español tuvieran más cobertura. Esto ofrece una posición de visibilidad muy amplia.
  • Digiarch (para archivos). Programa implantado en 2015 que permite la descripción de fondos archivísticos en un entorno normalizado, basándose en la norma ISAD(G). Es interesante en mantener la jerarquía de los niveles de descripción y el contexto de posición de una unidad dentro de un conjunto más general. Esto se hace con los cuadros de clasificación, aunque presentan dificultades para que se puedan gestionar de una forma usable.
    Digiarchs se ha utilizado en el archivo fundación Norman Foster de imágenes, con objetos de gran resolución y calidad, importante para visualizar en los diferentes dispositivos, ya que permite gran nivel de ampliación y detalle.
  • DigiOAI. Repositorio adaptado al protocolo OAI-PMH, que permite que los registros almacenados en una base de datos, puedan ser agregados por cualquier servicio de recolección de metadatos y soporta distintos formatos. Realiza una transformación dinámica de datos.
  • DigiHub (repositorio Hub-PMH). Programa de agregación de metadatos, también basado en la aplicación del protocolo OAI-PMH, lo que permite la posterior agregación de estos recursos a proyectos nacionales e internacionales. La instalación más importante es Hispana, con gran crecimiento de registros; en metadatos es la primera fuente de información en España.
  • Digimus (para museos). Programa para la descripción de piezas de museos conforme a las especificaciones del ICOM. La instalación más destacada es la del centenario de El Greco. Permite una presentación muy interrelacionada de los datos para mejorar las presentaciones y facilitar a los usuarios que elijan las vías de navegación haciendo propuestas de relaciones, basadas en los vínculos entre los datos con otras obras u otras versiones. Puede importar distintos recursos Linked Open Data

Se están abriendo nuevos servicios con datos abiertos vinculados con fuentes externas y enriquecimiento de datos masivos, para esto es muy importante el Linked Open Data y la web semántica. El desarrollo de procedimientos masivos o semiautomáticos permite realizar la transición entre los datos tradicionales de bibliotecas a los datos abiertos enlazados.

También es muy importante la presencia dentro de Wikipedia, ya que es el 5º sitio de la web y realiza a través de Wikidata un importante trabajo del control de autoridades. En este caso, la biblioteca digital de Castilla y León proporciona identificadores de registro de autoridades, que se usan dentro de la propia Wikipedia.

Con todo este trabajo, se intenta llegar a la filosofía de Tim Berners Lee, que llego a categorizar los diferentes pasos para conseguir datos abiertos, vinculados y presentes en la web semántica y con ello impulsarla:

  1. Publicar los datos en la Web bajo una licencia abierta
  2. Publicar los datos en una estructura reconocible y reutilizable
  3. Usar formatos no propietarios, abiertos.
  4. Usar URLs para referenciar datos
  5. Enlaza tus datos a otros datos, dotándolos de contexto.

Para Thomson Reuters el objetivo principal es ayudar a los clientes en el proceso de transformación digital. A pesar del cambio hacia un entorno digital, se ven reticencias sectores como el editorial. Hay mucho apego al papel y a la manera de trabajar pero el cambio digital es para todos, existen las herramientas y hay que sacarle partido.

En general, aunque el papel no desaparecerá, se da una tendencia clara a lo digital por eficiencia y por las posibilidades que presentan las herramientas digitales. Según datos recientes del MECD la tendencia es que el libro en papel baja pero es permanece estable, y el libro electrónico aumenta pero se mantiene y no alcanza aun al papel.

En Thomson Reuters desde hace un tiempo publican todas las novedades en digital y además han rescatado una serie de obras de su fondo editorial. La demanda de lectura electrónica tiene que ir unida a la calidad de los contenidos. Esto se canaliza con Proview, plataforma de visualización de ebooks, que proporciona acceso y consulta a todas las monografías, códigos y demás obras en la biblioteca digital de Thompson Reuters, en diferentes dispositivos.

Las aportaciones que ofrece Proview son múltiples:

  • Movilidad, en cuanto a la disponibilidad de la información en cualquier momento y lugar. Para ello, se lanzará Proview para el móvil.
  • Búsqueda de información. A veces es difícil encontrar una información en la biblioteca. Esta plataforma trata de que sea sencillo, preciso y rápido entre todos los textos de todas las publicaciones de Thomson Reuters España.
  • Personalización de contenidos: es un punto clave porque supone el salto del paradigma de papel a digital. En los documentos electrónicos se da la falta de sensación táctil del papel, la pertenencia material de libro tradicional, subrayar, tomar notas,… estos son condicionantes importantes a la hora de mejorar la transición de papel a digital.
  • Trabajo colaborativo: compartir la información, enviándola a través de un pdf o con un enlace a una obra. Con el objetivo de que esta información al ser compartida, enriquezca a ambas partes.
  • Calidad de la información: además de la tecnología y la inversión en la evolución de los productos se necesitan publicaciones actualizadas, con los últimos cambios, con referencias a todos los contenidos de las bases de datos asociadas, y su integración. Es importante que haya coherencia entre los datos, lo que aparece en ebook y en las bases de datos. Otra cuestión es que transformar un libro en pdf no es digitalizar, es tener enlaces, datos directos a las bases de datos que refuercen la información,… Es lo que se entiende como calidad de la información.
  • Innovación y tendencias. Aunque es difícil hacer una predicción en los próximos años, para un corto o medio plazo se da un peso muy fuerte en el uso del móvil y la posibilidad de poder llevar contigo toda tu biblioteca.

Como puntos a mejorar en el futuro se encuentran:

  • La información, la interconectividad, y la pertinencia de los resultados de búsqueda con la mejora de algoritmos. Cómo interpretar lo que está buscando el cliente y sacarle el contenido más acertado.
  • La biblioteca internacional: editoriales en todo el mundo conectadas y que ofrecer bibliotecas digitales con contenido internacional.
  • Proview Publishing Services: plataforma de próxima aparición en la que cualquier persona podrá publicar contenido. Es una manera de dar a conocer el trabajo profesional y ser reconocido por el resto del mundo.

El acceso a las bibliotecas o archivos digitales es muy importante, saber en qué medida se hace y cuando no. En un servicio de información se necesita saber que partes hay que mejorar para facilitar un acceso más amplio.

También la monitorización es muy relevante en las bibliotecas porque permite la toma de decisiones. Es un trabajo interno que da cuenta de la experiencia del usuario, que al fin y al cabo son los clientes finales.

A pesar del acceso abierto hay que dar importancia al autor, retribuirle correctamente. Además es posible que en el futuro se vaya hacia modelos de edición masiva en el que el cliente se encargará de separar lo que es importante de lo que no, y en el que primaran los volúmenes de cantidad de contenidos a precios más reducidos.