Los comparadores y la Documentación

La Documentación es más conocida por su vinculación al entorno bibliotecario y archivístico, que por su directa relación con los servicios de información en la nube que están transformando la economía digital y que nos hacen la vida más fácil. Es el caso de los comparadores. ¿Quién no ha usado el famoso comparador de hoteles, vuelos, seguros, viajes…? Probablemente se piense que son aplicaciones que nada tienen que ver con la Documentación, pero eso no es cierto. Si aprendemos su método de funcionamiento, observaremos que tales programas realizan tareas de consulta, tratamiento, almacenamiento y gestión de la información, similares a las que realizaría un bibliotecario con una colección bibliográfica. Pero, diseccionemos mejor el objeto de este artículo, “los comparadores”.

Un comparador es un programa diseñado para recolectar información sobre un determinado “ítem” u objeto, que consta de unas propiedades informativas y descriptivas concretas, que pueden ser en mayor o menor medida enfrentadas o comparadas cuantitativa o cualitativamente. Por regla general, el objetivo es obtener el precio de un mismo producto en distintos sitios web, o fuentes de información, con el fin de determinar el proveedor más económico. Sin embargo, esta técnica también puede emplearse para comparar libros, artículos, catálogos bibliográficos, recursos de información… lo que convierte a los comparadores en verdaderos buscadores, altamente especializados. Pensemos por un momento que se pudieran comparar las distintas ediciones de un libro y señalar sus diferencias, o bien entre dos o más artículos científicos, identificar sus influencias temáticas, comparar sus referencias bibliográficas y aparato crítico, extensión, palabras clave, conclusiones, o bien comparar la composición bibliográfica de un catálogo en relación al de otras bibliotecas. Ello representa una mínima parte de lo que se puede hacer sólo en el sector bibliotecario. En el sector mediático, podría compararse una misma noticia en los distintos medios de comunicación, determinarse la orientación de la misma a través de sus palabras clave, el análisis de sentimiento e incluso relacionarla con los eventos económicos. Si lo indicado hasta ahora, ya resulta interesante, podemos afirmar que la capacidad para comparar los datos, la información y la documentación son la antesala de la verdadera inteligencia artificial. Dicho de otra forma, una inteligencia artificial compleja es aquella capaz de medir y obtener datos, compararlos y establecer relaciones complejas de forma predefinida, aleatoria o por medio de técnicas de aprendizaje automático. En la práctica, esto ha supuesto que existan programas autónomos capaces de invertir en bolsa, tomar decisiones sobre el tráfico de una ciudad, gestionar puertos y aeropuertos, organizarnos un plan de ocio para el fin de semana, programar un viaje e incluso simular la toma de decisiones gubernamentales según el factor geopolítico y económico. Cuanta mayor es la capacidad para comparar, mayor es el conocimiento de causa y mejores decisiones se pueden tomar.

Ahora bien ¿Cómo funciona un comparador? En primer lugar, se determinará el objeto de comparación. Un “ítem” que figure en diversas fuentes de información o catálogos. Al estar presentes en la web, constan de una estructura HTML que puede ser analizada mediante un programa, denominado “parser”, que rastrea el contenido en el que estamos interesados. Este programa se encarga de extraer toda la información, organizarla y almacenarla en la base de datos. A esta operación, se la puede denominar minería de datos y es fundamental para dotar de una base de conocimiento al programa comparador. La capacidad para identificar los datos e informaciones es clave para realizar operaciones más complejas. Por ejemplo, puede diseñarse un programa parser que consulte una lista de libros a partir de su código ISBN en el catálogo OPAC de una biblioteca y, además, sea capaz de extraer sus campos de descripción, título, autor, editorial, fecha, materia, descripción física, precio, etc. Pero el programa puede mejorarse si utiliza estos datos para realizar una búsqueda más avanzada en los catálogos comerciales, comparando el precio del libro, la edición, o las distintas editoriales que han publicado una obra en particular. En cualquier caso, la información obtenida por los programas parser es registrada mediante consultas SQL, en bases de datos como MariaDB, MySQL, PostGree SQL, Oracle, et.al. Las bases de datos disponen de tablas con una estructura específicamente diseñada para alojar cada dato e información obtenida. Por regla general, albergan capacidad para registrar resultados de búsqueda para un ítem en distintos catálogos, haciendo efectiva cualquier comparación.

Completada la fase de recopilación y minería, el siguiente paso es la fase de inteligencia comparativa, en la que se tiene un programa de comparación, encargado de procesar las consultas del usuario sobre un “ítem” cualquiera, presente en la base de datos. En este punto, se aplican los métodos de recuperación de información para una búsqueda eficaz de los contenidos demandados y, por otra parte, los algoritmos de discriminación y ordenación de resultados según economía, compleción, grado de actualización o adecuación a las necesidades del usuario. Ello puede diseñarse en lenguajes de programación como PHP, con los que establecer el comportamiento, reglas y condiciones de la comparación, así como la identificación de características añadidas mediante reconocimiento por patrones. El resultado de la comparación suele ser una tabla ordenada en la que se destaca el ítem más adecuado en torno a los puntos de comparación indicados por el usuario. Por ejemplo, si se trata de comparar un libro, qué edición proporciona más ilustraciones, cuál tiene mejores críticas, cuántas referencias bibliográficas, aparato crítico. En el caso de los portales de recursos multimedia o “stockfootage media”, qué repositorio gráfico proporciona mejores precios, condiciones de acceso y uso, cuántas imágenes o recursos pueden utilizarse, con qué resoluciones, calidad, etc. Otro hipotético caso, las licitaciones públicas, pueden ser tratadas con el mismo principio. Qué empresa proporciona mejor precio, materiales, qué aspectos del contrato o checklist cumple y cuáles no, cuál es el número de incidencias que tuvo esa empresa, retrasos, contratos cumplidos en tiempo y forma, datos de la empresa, en relación a otras del sector. Otros ejemplos; la comparación de precios de materias primas, commodities, datos fiscales de empresas por sectores, la publicación científica a nivel macro y micro, comparación de patentes y modelos de utilidad, análisis automático de plagios, etc.

En conclusión, los comparadores son una herramienta esencial para convertir la Documentación en una ciencia para la transformación y aprovechamiento inteligente de la información. Nos enfrentamos a un reto sin precedentes, en el que nuestros profesionales tendrán que adaptarse al cambio de paradigma. La actitud proactiva y la capacidad creativa serán el principal valor diferencial, que marcará el desarrollo de modelos de información más eficientes. La información y los contenidos ya se encuentran disponibles en la Web y sólo es necesario aprender la forma de aprovecharlos, organizarlos y relacionarlos para generar nuevos servicios de información. En este sentido el documentalista deberá convertirse en un perfil altamente cualificado con conocimientos de Documentación y Biblioteconomía, pero también y especialmente, en programación orientada a objetos, web dinámica, bases de datos relacionales, recuperación de información, desarrollo de buscadores, minería de datos, procesamiento y clasificación automática de textos, sin olvidar conocimientos en gestión y administración de empresas, desarrollo de servicios web, desarrollo Frontend y Backend, metrías y estadística. Las oportunidades en este contexto son enormes y queda de nuestra parte hacer lo necesario para aprovecharlas.

 

Profesor en la Facultad de Ciencias de la Documentación de la Universidad Complutense de Madrid (UCM)

Deja un comentario