La primera base de datos orientada a documentos destinada a la investigación histórica

Compartir

Las bases de datos son una herramienta fundamental para la investigación, también en el campo de la Historia y en las Ciencias Sociales. Hasta la fecha, la gran mayoría de proyectos de investigación histórica utilizaban el modelo relacional para crear las bases de datos (SQL por sus siglas en inglés, Structured Query Language), herramienta principal donde almacenar toda la información extraída de distintas fuentes históricas. Ahora, estos investigadores de la UPO y la US han diseñado una herramienta digital flexible, fácil de usar y potente para la investigación histórica.

Uno de los documentos que forma parte de la base de datos creada por un grupo de la UPO.

Los resultados de su trabajo, desarrollado en el marco de un proyecto FEDER -que forma parte del grupo de investigación ‘Historia de la Globalización’-, han sido recientemente publicados por la revista Digital Scholarship in the Humanities. Manuel Díaz Ordóñez, del área de Historia e Instituciones Económicas de la Universidad de Sevilla; Domingo Savio Rodríguez Baena, del área de Lenguajes y Sistemas Informáticos de la Universidad Pablo de Olavide; y Bartolomé Yun Casalilla, catedrático de Historia Moderna de la UPO, han publicado el artículo ante la necesidad de adaptar la tecnología a la investigación en Humanidades y Ciencias Sociales.

Durante su trabajo en ATLANTOCRACIES, los investigadores se enfrentaron al problema de cómo almacenar, y procesar automáticamente, todos los datos recabados durante el proyecto. La gran desventaja de las bases de datos relacionales es que son un modelo demasiado rígido para la investigación humanística. El proceso de investigación en estas disciplinas es muy cambiante y dinámico; podría definirse como un sistema multiobjetivo, en el cual se analizan diversas fuentes cuyo uso puede derivar en nuevas hipótesis y nuevos conjuntos de datos, por lo que la estructura necesaria para almacenar todo lo recabado cambia y evoluciona constantemente.

Funcionamiento de la base de datos de documentos para el estudio histórico diseñada por la UPO.

Para afrontar este reto, el equipo de investigación se decantó por utilizar datos semiestructurados, cuya estructura es flexible y puede sufrir cambios continuos de forma ágil y sencilla, sin incurrir en costes ni disminuir su capacidad de análisis. Las bases de datos NoSQL surgieron como alternativa al sistema relacional para aquellas aplicaciones relacionadas que requerían más flexibilidad, eficiencia y rapidez.

De este modo, en ATLANTOCRACIES los investigadores recabaron los datos necesarios y los almacenaron en un repositorio intermedio, del que se alimenta un software desarrollado en Java y que transforma la información de cada personaje histórico para guardarla de manera automática en la base de datos MongoDB, alojada en la nube. Fue primordial el trabajo de la técnica de investigación, María Jesús Milán Agudo, en las labores de extracción de información y su organización para el posterior almacenamiento. En futuros trabajos, el equipo llevará a cabo labores de extracción de conocimiento de la base de datos, mediante la aplicación de técnicas de Data Mining.

A new approach for the construction of historical databases—NoSQL Document-oriented databases: the example of AtlantoCracies’ ha requerido un esfuerzo multidisciplinar entre áreas como las Humanidades, las Ciencias Sociales y la Ingeniería; y permite que las primeras se sirvan mejor de esta última, pero también refuerza el enfoque humanístico de la tecnología. Los autores son creadores y miembros de la comisión académica del Máster Universitario en Historia y Humanidades Digitales de la Universidad Pablo de Olavide. Este trabajo, inextricablemente unido a la actividad docente, demuestra las sinergias entre investigación y enseñanza susceptibles de generarse cuando se plantean con carácter interdisciplinar.