Las tecnologías avanzadas, en este caso la inteligencia artificial, están revolucionando la investigación archivística y la explotación de las fuentes. En un entrevista que nos concedió en septiembre, Françoise Banat-Berger, jefa del servicio interministerial de Archivos de Francia al Ministerio de Cultura, volvió sobre la importancia de estos avances, en particular presentando un proyecto emblemático - el proyecto SOCFACE -, que pretende estudiar, gracias a la explotación de los censos de población de 1836 a 1936, la evolución de la sociedad francesa durante un siglo.
Este proyecto no es el único que utiliza técnicas de inteligencia artificial, ni mucho menos. Los Archivos Nacionales han sido pioneros con varias obras apasionantes - HIMANIS, SIMARA y LECTOREP - que muestran la amplitud y la diversidad de aplicación de estas tecnologías a corpus precisos: manuscritos medievales, inventarios de Antiguo Régimen, censos de población.... « Cada vez es una nueva aventura », aseguró Marie-Françoise Limon-Bonnet, conservadora general del patrimonio en los Archivos nacionales, con motivo de una mesa redonda, «Los archivos en letras: la inteligencia artificial al servicio de las fuentes», celebrada el 26 de septiembre en Mandelieu-La Napoule, con motivo de la Semana de la Genealogía. Informe.
Manuscritos medievales, inventarios de Antiguo Régimen, censos de población.... Cada vez es una nueva aventura
Preciosos manuscritos medievales
HIMANIS, para Historical Manuscript indexing for user-controlled searchLanzado en 2015, es un proyecto de investigación europeo que asocia, bajo la dirección en Francia del Instituto de Investigación e Historia de los Textos (IRHT), a la sociedad innovadora A2iA, así como a ingenieros y universitarios neerlandeses y españoles. Su objetivo es indexar el texto de los registros de la Real Cancillería francesa de los años 1302-1483 conservados en los Archivos Nacionales.
Hasta la fecha, gracias a la colaboración entre instituciones patrimoniales, investigadores en ciencias humanas y sociales e investigadores en informática e inteligencia artificial, los socios del proyecto lograron indizar el texto completo de más de 75.000 páginas de manuscritos medievales », se felicita Marie-Françoise Limon-Bonnet. « El Instituto de Investigación e Historia de los Textos, que estudia manuscritos antiguos en francés y en latín, se asoció para la ocasión con un conservador de los archivos. El objetivo de HIMANIS es sacar a la luz contenidos a gran escala. Las generaciones de archivistas e historiadores que se sucedieron en el pasado sólo habían podido estudiar una parte de los manuscritos ».
SIMARA: facilitar el trabajo de los archiveros
El proyecto SIMARA, «Entrada de Inventarios Manuscritos Asistida por Reconocimiento Automático», pretende desarrollar una plataforma de conversión de inventarios e índices manuscritos de finales del siglo XVIII al XX de los archivos de la Edad Media y del Antiguo Régimen. « Estamos del lado de los archivistas, SIMARA es un proyecto profesional », explica Christopher Kermorvant, presidente fundador de la empresa Teklia, director de obra del proyecto. « En la medida en que el trabajo de nuestros predecesores fue manuscrito, precisa el reto es hacer que todos los inventarios estén en línea ».
En concreto, SIMARA realiza simultáneamente dos operaciones: la transcripción automática gracias al reconocimiento de escrituras manuscritas y la colocación del texto en un formulario cuyos campos corresponden a elementos de marcado de las descripciones de los archivos. Y ahorra mucho tiempo. Además, la plataforma podrá utilizarse en el futuro para otros proyectos de transcripción de inventarios de archivos del mismo período.
Los patronímicos, una fuente inagotable de riqueza
El proyecto LECTAUREPpara la lectura automática de directorios, lanzado en 2018, está dedicado a los registros de actas notariales, una de las fuentes históricas más consultadas en los Archivos Nacionales. La inteligencia artificial aplicada al tratamiento de estos manuscritos pasa por el desarrollo de una plataforma que corrige las transcripciones y anotaciones resultantes y proporciona metadatos detallados sobre los documentos.
« Con los apellidos tenemos una fuente inagotable de riquezaconfiesa Marie-Françoise Limon-Bonnet. Este proyecto, para pasar al nivel industrial, necesitará voluntarios ». Por otra parte, continúa: si el modelo de segmentación del texto utilizado es bueno, a veces no se sabe dónde se detiene tal o cual grupo de texto coherente, en particular para los repertorios del siglo XIX donde la escritura se densifica en laextrema». Problema que no se plantea para los manuscritos del Antiguo Régimen para los que « el modelo funciona notablemente bien ».
Cuando la Francia de las Luces se revela
« A través de las cuestiones de saneamiento, de acondicionamiento de criaderos, de viveros, toda la Francia de las Luces se desarrolla de manera razonada y se da a ver »: así describe Édouard Bouyé, director de los Archivos departamentales de la Costa de Oro, el contenido de los archivos de los Estados de Borgoña en el corazón del proyecto «Letras en Luces».
« Como parte de la tecnología elegida para este proyecto, Mask RNCC, hemos logrado muebles 25 voluntarios que transcribieron 1500 páginas », se alegra. De los transcriptores que con el tiempo se convertirán en correctores. « El objetivo es tener una herramienta que pueda aprender continuamente y ofrecer a los genealogistas la posibilidad de transcribir páginas y páginas de escritura. También es necesario recoger estas páginas y encontrar información potencialmente interesante ».
SOCFACE, primer proyecto de gran envergadura para analizar las evoluciones demográficas
Proyecto de investigación que utiliza la inteligencia artificial, SOCFACE asocia el Ministerio de Cultura (servicio interministerial de los Archivos de Francia), los servicios públicos de archivos y los actores de la investigación y la innovación (Instituto Nacional de Estudios Demográficos, sociedad Teklia, Paris Sciences et Lettres) para permitir la explotación por el público de los censos de la población francesa de 1836 a 1936.
Financiado por la Agencia Nacional de Investigación (ANR), este proyecto cultural de reconocimiento automático de escrituras manuscritas, el primero de alcance nacional, procesará 15 millones de imágenes de listas nominativas del censo, producirá una base de datos de todas las personas que vivieron en Francia entre 1836 y 1936 y la utilizará para analizar los cambios sociales a largo plazo. « El objetivo es recopilar la mayor cantidad de datos posible para que se perfile una historia económica y social a la vez individual y nacional », confirma Christopher Kermorvant, presidente fundador de Teklia, precisando que « en la investigación en ciencias sociales, cada vez se utilizan más datos agregados ». A día de hoy, prosigue, son « tres millones de imágenes [que] se recogieron en los archivos departamentales ».
El otro impacto importante de SOCFACE será el acceso a las listas nominativas para el público en general, y en particular los genealogistas: las informaciones producidas serán difundidas y libremente reutilizables en France Archives y en los sitios de los archivos departamentales asociados, permitiendo así a cualquiera navegar libremente por cientos de millones de datos.
El objetivo de SOCFACE es una primera utilización a gran escala en los archivos de tecnologías de transcripción automática, en una fuente muy apreciada tanto para las investigaciones genealógicas como para los estudios históricos y demográficos.
Partager la page