c Projet Himanis : faire des recherches plein texte dans le Trésor des Chartes avec OCR d'écritures manuscrites grâce au deep learning
« L’intelligence artificielle (deep learning) a débloqué l’accès au texte des manuscrits médiévaux ! Les partenaires du projet européen HIMANIS ont réalisé, pour la première fois au monde, l’indexation et la recherche en plein texte de dizaines de milliers de pages de manuscrits médiévaux, dont l’écriture est, souvent difficile à lire même pour les historiens chevronnés. Sur les deux cents volumes des « registres du Trésor des chartes », cartulaires et formulaires, contenant les textes produits par la chancellerie royale française de 1302 à 1486, les défis du multilinguisme et de la variation des écritures durant deux siècles, avec la présence de nombreuses abréviations, ont pu être relevés avec succès. La taille du corpus et la possibilité de recherche en plein texte dans des sources manuscrites, ouverte à tous, en accès libre sur le web, sont des nouveautés inédites dans le domaine des études médiévales. Les résultats de ces recherches présentent ainsi une révolution pour les historiens. »
Cycle « Les Lundis numériques de l'INHA » du 10 décembre 2018