H Un espace pour les humanités numériques à la BnF
« Depuis les années 1990, la Bibliothèque nationale de France (BnF) mène des campagnes de numérisation et de collecte des documents nativement numériques. L’accroissement des collections numériques ou d’ensembles cohérents de données (archives du web, corpus issus de la numérisation et diffusés dans Gallica ou Gallica intra-muros, logs de connexion à Gallica, métadonnées bibliographiques, etc.), croisé avec la mise au point d’outils de data mining (fouille de données), suscite depuis une dizaine d’années des approches renouvelées pour l’étude de corpus, notamment dans le champ des humanités numériques.
Dans le respect du contrat d’objectifs et de performance de l’établissement 1 et dans le cadre du projet Corpus, une étude a été conduite en 2017 afin de cerner les besoins, notamment en matière d’espaces, des chercheurs et ingénieurs de recherche s’intéressant à l’exploration des collections numériques de la BnF. Cette étude fait le constat que la fouille de données de type TDM (text and data mining) est appelée à se développer dans toutes les disciplines, même si le rythme et l’ampleur de cette évolution sont difficiles à déterminer. Du point de vue de l’aménagement de l’espace, cette enquête met en lumière la nécessité de prendre en compte de nouvelles temporalités (traitements de données durant plusieurs heures) et de concevoir des zones dédiées non seulement au travail individuel mais aussi au travail de groupe, à la formation, au partage d’expérience et à la convivialité. »