m

Documents  fouille de texte et de données | enregistrements trouvés : 28

O

-A +A

P Q

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

« La fouille de textes et de données représente aujourd’hui un enjeu majeur pour la recherche, reconnu et pris en compte dans la loi pour une République numérique, dont les décrets d’application sont en cours de préparation.
Forte de ce constat, l’étude menée par l’ADBU s’appuie sur l’analyse d’un ensemble de retours d’expérience, qui permettent de mettre en évidence les conditions et les freins à la mise en œuvre effective de pratiques réussies en matière de fouille de textes et de données au sein de la recherche universitaire publique. L’étude aboutit à une série de recommandations à destination des acteurs de l’Enseignement supérieur et de la recherche (ESR) et des décideurs.

Piloté par Julien Roche, vice-président de l’ADBU et directeur des bibliothèques de l’université de Lille 1, ce travail, confié au prestataire Research Consulting (GB), a rendu ses conclusions lors d’une journée événement organisée par l’ADBU le 13 décembre 2016 à la BULAC à Paris). »

L'étude complète et les annexes, en anglais, sont téléchargeables depuis le lien ci-dessous.
« La fouille de textes et de données représente aujourd’hui un enjeu majeur pour la recherche, reconnu et pris en compte dans la loi pour une République numérique, dont les décrets d’application sont ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Cette présentation a été donnée dans le cadre de la pré-conférence Digital Humanities 2019 à Utrecht aux Pays-Bas, intitulée "les bibliothèques comme partenaires de la recherche en humanités numériques".
« De 2016 à 2019, la Bibliothèque nationale de France s'est engagée dans le projet appelé CORPUS, dont l'objectif est d'explorer de nouveaux services pour les chercheurs en utilisant les collections numériques comme données. »
Cette présentation a été donnée dans le cadre de la pré-conférence Digital Humanities 2019 à Utrecht aux Pays-Bas, intitulée "les bibliothèques comme partenaires de la recherche en humanités ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Cette présentation a eu lieu dans le cadre des Journées d'étude du congrès de l'Association des Directeurs de Bibliothèques Universitaires (ADBU) du 17 au 19 octobre 2017.
Elle aborde la relation entre les bibliothécaires et les chercheurs à travers le projet Fonte Gaïa, une plateforme de valorisation du patrimoine italien conservé dans les bibliothèques françaises.
Cette présentation a eu lieu dans le cadre des Journées d'étude du congrès de l'Association des Directeurs de Bibliothèques Universitaires (ADBU) du 17 au 19 octobre 2017.
Elle aborde la relation ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

« La Bibliothèque nationale de France a parmi ses objectifs de créer un nouveau service de fourniture de données à destination de la recherche. Ce service fait l’objet du programme de recherche Corpus, inscrit dans le plan quadriennal de la recherche 2016-2019 et porté par la Direction des services et des réseaux avec l’appui de la Délégation à la stratégie et à la recherche. Dans ce contexte, une étude prospective de besoins a été menée auprès d’usagers potentiels. Elle préfigure un espace, à la fois futur lieu de sociabilité scientifique et de ressource pour les chercheurs et les agents de la Bibliothèque. »
« La Bibliothèque nationale de France a parmi ses objectifs de créer un nouveau service de fourniture de données à destination de la recherche. Ce service fait l’objet du programme de recherche ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

« L’intelligence artificielle (deep learning) a débloqué l’accès au texte des manuscrits médiévaux ! Les partenaires du projet européen HIMANIS ont réalisé, pour la première fois au monde, l’indexation et la recherche en plein texte de dizaines de milliers de pages de manuscrits médiévaux, dont l’écriture est, souvent difficile à lire même pour les historiens chevronnés. Sur les deux cents volumes des « registres du Trésor des chartes », cartulaires et formulaires, contenant les textes produits par la chancellerie royale française de 1302 à 1486, les défis du multilinguisme et de la variation des écritures durant deux siècles, avec la présence de nombreuses abréviations, ont pu être relevés avec succès. La taille du corpus et la possibilité de recherche en plein texte dans des sources manuscrites, ouverte à tous, en accès libre sur le web, sont des nouveautés inédites dans le domaine des études médiévales. Les résultats de ces recherches présentent ainsi une révolution pour les historiens. »
Cycle « Les Lundis numériques de l'INHA » du 10 décembre 2018
« L’intelligence artificielle (deep learning) a débloqué l’accès au texte des manuscrits médiévaux ! Les partenaires du projet européen HIMANIS ont réalisé, pour la première fois au monde, l...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Faciliter la découverte des contenus culturels favorise la diversité de représentation des œuvres et la diversification des publics. Cela passe notamment par la mobilisation du secteur culturel autour du Web des données et de l'agrégation des données. La participation de la France à l'initiative Europeana s'inscrit pleinement dans cette démarche.
Faciliter la découverte des contenus culturels favorise la diversité de représentation des œuvres et la diversification des publics. Cela passe notamment par la mobilisation du secteur culturel ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Chaque année le monde de la recherche accélère et développe sa production scientifique. L’apport massif de données et de publications, associé à la multiplication des canaux de diffusion, complexifie l'exploration de la littérature scientifique.
Afin de répondre à ces nouveaux enjeux, les activités de recherche bibliographique, d'état de l'art, de veille scientifique, etc. s'appuient de plus en plus sur des outils sémantiques et des logiciels de traitement de l'information. Cette collection regroupe des interviews de scientifiques qui utilisent des logiciels d'exploration documentaire et d'extraction d'informations pour mener à bien leur sujet de recherche.

10 vidéos sont à votre disposition pour mieux comprendre.
Chaque année le monde de la recherche accélère et développe sa production scientifique. L’apport massif de données et de publications, associé à la multiplication des canaux de diffusion, complexifie ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Introduction: Métadonnées : essai de définition
Décrire, représenter
- Rôle des métadonnées descriptives
- L'identification
- Rôle des métadonnées de structure
Préserver, administrer
- Différents types de métadonnées de préservation
- Lumière sur la gestion des droits
- METS : un format global
Partager, diffuser
- Les métadonnées transformées : les interfaces, l'indexation
- Un protocole d'échange : l'OAI
Introduction: Métadonnées : essai de définition
Décrire, représenter
- Rôle des métadonnées descriptives
- L'identification
- Rôle des métadonnées de structure
Préserver, administrer
- Différents ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Un quart de siècle après son lancement sur le web, la bibliothèque numérique de la BnF propose désormais 10 millions de documents en accès libre. Et à l’heure de l’intelligence artificielle, Gallica s’apprête à faire évoluer ses fonctionnalités notamment dans le domaine de la fouille d’images.
Un quart de siècle après son lancement sur le web, la bibliothèque numérique de la BnF propose désormais 10 millions de documents en accès libre. Et à l’heure de l’intelligence artificielle, Gallica ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Inauguré au mois d'octobre dernier, le BnF Data Lab a pour ambition d'aider les chercheurs à appréhender les immenses collections numériques de la Bibliothèque nationale de France. Fouille de textes, analyse d'images et intelligence artificielle sont au coeur de ce programme

Extrait de la revue "Archimag", 2022, n°351, consultable au CDIP
Inauguré au mois d'octobre dernier, le BnF Data Lab a pour ambition d'aider les chercheurs à appréhender les immenses collections numériques de la Bibliothèque nationale de France. Fouille de textes, ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Les archives du web français forment un corpus de la première importance pour la communauté scientifique. Elles regroupent près de cinquante milliards de fichiers recouvrant des contenus très divers enrichis chaque année par une collecte large, qui cherche à couvrir l’ensemble du web français sous la forme d’un échantillon représentatif, et par des collectes ciblées, qui portent sur une sélection de sites web. Des collectes spécifiques ont été effectuées à l’occasion des grands rendez-vous électoraux (de 2002 à nos jours), des attentats de 2015 ou encore de la crise sanitaire liée au Covid-19. Ces archives, collectées et conservées par la Bibliothèque nationale de France, constituent des sources de premier plan pour les chercheurs d’aujourd’hui et de demain.
ResPaDon (pour Réseau de Partenaires pour l’analyse et l’exploration de données numériques) vise à développer et à diversifier les usages par les chercheurs des archives du web collectées et conservées par la BnF.
Les archives du web français forment un corpus de la première importance pour la communauté scientifique. Elles regroupent près de cinquante milliards de fichiers recouvrant des contenus très divers ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Cet article décrit une approche ETL (extract-transform-load) appliquée aux images d’une bibliothèque numérique à vocation encyclopédique : identifier et extraire l’iconographie partout où elle se trouve (dans les collections d’images, mais aussi dans les imprimés) ; transformer, harmoniser et enrichir ses métadonnées descriptives grâce à l’IA ; intégrer ces données dans une application web dédiée à la recherche iconographique. Cette approche est qualifiée de pragmatique à double titre, puisqu’il s’agit de valoriser des ressources numériques existantes tout en mettant à profit les acquis de l’IA.

Extrait de la revue Documentation et bibliothèques, 2019(65,2)
Cet article décrit une approche ETL (extract-transform-load) appliquée aux images d’une bibliothèque numérique à vocation encyclopédique : identifier et extraire l’iconographie partout où elle se ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Le ministère de l’Enseignement supérieur et de la Recherche déploie depuis plusieurs années une politique publique de l’édition scientifique agissant sur trois niveaux : scientifique, économique et politique.
Plan de l'article :
- L’observatoire de l’édition scientifique pour objectiver les données et faire dialoguer les acteurs
- Le plan de soutien à l’édition scientifique pour construire un écosystème diversifié, ouvert et soutenable
- Une structure collective pour les éditeurs scientifiques publics engagés dans la science ouverte

Extrait de la revue "Arabesques", 108(2023), pp. 6-7
Le ministère de l’Enseignement supérieur et de la Recherche déploie depuis plusieurs années une politique publique de l’édition scientifique agissant sur trois niveaux : scientifique, économique et ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Déjà utilisée par les établissements patrimoniaux pour la reconnaissance des textes manuscrits ou la description des images, l'intelligence artificielle peut aussi se mettre au service de la relation avec les usagers. La Bibliothèque nationale du Luxembourg propose ainsi un module de recherche via un agent conversationnel, qui explore une base de journaux numérisés.
Déjà utilisée par les établissements patrimoniaux pour la reconnaissance des textes manuscrits ou la description des images, l'intelligence artificielle peut aussi se mettre au service de la relation ...

... Lire [+]

Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y

Alors que l'intelligence artificielle s'invite progressivement dans les processus documentaires, le monde des archives s'intéresse lui aussi à l'IA pour traiter des documents anciens. Les programmes Socface, Transkribus et Lettres en lumières font partie des projets pionniers.

Extrait de la revue "Archimag", 2022, n°352, consultable au CDIP
Alors que l'intelligence artificielle s'invite progressivement dans les processus documentaires, le monde des archives s'intéresse lui aussi à l'IA pour traiter des documents anciens. Les programmes ...

... Lire [+]

Filtrer

Type
Date de parution
Descripteurs
Auteur(s)

Z