Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Déjà utilisée par les établissements patrimoniaux pour la reconnaissance des textes manuscrits ou la description des images, l'intelligence artificielle peut aussi se mettre au service de la relation avec les usagers. La Bibliothèque nationale du Luxembourg propose ainsi un module de recherche via un agent conversationnel, qui explore une base de journaux numérisés.
Déjà utilisée par les établissements patrimoniaux pour la reconnaissance des textes manuscrits ou la description des images, l'intelligence artificielle peut aussi se mettre au service de la relation ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
La mise à disposition pour la recherche de données issues du Web archivé correspond à une tendance engagée au sein des institutions patrimoniales depuis les années 2010. Elle se matérialise à l’échelle européenne puis internationale de manière assez inédite à la faveur d’une étude sur l’archivage des traces numériques de la crise de la COVID-19 à partir de 2020. En explorant l’émergence de nouveaux services et collaborations lors de projets mettant en jeu la fourniture des données issues du Web archivé sur la dernière décennie, en particulier à l’Institut national de l’audiovisuel (INA) et à la Bibliothèque nationale de France (BnF), cet article invite à penser les transformations des relations entre chercheurs et institutions patrimoniales. Après avoir souligné à quel point cette évolution est le résultat d’efforts engagés depuis plusieurs années en termes d’indexation, d’accès, de fourniture d’outils, nous analysons les modalités et enjeux de la coconstruction d’une recherche sur les données du Web archivé, notamment pour la constitution et documentation des corpus et leur lecture distante.
Numéro de la revue "Balisages", 6 (2023)
La mise à disposition pour la recherche de données issues du Web archivé correspond à une tendance engagée au sein des institutions patrimoniales depuis les années 2010. Elle se matérialise à ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
"L'union fait la force", voici la devise que pourrait se donner la future plate-forme GIROPHARES. Les Archives nationales conservent plusieurs milliards de pages et quelques millions ont été numérisées et mises en ligne. Mais comment retrouver rapidement un document s'il n'a pas été précisément indexé ? Telle est l'ambition de la plate-forme récemment ouverte au public : participer à l'amélioration de la description des fonds conservés par les Archives nationales.
Extrait de "Mémoire d'avenir, le journal des archives nationales", 51(2023), pp. 8, consultable et empruntable au CDIP
"L'union fait la force", voici la devise que pourrait se donner la future plate-forme GIROPHARES. Les Archives nationales conservent plusieurs milliards de pages et quelques millions ont été ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Les archives du web français forment un corpus de la première importance pour la communauté scientifique. Elles regroupent près de cinquante milliards de fichiers recouvrant des contenus très divers enrichis chaque année par une collecte large, qui cherche à couvrir l’ensemble du web français sous la forme d’un échantillon représentatif, et par des collectes ciblées, qui portent sur une sélection de sites web. Des collectes spécifiques ont été effectuées à l’occasion des grands rendez-vous électoraux (de 2002 à nos jours), des attentats de 2015 ou encore de la crise sanitaire liée au Covid-19. Ces archives, collectées et conservées par la Bibliothèque nationale de France, constituent des sources de premier plan pour les chercheurs d’aujourd’hui et de demain.
ResPaDon (pour Réseau de Partenaires pour l’analyse et l’exploration de données numériques) vise à développer et à diversifier les usages par les chercheurs des archives du web collectées et conservées par la BnF.
Les archives du web français forment un corpus de la première importance pour la communauté scientifique. Elles regroupent près de cinquante milliards de fichiers recouvrant des contenus très divers ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Avec 10 millions de documents dans Gallica, la bibliothèque numérique de la BnF et de ses partenaires, franchit une frontière en termes d’accès, avec des collections très diverses dont une grande part est relativement méconnue et partiellement consultée. Dans cet océan de ressources, la « découvrabilité » des contenus devient une gageure et un enjeu stratégique pour l’institution qui s’interroge sur la stratégie à mettre en œuvre. Toute réflexion sur la découvrabilité passe par une analyse préalable des usages : qui découvre les collections numérisées et comment se fait cette découverte ? Nous revisitons ici les études de publics menés à la BnF au regard de cette question, des compétences mobilisées dans cette activité de recherche et de la mise en œuvre de parcours de sérendipité.
Extrait de la rubrique "Focus et contributions" du site "Bulletin des bibliothèques de France", 14 juin 2023
Avec 10 millions de documents dans Gallica, la bibliothèque numérique de la BnF et de ses partenaires, franchit une frontière en termes d’accès, avec des collections très diverses dont une grande ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Le nombre élevé d’utilisateurs Internet et de leurs requêtes, la quantité énorme de données et ressources, la diversité des stratégies d’indexation et de description des ressources et la difficulté à estimer la pertinence des documents pour l’utilisateur, ont poussé les architectes et concepteurs de systèmes de recherche d’information à trouver d’autres moyens afin de satisfaire d’une façon pertinente les requêtes utilisateurs et rendre ces systèmes de plus en plus performant. Ce livre s’inscrit dans le cadre de développement d’une approche d’amélioration de la pertinence d’un SRI en intégrant une nouvelle couche d’enrichissement sémantique des requêtes. Il est question de mettre en place un outil capable d’analyser et interpréter le besoin, exprimé sous forme de requête, et de proposer un enrichissement de ce besoin. Notre travail s’articule sur l’utilisation des phrases de définition pour enrichir la requête utilisateur, spécialement les composants Générique et Spécifique des définitions.Il consiste aussi à exploiter les patrons et les ontologies afin de bien appréhender la demande utilisateur et l’enrichir tout en s’appuyant sur la mesure de similarité d’Overlup
Le nombre élevé d’utilisateurs Internet et de leurs requêtes, la quantité énorme de données et ressources, la diversité des stratégies d’indexation et de description des ressources et la difficulté à ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Univers en perpétuelle expansion et au foisonnement chaotique, Internet offre un nombre incalculable d’outils, dont l’exploration paraît parfois hors de portée. Dans le paysage des sciences humaines, les blogs, les logiciels bibliographiques, les bases de données, les éditions en ligne et les wikis, tous ces objets qui éveillaient notre curiosité il y a une décennie, sont devenus aussi anodins qu’omniprésents. Mais comment bien s’en servir ?
Les appréhensions face à ces outils – et leur simple mais robuste méconnaissance – sont encore largement répandues. Or on ne peut plus ignorer leur intérêt, voire leur nécessité, et les chercheurs qui s’y essaient ne savent souvent pas par quel bout attraper ces logiciels nouveaux.
Univers en perpétuelle expansion et au foisonnement chaotique, Internet offre un nombre incalculable d’outils, dont l’exploration paraît parfois hors de portée. Dans le paysage des sciences humaines, ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Un quart de siècle après son lancement sur le web, la bibliothèque numérique de la BnF propose désormais 10 millions de documents en accès libre. Et à l’heure de l’intelligence artificielle, Gallica s’apprête à faire évoluer ses fonctionnalités notamment dans le domaine de la fouille d’images.
Un quart de siècle après son lancement sur le web, la bibliothèque numérique de la BnF propose désormais 10 millions de documents en accès libre. Et à l’heure de l’intelligence artificielle, Gallica ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
L’évolution du concept d’hypertexte suppose de revenir aux premiers travaux et premiers concepts dont il dérive. L’objectif de cette intervention est de procéder par une rapide rétrospective pour envisager de manière prospective les enjeux autour du concept d’hypertexte dans les prochaines années en ce qui concerne les sciences de l’information et de la communication. Il s’agit par conséquent de comprendre les tensions qui existent entre les concepts d’hyperdocument et d’hyperdocumentation, d’hypertexte et d’hyperville pour montrer les enjeux scientifiques, techniques, éthiques et conceptuels qui vont mobiliser la discipline au cours des prochaines années.
L’évolution du concept d’hypertexte suppose de revenir aux premiers travaux et premiers concepts dont il dérive. L’objectif de cette intervention est de procéder par une rapide rétrospective pour ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Le ministère de l’Enseignement supérieur et de la Recherche déploie depuis plusieurs années une politique publique de l’édition scientifique agissant sur trois niveaux : scientifique, économique et politique.
Plan de l'article :
- L’observatoire de l’édition scientifique pour objectiver les données et faire dialoguer les acteurs
- Le plan de soutien à l’édition scientifique pour construire un écosystème diversifié, ouvert et soutenable
- Une structure collective pour les éditeurs scientifiques publics engagés dans la science ouverte
Extrait de la revue "Arabesques", 108(2023), pp. 6-7
Le ministère de l’Enseignement supérieur et de la Recherche déploie depuis plusieurs années une politique publique de l’édition scientifique agissant sur trois niveaux : scientifique, économique et ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Faciliter la découverte des contenus culturels favorise la diversité de représentation des œuvres et la diversification des publics. Cela passe notamment par la mobilisation du secteur culturel autour du Web des données et de l'agrégation des données. La participation de la France à l'initiative Europeana s'inscrit pleinement dans cette démarche.
Faciliter la découverte des contenus culturels favorise la diversité de représentation des œuvres et la diversification des publics. Cela passe notamment par la mobilisation du secteur culturel ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Gérée par la Bibliothèque nationale de France, la plateforme PLATON, mise en place dans le cadre de « l’exception handicap » au droit d’auteur, doit aujourd’hui évoluer pour répondre aux nouveaux enjeux de l’édition adaptée ou nativement accessible.
Extrait de la revue "Arabesques", 107(2022), pp. 4-5
Gérée par la Bibliothèque nationale de France, la plateforme PLATON, mise en place dans le cadre de « l’exception handicap » au droit d’auteur, doit aujourd’hui évoluer pour répondre aux nouveaux ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
A l’occasion de la Semaine de la généalogie, le service interministériel des Archives de France présente les fructueux apports de l’intelligence artificielle à la recherche archivistique.
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Le Machine Learning est un ensemble de techniques utilisées par les Data Scientists qui a grandement fait parler de lui ces dernières années.
Une fois que le Data Scientist a effectué son travail de collecte, de nettoyage et d’exploration des données, il peut passer à la partie "modélisation". C’est ce processus que nous allons explorer ensemble dans ce cours d'initiation au Machine Learning.
Vous allez découvrir un ensemble de techniques puissantes permettant de créer, à partir de données, des modèles prédictifs qui apprennent par eux-mêmes !
Objectifs pédagogiques :
- resituer le Machine Learning au sein de la Data Science
- identifier les possibilités du Machine Learning
- identifier les techniques et outils du Machine Learning
- entraîner un algorithme de régression linéaire
- identifier les limites du Machine Learning
Cours d'autoformation (texte et infographie) d'une durée estimée de 10h, accessible sur simple inscription gratuite
Le Machine Learning est un ensemble de techniques utilisées par les Data Scientists qui a grandement fait parler de lui ces dernières années.
Une fois que le Data Scientist a effectué son travail de ...
... Lire [+]
Déposez votre fichier ici pour le déplacer vers cet enregistrement.
y
Alors que l'intelligence artificielle s'invite progressivement dans les processus documentaires, le monde des archives s'intéresse lui aussi à l'IA pour traiter des documents anciens. Les programmes Socface, Transkribus et Lettres en lumières font partie des projets pionniers.
Extrait de la revue "Archimag", 2022, n°352, consultable au CDIP
Alors que l'intelligence artificielle s'invite progressivement dans les processus documentaires, le monde des archives s'intéresse lui aussi à l'IA pour traiter des documents anciens. Les programmes ...
... Lire [+]