Les ateliers
- Atelier Extraction d'une ressource
Savez-vous que les formulaires de collecte de données sur le web utilisent la technologie API et que certaines bases de données sont interrogeables sans formulaire ? Dans toutes ces situations, en particulier la seconde, il est toujours possible d'utiliser directement une requête API ? Cet atelier vous permettra d'apprendre comment écrire ces requêtes API avec une approche générique, en prenant aussi en compte des pratiques issues du web, de quelle manière lancer ces requêtes (navigateur, outil dédié,...) et de savoir comment récupérer les réponses retournées par les API interrogées et dans quels formats. Pour terminer, un cas d'usage illustrera l'utilisation de l'API HAL pour collecter des données en format csv, fichier qui servira aux deux autres ateliers de cette ANF.
- Atelier Curation d'une ressource avec OpenRefine
Vous disposez de données sous différents formats et standards ? Vous constatez des erreurs de saisie, des écritures différentes, voire des données manquantes ? Le travail de reprise de données peut être fastidieux. Avez-vous pensé à utiliser OpenRefine ? OpenRefine permet d’effectuer des opérations de nettoyage en masse, mais aussi d’explorer des jeux de données, de convertir les données d’un format à un autre, d’appliquer des transformations cellulaires de base et avancées, de filtrer et de créer un partitionnement des données avec des expressions régulières, d’extraire des entités nommées sur des champs de texte intégral. Dans cet atelier, vous découvrirez par la pratique la richesse de ce logiciel et ses fonctions de base pour effectuer une curation de votre jeu de données. Vous créerez un projet, effectuerez des tris, comprendrez les facettes, les filtres, le clustering, la possibilité de reproduire vos actions et bien d'autres possibilités vous donnant envie d'aller plus loin avec cet outil.
- Atelier enrichissement par réconciliation
Vous souhaitez enrichir vos données avec des informations issues de référentiels en ligne ? Dans cet atelier, nous vous montrerons comment exploiter le rapprochement d'informations avec le logiciel libre OpenRefine. Nous pourrons par exemple, consolider des identités numériques des individus et des structures, ajouter des mots-clés alignés sur des vocabulaires contrôlés, compléter des informations sur des publications scientifiques pour en tirer des statistiques de production,... Avec une bonne méthodologie, vous acquerrez de l'autonomie et de la rapidité pour enrichir et consolider des données à l'aide de ressources externes.
Chaque stagiaire participera aux 3 ateliers.
|