1-2 oct. 2025 Vandoeuvre-lès-Nancy (France)

Programme > Les ateliers

Tableaux de bord dynamiques et fouille de textes avec Lodex

Valérie BONVALLOT et Justine REVOL (CNRS-Inist)

A partir de publications consacrées à l'archéologie méditerranéenne présentes dans HAL, vous apprendrez à réaliser un site dynamique Lodex, outil de valorisation de données structurées développé à l'Inist. Il permet la création de tableaux de bord et de représentations graphiques. Vous découvrirez également comment enrichir votre corpus en faisant appel à différents outils de fouille de textes depuis LODEX.
Parmi les traitements envisagés, vous verrez comment faire pour  extraire des entités nommées géographiques, pour indexer et générer des résumés automatiquement.
Si vous souhaitez avoir une idée du résultat, découvrez l'instance consacrée aux web services https://tdm.inist.fr/instance/demo-webservices 
Si vous voulez avoir une idée de traitements de fouille de textes, naviguez sur Istex TDM, le catalogue de recensements des web services. https://services.istex.fr/

 

Découverte de GREL et JSON

Philippe HOUDRY (CNRS-Inist)

Cet atelier sera scindé en 2 parties. 

  • Découverte de JSON

Savez-vous que ce format de données structuré est de plus en plus présent dans nos usages ? Il est récupèrable en particulier à partir d'interrogations d'API mais aussi en déchargement de la plupart des réservoirs de données qu'on peut utiliser. C'est une structure beaucoup plus riche qu'un simple tableau de données en csv par exemple. Dans cet atelier, vous comprendrez par le détail le format JSON et les usages que vous pourrez en faire.

  •  Utilisation de GREL 

Vous utilisez OpenRefine mais vous souhaitez réaliser des transformations avancées non proposées dans les menus standards. GREL, langage de script intégré, est fait pour vous ! Dans cet atelier, après une rapide présentation générale de ce langage, vous apprendrez par exemple à fusionner des colonnes, construire des requêtes API dans une colonne pour les lancer directement à partir d'OpenRefine mais aussi de parcourir des données en JSON pour en extraire ce que vous souhaiterez récupérer comme enrichissement dans de nouvelles colonnes.

Chargement... Chargement...