tidytext-widyr
Vendredi 12 juin 2026 (9h30-11h30) en hybride depuis l’Ined (salle 2.076)
Programme en cours de finalisation.
Annonce avec formulaire d'inscription à venir via la liste de diffusionseminaire-russ@listes.ined.fr
tidytext/widyr par Cassandra Gorin (Ina, Direction Data & Technologies Recherche)
Cette séance vise à présenter deux packages compagnons pour l'analyse textuelle. Tidytext permet de manipuler, nettoyer et analyser des données textuelles dans la logique du "tidy data" utilisé par les packages du tidyverse. Widyr s'inscrit dans son prolongement et permet des traitements plus avancés (par exemple du clustering) en facilitant le passage des données "tidy" au format large et inversement.
La séance s’articulera autour d'une base de données composées de transcription des journaux télévisés du soir de TF1 et France 2 ainsi que des notices documentaires décrivant dans le détail ces programmes.