Publié le 18 mai 2026 Mis à jour le 20 mai 2026

Ce séminaire est proposé par Élisabeth Morand et Bénédicte Garnier (Ined), Timothée Giraud (CNRS UAR Riate), Pascal Cristofoli (EHESS).

Date(s)

le 12 juin 2026

de 9h30 à 11h30
Type(s) d'évènements
L'intervenante de cette séance sera Cassandra Gorin (Ina, Direction Data & Technologies Recherche).
 

 

Cette séance vise à présenter Tidytext pour manipuler, nettoyer et analyser des données textuelles dans la logique du "tidy data" utilisé par les packages du tidyverse et Widyr qui s'inscrit dans son prolongement et qui permet des traitements plus avancés (par exemple du clustering) en facilitant le passage des données "tidy" au format large et inversement.

La séance s’articulera autour d'une base de données composées de transcription des journaux télévisés du soir de TF1 et France 2 ainsi que des notices documentaires décrivant dans le détail ces programmes.

Plus d'informations