Text mining et recherche de thèmes dans un ensemble de documents

Séance 2

Jeudi 19 Mars 2015 de 9h00 à 11h00 à l’EHESS en salle 015, RdC, bât. Le France, 190 av de France 75013 Paris.

Claire Tissot (INRS), Text mining et recherche de thèmes dans un ensemble de documents : une application de R au traitement de données d’accidents de salariés nouvellement embauchés dans une entreprise.

Au cours de la séance sera abordé la mise en œuvre complète de l’analyse, de la lecture des données aux traitements et sorties graphiques. Quatre packages seront utilisés : tm pour la création d’un corpus et le traitement du texte, topicmodels pour l’identification de thèmes et d’une structure intra-document, FactoMineR pour les analyses factorielles et une classification des accidents, worcloud pour un exemple d’illustration graphique.