Text Mining - Création d’un Nuage de mots (Wordcloud)

Référence : 2020-STAT-N2-TextMiningWordCloud

La formation en quelques mots

Cette formation s'adresse à des personnes souhaitant comprendre et réaliser un nuage de mots (word cloud) analyse de classique de type Text Mining.
Au-delà de la création proprement dite du nuage, une partie sera consacrée aux étapes en amont concernant la préparation des données (homogénéisation, tokenisation, stopwords,…).
Cette formation peut être vue comme une finalité en tant que telle ainsi qu’un premier contact avec les analyses liées à la fouille de données textuelles que l’on appelle le Text Mining.
A la fin de la formation, une ouverture sur des analyses statistiques Text Mining plus avancées peut être envisagée sous forme d’échanges et de démonstrations.

Outil logiciel

Cette formation n’est pas dédiée à la pratique d’un logiciel particulier mais nous proposons de nous appuyer sur le logiciel R pour les exercices et les illustrations. 
L’usage de Jmp peut également être réalisé.
 

Infos pratiques

  • Durée : 1 jour soit 7 heures
  • Tarif public intra : à partir de 1450 € / jour
  • Tarif public inter : 750 € / jour / personne
  • Population visée : Technicien – Employé – Cadre – Chercheur – Etudiant
  • Public concerné : Toute personne souhaitant mettre en œuvre un wordcloud et avoir un premier contact avec les analyses de type Text Mining.

Programme

Objectifs pédagogiques

A l’issue de cette formation, l’apprenant sera capable de :

  • Comprendre le cheminement de la réalisation d’un nuage de mots.
  • Comprendre les étapes de préparation du dictionnaire.
  • Préparer les données en effectuant les principaux pré-traitements spécifiques aux données textuelles
  • Mettre en œuvre les procédures de tokenisation
  • Traduire l’information des mots par le nuage de mots (word cloud)

Pré-requis

Il n’y a pas de prérequis particulier pour le suivi de cette formation. La connaissance de base de R est nécessaire si les participants souhaitent insister sur le volet logiciel.

Objectifs opérationnels et contenu de la formation

Introduction au Text Mining

  • Contexte
  • Exemple de données
  • Application du Text Mining
  • Finalité du word cloud

Particularité des données textuelles

  • Multiplicité des représentations
  • Fléau de la dimension
  • Subjectivité des données

Représentations des données textuelles

  • Sac de mots
  • Vectorisation

Pré-traitements

  • Tokenization
  • Nettoyage (majuscule, nombre, ponctuations…)
  • Stopwords
  • Stemming

Visualisation

  • Histogramme
  • Nuage de mots

Ouverture sur les analyses avancées liées au Text Mining

  • Recherche d’information
  • Analyse de sentiments
  • Classification de documents

Méthodes et moyens

  • Explications théoriques suivies de pratiques guidées puis mises en autonomie
  • 1 vidéoprojecteur par salle
  • 1 ordinateur par stagiaire

Méthodes d’évaluation des acquis

  • Exercices de synthèse et d’évaluation
  • Evaluation de fin de stage

Profil formateur

Nos formateurs sont certifiés à l’issue d’un parcours organisé par nos soins. Ils bénéficient d’un suivi de compétences aussi bien au niveau technique que pédagogique.

Support stagiaire

  • Support papier ou électronique (dématérialisé)
  • Les exercices d’accompagnement peuvent être récupérés sur clef USB