Analyses factorielles multivariées et classification

Référence : STA-N2-AFM

Cette formation s'adresse à des personnes souhaitant maîtriser les concepts et l’application des méthodes d’analyses multifactorielles. 

Cette formation conviendra à des personnes venant chercher du savoir statistique sur :

  • Les concepts d’utilisation des méthodes de statistique exploratoire multidimensionnelle
  • Les différents contextes d’application de chaque méthode
  • Les fondements mathématiques de ces analyses
  • La mise en application et l’interprétation des résultats des différentes méthodes

Infos pratiques

  • Durée : 4 jours soit 28 heures
  • Population visée : Employé – Technicien – Cadre – Chercheur – Etudiant
  • Public concerné : Toute personne souhaitant comprendre et mettre en œuvre les procédures d’analyses factorielles multivariées

Programme

Objectifs pédagogiques

A l’issue de cette formation, l’apprenant sera capable :

  • D’identifier quelle méthode d’analyse multivariée ou de classification utiliser selon le contexte
  • De connaître les concepts mathématiques inhérents à ces méthodes
  • De mettre en œuvre les différentes analyses
  • D’interpréter les résultats de chaque méthode et d’analyser les différents graphiques qui en découlent
  • De connaître les coefficients permettant d’estimer la qualité de l’analyse statistique
  • De mesurer la contribution de chaque variable et de chaque individu sur les axes factoriels

Pré-requis

  • En pré-requis, il est INDISPENSABLE d’avoir des connaissances de base en statistique

Thèmes principaux

  • Analyse en composantes principales (ACP)
  • Positionnement multidimensionnel (MDS)
  • Analyse factorielle des correspondances simples (AFC)
  • Analyse factorielle des correspondances multiples (AFCM)
  • Analyse canonique des corrélations (ACC)
  • Analyse factorielle discriminante (AFD)
  • Classification ascendante hiérarchique (CAH)
  • Classification par réallocation dynamique (k-means)

Quelques mots-clés

  • Réduction de dimension
  • Corrélation
  • Matrice de variance-covariance
  • Distance, projection, inertie
  • Valeurs propres
  • Tableau de contingence
  • ACP
  • MDS
  • AFC
  • AFCM
  • ACC
  • AFD
  • CAH
  • K-means
  • Graphique des axes factoriels
  • Graphique des individus
  • Dendrogramme

Objectifs opérationnels et contenu de la formation

Connaitre les généralités sur les méthodes d'analyses factorielles et sur la classification

  • Limites des statistiques classiques
  • Structure des jeux de données
  • Champs d'application des méthodes d'analyses multifactorielles
  • Les objectifs des techniques d'analyse
    • Objectifs de description
    • Objectifs de prédiction
  • Présentation de l'éventail des méthodes
    • Analyse en composantes principales
    • Positionnement multidimensionnel 
    • Analyse factorielle des correspondances
    • Analyse factorielle des correspondances multiples
    • Analyse canonique des corrélations
    • Analyse factorielle discriminante
    • Méthodes de classification : classification ascendante hiérarchique, réallocation dynamique
  • Les outils mathématiques
    • Notion de distances
    • Notion de corrélations

Méthodes factorielles multidimensionnelles

  • Mettre en œuvre l’ACP 
  • Structure du jeu de données et contexte d’application
  • Matrice de corrélations, de variance-covariance
  • Inertie et variance
  • Choix des axes de représentation (choix du nombre de composantes principales)
  • Interprétation des axes factoriels
  • Contribution des individus et des variables aux axes
  • Qualité de représentation des individus et des variables sur les axes
  • Les différentes ACP : normée et non normée, non paramétrique, polychorique
  • Représentations graphiques diverses
  • Positionnement d’une variable illustrative catégorielle et ellipses de confiance
  • Interprétation des sorties logicielles

Mettre en œuvre la MDS

  • Contexte d'utilisation de la méthode du positionnement multidimensionnel
  • Structure du jeu de données 
  • Notions de similarité, dissimilarité, distance
  • Lien et différence entre ACP et MDS
  • Principes de la MDS
  • Interprétation des sorties logicielles

Mettre en œuvre l’AFC

  • Contexte d'utilisation d'une analyse factorielle des correspondances
  • Structure du jeu de données
    • Tableau de contingence
    • Données individus, variables qualitatives
  • Différence entre ACP et AFC
  • Proximités et oppositions entre les modalités, liaison entre deux variables qualitatives
  • Profils lignes et profils colonnes
  • Choix des axes de représentation 
  • Représentation des modalités de base autour des composantes
  • Contributions des modalités à l’inertie
  • Interprétation des sorties logicielles

Mettre en œuvre l’AFCM

  • Contexte d'utilisation d'une analyse factorielle des correspondances multiples
  • Structure du jeu de données
  • Différence entre AFC et AFCM
  • Tableau disjonctif complet, tableau de Burt
  • Valeurs propres et choix des axes de représentation 
  • Information sur les individus
  • Rapports de corrélation
  • Interprétation des sorties logicielles

Mettre en œuvre l’ACC

  • Contexte d'utilisation d'une analyse canonique des corrélations
  • Structure du jeu de données
  • Analogie avec l’ACP, la régression linéaire et les autres méthodes d’analyse factorielle
  • Objectifs et principes de l’ACC
  • Notion de proximité entre 2 groupes de variables quantitatives
  • Vocabulaire spécifique : variables canoniques, coefficients de corrélation canonique
  • Représentation des variables et des individus dans les sous-espaces de chaque groupe

Méthodes de classification, de classement

  • Mettre en œuvre l’AFD
  • Contexte d'utilisation de l’analyse factorielle discriminante
  • Structure du jeu de données
  • Notions de classement et de discrimination
  • Méthodologie de l’AFD
  • Comparaison avec l’ACP
  • Interprétation des sorties logicielles

Mettre en œuvre la CAH

  • Présentation des objectifs de la classification ascendante hiérarchique
  • Structure du jeu de données
  • Choix de la distance, dissimilarité, similarité entre les individus : distance euclidienne…
  • Choix du linkage (saut, critère de « rapprochement » entre les classes) : méthode de Ward…
  • Lecture d’un dendrogramme
  • Choix du nombre de classes
  • Classification sur les individus
  • Classification sur les variables (distance de corrélation et composantes latentes)
  • Interprétation des sorties logicielles

Mettre en œuvre la classification par réallocation dynamique (centres mobiles)

  • Contexte d'utilisation de la classification par réallocation dynamique
  • Principe général des différentes méthodes
  • Comparaison avec la CAH
  • Présentation de la méthode k-means
  • Les différentes variantes de classification par réallocation dynamique
  • Interprétation des sorties logicielles
  • Conseils de mise en œuvre

Méthodes et moyens

Explications théoriques suivies de pratiques guidées puis mises en autonomie

  • 1 vidéoprojecteur par salle
  • 1 ordinateur par stagiaire

Méthodes d’évaluation des acquis

  • Exercices d’applications
  • Evaluation de fin de stage

Profil formateur

Nos formateurs sont certifiés à l’issue d’un parcours organisé par nos soins. Ils bénéficient d’un suivi de compétences aussi bien au niveau technique que pédagogique.

Support stagiaire

  • Support électronique (dématérialisé)
  • Les exercices d’accompagnement peuvent être récupérés sur clef USB