Il y a forcément une formation faite pour vous
- Catalogue
- MÉTHODES / LOGICIELS STATISTIQUES & DATA ANALYSE
- Data Mining - Analyses multivariées - Machine Learning
- Analyses multivariées, classification (ACP, AFC, ACM, CAH, k-means, AFD)
Analyses multivariées, classification (ACP, AFC, ACM, CAH, k-means, AFD) Mixte : présentiel / à distance
Dernière mise à jour : 17/02/2026
- Inscription
- Public visé
- Prérequis
- Objectifs de la formation
- Contenu de la formation
- Compétences acquises à l'issue de la formation
- Modalités pédagogiques
- Moyens et supports pédagogiques
- Modalités d'évaluation et de suivi
- Profil du formateur
- Informations sur l'accessibilité
M'inscrire à la formation
Public visé
-
Toute personne souhaitant comprendre la structure théorique des méthodes d'analyses factorielles multivariées (ACP, AFC, kmeans, CAH, …) utilisées en Data Mining afin d'en maîtriser la mise en application et l'interprétation des résultats.
Prérequis
- Il est nécessaire que les participants aient de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.
Objectifs de la formation
A l'issue de cette formation, l'apprenant sera capable de :
- Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
- Décrire les concepts mathématiques inhérents à ces méthodes
- Mettre en œuvre les analyses factorielles multivariées suivantes : ACP, AFC, CAH, KMEANS, AFCM, AFD
- Comprendre le rôle de chacun de ces outils et le contexte de leurs utilisations
- Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
- Interpréter les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
- Savoir lire les graphiques issus des analyses multivariées (cercle des corrélations, individus, graphe des éboulis, dendrogrammes, …)
- Comprendre la notion de contributions dans les analyses multivariées
- Comprendre les calculs de distances et les différentes méthodes d'agrégation les plus adaptées à l'objectif de classification
- Comprendre les différences entre la CAH et les k-Means
- Mettre en œuvre et interpréter les résultats d'une méthode de classification de type AFDIdentifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
Contenu de la formation
Jour 1 – Matin
Généralités sur les différentes méthodes d'analyses multidimensionnelles
- Limites des statistiques classiques
- Champs d'application des différentes méthodes d'analyses multidimensionnelles
- Introduction sur le data mining - Les objectifs
- Objectifs de description
- Objectifs de prédiction
- Structure des jeux de données
- Présentation de l'éventail des méthodes
- Analyse en composantes principales
- Analyse factorielle des correspondances simples et multiples
- Analyse canonique des corrélations
- Analyse factorielle discriminante
- Méthodes de classification : classification ascendante hiérarchique, k-means
Jour 1 – Après-midi
- Principes généraux des différentes méthodes - Notions de :
- Distance,
- Inertie et variance
- Axes factoriels
Jour 2 – Matin
Notion de corrélation
- Définition du coefficient de corrélation
- Interprétation de la valeur du coefficient de corrélation
- Les confusions : corrélation, causalité, pente…
- Les différents coefficients de corrélation
- Coefficient de Pearson
- Coefficient de Spearman
Mise en œuvre d'une analyse en composante principales (ACP)
- Structure du jeu de données et contexte d'application
- Objectifs détaillés de l'ACP
- Choix des axes de représentation (choix du nombre de composantes principales)
- Interprétation des sorties graphiques : cercle factoriel et graphique des individus
- Interprétation des axes factoriels
- Contribution des individus et des variables aux axes
- Qualité de représentation des individus et des variables sur les axes : les cosinus carrés
Jour 2 – Après-midi
- Les différentes ACP :
- ACP normée et non normée
- ACP non paramétrique
- Positionnement d'une variable illustrative catégorielle
- Les confusions et erreurs à ne pas commettre
- Présentation rapide des Analyses des correspondances simple et multiple si souhaité
- Différences entre ACP et AFC
Jour 3 – Matin
Mise en œuvre d'une analyse factorielle des correspondances (AFC)
- Structure du jeu de données : tableau de contingence, données individuelles (variables qualitatives)
- Contexte d'application et objectifs détaillés de l'AFC
- Différence entre ACP et AFC
- Méthodologie de l'AFC
- Distance du Chi²
- Profils lignes
- Profils colonnes
- Choix des axes de représentation (choix du nombre d'axes)
- Interprétation des sorties graphiques : graphique des modalités
- Contributions et cosinus carrés des modalités aux axes
- Les confusions et erreurs à ne pas commettre
Jour 3 – Après-midi
Mise en œuvre d'une analyse des correspondances multiples (ACM ou AFCM)
- Structure du jeu de données
- Contexte d'application et objectifs détaillés de l'AFCM
- Différence entre AFC et AFCM
- Méthodologie de l'AFCM
- Choix des axes de représentation (choix du nombre d'axes)
- Correction de Benzecri : valeurs propres et taux d'inertie expliquée corrigés
- Interprétation des sorties graphiques :
- Graphique des modalités
- Graphique des variables
- Contributions et cosinus carrés des modalités aux axes
- Les confusions et erreurs à ne pas commettre
Jour 4 – Matin
Mise en œuvre d'une classification par une classification ascendante hiérarchique (CAH)
- Structure du jeu de données
- Contexte d'application et objectifs détaillés de la CAH
- Lecture d'un dendrogramme
- Choix du nombre de classes
- Classification sur les individus
- Classification sur les variables
- Classification sur les modalités
- Choix de la distance selon le contexte : classification sur les individus, les variables ou les modalités
- Choix du linkage (saut, critère de « rapprochement » entre les classes) : méthode de Ward, lien simple, lien complet…
- Interprétation des sorties logiciel
Mise en œuvre d'une classification par une k-means
- Présentation des objectifs de la méthode des k-means
- Avantages et inconvénients de la CAH et des k-means
- Détermination des clusters
- Présentation des différentes versions de l'algorithme
- Utilisation de la k-means en complément de l'ACP
- Classification sur grand jeu de données
- Conseils de mise en œuvre
- Interprétation des sorties logiciel
Jour 4 – Après-midi
Mise en œuvre d'une analyse factorielle discriminante (AFD)
- Structure du jeu de données et contexte d'application
- Objectifs détaillés de l'AFD
- Notions de classement et de discrimination
- Méthodologie de l'AFD
- Comparaison avec l'ACP
- Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
- Qualité de l'AFD (de la discrimination obtenue)
- Tests univariés et multivariés (lambda de Wilks)
- Graphique des individus
- Matrice de confusion (et éventuellement courbe ROC)
- Les confusions et erreurs à ne pas commettre
JEUX DE DONNEES
Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :
- Se "reconnaitre" dans les thèmes abordés
- Mieux percevoir l'intérêt des notions étudiées
- S'approprier le contenu de la formation
Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d'être utilisés en support lors de la formation.
OUTIL LOGICIEL
Cette formation n'est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront à l'aide d'un logiciel "spécialisé" pour ce type d'analyses : R, Jamovi, ...
On notera la possibilité d'utiliser Jasp, logiciel open source libre et gratuit, très utilisé dans la communauté scientifique.
Le logiciel retenu sera choisi en accord avec les participants.
Sur le logiciel R, nous proposons de nous appuyer particulièrement sur le package factominer avec ses satellites (factoshiny, …).
Compétences acquises à l'issue de la formation
- Identifier quelle méthode danalyse multivariée ou de classification utiliser selon le contexte
- Décrire les concepts mathématiques inhérents à ces méthodes
- Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
- Maitriser les coefficients et les paramètres permettant destimer la qualité des analyses statistiques ci-dessus
- Expliquer la différence entre les notions de contribution et de cosinus carré
- Expliquer les distances et les méthodes d'agrégation les plus adaptées à l'objectif de classification
- Comprendre les différences entre la CAH et les k-means
- Mettre en œuvre les analyses factorielles multivariées suivantes : ACP, AFC, CAH, KMEANS, AFCM, AFD
- Comprendre le rôle de chacun de ces outils et le contexte de leurs utilisations
- Interpréter les coefficients et les paramètres permettant d’estimer la qualité des analyses statistiques ci-dessus
- Savoir lire les graphiques issus des analyses multivariées (cercle des corrélations, individus, graphe des éboulis, dendrogrammes, …)
- Comprendre la notion de contributions dans les analyses multivariées
- Comprendre les calculs de distances et les différentes méthodes d'agrégation les plus adaptées à l'objectif de classification
- Mettre en œuvre et interpréter les résultats d'une méthode de classification de type AFD
Modalités pédagogiques
- Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
- Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Méthodes et moyens
- Evaluation préformation pour définir ses besoins et ses priorités d'usage de l'outil
- Approche participative des connaissances à transmettre
- Mise en situation concrète des outils et méthodes
- Adaptation du rythme et des exercices au niveau du groupe
- Utilisation des 3 vecteurs de communication : oral (vulgarisation du vocabulaire), visuel (vidéoprotection du logiciel) et kinesthésique (travaux pratiques)
Support stagiaire
- Support papier ou électronique (dématérialisé)
- Les exercices d'accompagnement peuvent être récupérés sur clef USB
- Exercices supplémentaires téléchargeables sur notre site
Modalités d'évaluation et de suivi
- Alternance d'exercices d'accompagnement et d'exercices d'application
- Réalisation de travaux pratiques en autonomie pour identifier les acquis et les axes de progrès
Profil du formateur
Informations sur l'accessibilité
-
Catégorie :
MÉTHODES / LOGICIELS STATISTIQUES & DATA ANALYSE
Sous-Catégorie : Data Mining - Analyses multivariées - Machine Learning - Durée : 28h
-
Prix : 3 000 € Net de taxePrix INTRA : 6 200 € Net de taxe
- Télécharger le programme
Session sélectionnée
-
Lyon COMPLÈTE
Prochaines Sessions
-
02/11/26
→
10/11/26
Classe virtuelle 8 places restantes
Dans la même catégorie
- IA Comprendre un algorithme utilisé en IA type reconnaissance d'image avec Excel Présentiel / à distance
- Initiation au Text Mining Présentiel / à distance
- Machine Learning & Méthodes statistiques appliquées aux processus de classification Présentiel / à distance
- MACHINE LEARNING & STATISTIQUES Erreur des modèles - Sous et sur ajustement Présentiel / à distance
- MACHINE LEARNING Modèle prédictif avec l'algorithme KNN Présentiel / à distance
Notre nouveau catalogue est en cours de déploiement. Aussi, pour connaître tous nos indicateurs, veuillez nous contacter directement.
Catalogue de formation propulsé par Dendreo,
logiciel de gestion pour les OF