Découvrez notre formation "Analyses multivariées" et maîtrisez des techniques avancées comme l'ACP, l'AFC et le k-means. Transformez vos données en insights précieux et boostez vos décisions stratégiques avec des analyses pertinentes et efficaces !
Toute personne souhaitant comprendre et mettre en œuvre des méthodes d'analyses factorielles multivariées.
Prérequis
Il est nécessaire que les participants aient de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.
Objectifs de la formation
A l'issue de cette formation, l'apprenant sera capable de :
Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
Décrire les concepts mathématiques inhérents à ces méthodes
Mettre en œuvre les analyses factorielles multivariées suivantes : ACP, AFC, AFCM, AFD
Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
Maitriser les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
Expliquer la différence entre les notions de contribution et de cosinus carré
Expliquer les distances et les méthodes d'agrégation les plus adaptées à l'objectif de classification
Comprendre les différences entre la CAH et les k-means
Mettre en œuvre et interpréter les résultats d'une méthode de classification de type CAH et k-means
Contenu de la formation
Généralités sur les différentes méthodes d'analyses multidimensionnelles
Limites des statistiques classiques
Champs d'application des différentes méthodes d'analyses multidimensionnelles
Introduction sur le data mining - Les objectifs
Objectifs de description
Objectifs de prédiction
Structure des jeux de données
Présentation de l'éventail des méthodes
Analyse en composantes principales
Analyse factorielle des correspondances simples et multiples
Analyse canonique des corrélations
Analyse factorielle discriminante
Méthodes de classification : classification ascendante hiérarchique, k-means
Principes généraux des différentes méthodes - Notions de :
Distance,
Inertie et variance
Axes factoriels
Notion de corrélation
Définition du coefficient de corrélation
Interprétation de la valeur du coefficient de corrélation
Les confusions : corrélation, causalité, pente…
Les différents coefficients de corrélation
Coefficient de Pearson
Coefficient de Spearman
Mise en œuvre d'une analyse en composante principales (ACP)
Structure du jeu de données et contexte d'application
Objectifs détaillés de l'ACP
Choix des axes de représentation (choix du nombre de composantes principales)
Interprétation des sorties graphiques : cercle factoriel et graphique des individus
Interprétation des axes factoriels
Contribution des individus et des variables aux axes
Qualité de représentation des individus et des variables sur les axes : les cosinus carrés
Les différentes ACP :
ACP normée et non normée
ACP non paramétrique
Positionnement d'une variable illustrative catégorielle
Les confusions et erreurs à ne pas commettre
Présentation rapide des Analyses des correspondances simple et multiple si souhaité
Différences entre ACP et AFC
Mise en œuvre d'une analyse factorielle des correspondances (AFC)
Structure du jeu de données : tableau de contingence, données individuelles (variables qualitatives)
Contexte d'application et objectifs détaillés de l'AFC
Différence entre ACP et AFC
Méthodologie de l'AFC
Distance du Chi²
Profils lignes
Profils colonnes
Choix des axes de représentation (choix du nombre d'axes)
Interprétation des sorties graphiques : graphique des modalités
Contributions et cosinus carrés des modalités aux axes
Les confusions et erreurs à ne pas commettre
Mise en œuvre d'une analyse des correspondances multiples (ACM ou AFCM)
Structure du jeu de données
Contexte d'application et objectifs détaillés de l'AFCM
Différence entre AFC et AFCM
Méthodologie de l'AFCM
Choix des axes de représentation (choix du nombre d'axes)
Correction de Benzecri : valeurs propres et taux d'inertie expliquée corrigés
Interprétation des sorties graphiques :
Graphique des modalités
Graphique des variables
Contributions et cosinus carrés des modalités aux axes
Les confusions et erreurs à ne pas commettre
Mise en œuvre d'une classification par une classification ascendante hiérarchique (CAH)
Structure du jeu de données
Contexte d'application et objectifs détaillés de la CAH
Lecture d'un dendrogramme
Choix du nombre de classes
Classification sur les individus
Classification sur les variables
Classification sur les modalités
Choix de la distance selon le contexte : classification sur les individus, les variables ou les modalités
Choix du linkage (saut, critère de « rapprochement » entre les classes) : méthode de Ward, lien simple, lien complet…
Interprétation des sorties logiciel
Mise en œuvre d'une classification par une k-means
Présentation des objectifs de la méthode des k-means
Avantages et inconvénients de la CAH et des k-means
Détermination des clusters
Présentation des différentes versions de l'algorithme
Utilisation de la k-means en complément de l'ACP
Classification sur grand jeu de données
Conseils de mise en œuvre
Interprétation des sorties logiciel
Mise en œuvre d'une analyse factorielle discriminante (AFD)
Structure du jeu de données et contexte d'application
Objectifs détaillés de l'AFD
Notions de classement et de discrimination
Méthodologie de l'AFD
Comparaison avec l'ACP
Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
Qualité de l'AFD (de la discrimination obtenue)
Tests univariés et multivariés (lambda de Wilks)
Graphique des individus
Matrice de confusion (et éventuellement courbe ROC)
Les confusions et erreurs à ne pas commettre
Compétences acquises à l'issue de la formation
Identifier quelle méthode danalyse multivariée ou de classification utiliser selon le contexte
Décrire les concepts mathématiques inhérents à ces méthodes
Mettre en uvre les analyses factorielles multivariées suivantes : ACP, AFC, AFCM, AFD
Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
Maitriser les coefficients et les paramètres permettant destimer la qualité des analyses statistiques ci-dessus
Expliquer la différence entre les notions de contribution et de cosinus carré
Expliquer les distances et les méthodes d'agrégation les plus adaptées à l'objectif de classification
Comprendre les différences entre la CAH et les k-means
Mettre en uvre et interpréter les résultats d'une méthode de classification de type CAH et k-means
Modalités pédagogiques
Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Méthodes et moyens
Evaluation préformation pour définir ses besoins et ses priorités d'usage de l'outil
Approche participative des connaissances à transmettre
Mise en situation concrète des outils et méthodes
Adaptation du rythme et des exercices au niveau du groupe
Utilisation des 3 vecteurs de communication : oral (vulgarisation du vocabulaire), visuel (vidéoprotection du logiciel) et kinesthésique (travaux pratiques)
Support stagiaire
Support papier ou électronique (dématérialisé)
Les exercices d'accompagnement peuvent être récupérés sur clef USB
Exercices supplémentaires téléchargeables sur notre site
Modalités d'évaluation et de suivi
Alternance d'exercices d'accompagnement et d'exercices d'application
Réalisation de travaux pratiques en autonomie pour identifier les acquis et les axes de progrès
Profil du formateur
Nos formateurs procèdent les certifications techniques (Microsoft Office Specialist, PCIE, TOSA, …) et pédagogiques (Certification de Compétence Pédagogique - CCP)
Informations sur l'accessibilité
Cette formation est accessible à toute personne en situation de handicap. Notre référent handicap prendra contact avec les stagiaires concernés pour adapter l'animation à leurs besoins et rendre l'apprentissage accessible à tous. Enfin, nos centres de formation sont accessibles aux personnes à mobilité réduite.
Nous utilisons les cookies afin de fournir les services et fonctionnalités proposés sur notre site et afin d’améliorer l’expérience de nos utilisateurs.
Aucune information personnelle n'est transmise à des tiers.
Notre site internet groupe-arkesys.com utilise des cookies. Un cookie est un petit fichier qui est envoyé avec les pages de ce site Web et/ou les applications Flash et qui est stocké par votre navigateur sur votre disque dur à partir de votre ordinateur, téléphone portable, montre connectée ou tablette. Les informations qui y sont stockées peuvent être retournées à nos serveurs lors d'une visite ultérieure.
L'utilisation de cookies est d'une grande importance pour le bon fonctionnement de notre site web. Grâce à la contribution (anonyme) des visiteurs, nous pouvons améliorer l'utilisation du site internet et le rendre plus convivial. Votre consentement est requis pour l'utilisation de certains cookies. Nous le recueillons au moyen d'une bannière informative. Vous disposez d'un droit d'accès, de rectification, de limitation et de suppression de vos données personnelles.
Si vous avez des questions et/ou des commentaires, veuillez nous contacter à l'adresse e-mail suivante : philippe.requet@arkesys.fr
Ces cookies nous permettent de fournir les services et fonctionnalités proposés sur notre site internet et de le rendre plus convivial pour le visiteur. Par exemple, nous stockons vos données de connexion. Sans ces cookies, notre site ne fonctionnera pas.
Les cookies de mesure d\'audience et d\'amélioration du site. Un cookie anonyme est généré à chaque fois que vous visitez un site internet. Ces cookies permettent de savoir si vous avez déjà visité le site auparavant ou non. Ce n\'est que lors de la première visite qu’un cookie est créé. Lors des visites suivantes, l\'utilisation du cookie déjà existant est automatique. Ce cookie n\'est utilisé qu\'à des fins statistiques.