Machine Learning & Méthodes statistiques appliquées aux processus de classification
Machine Learning & Méthodes statistiques appliquées aux processus de classification
Mixte : présentiel / à distance
Dernière mise à jour :
30/10/2024
Boostez vos compétences avec notre formation "Machine Learning & Méthodes statistiques appliquées aux processus de classification". Apprenez à maîtriser des techniques avancées pour optimiser vos analyses et prendre des décisions éclairées.
Toute personne souhaitant comprendre le contexte d'utilisation, les concepts, et la mise en œuvre des méthodes de classements et de prédiction d'une variable qualitative.
Prérequis
Il est nécessaire que les participants aient des connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.
Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.
Objectifs de la formation
A l'issue de cette formation, l'apprenant sera capable de :
Maîtriser le vocabulaire spécifique aux méthodes d'apprentissage à finalité de classement
Identifier le contexte et les conditions d'application des méthodes d'apprentissage supervisé et non supervisé
Connaître les objectifs et les différences entre les méthodes de classement
Décrire la méthodologie inhérente à ces méthodes
Mettre en œuvre et interpréter les résultats des méthodes d'apprentissage supervisé
Connaître les principaux indicateurs de cohérence liés aux méthodes d'apprentissage
Maitriser les paramètres permettant d'estimer la qualité de ces analyses
Contenu de la formation
VOLET 1 : LES ALGORITHMES
Généralités sur les différentes méthodes d'apprentissage supervisé
Différences entre méthodes supervisées et non supervisées
Objectifs de l'apprentissage supervisé
Objectifs de description
Objectifs de prédiction
Structure des jeux de données
Présentation générale de l'éventail des méthodes
La méthode knn
Principe de la méthode des plus proches voisins
Algorithme de calcul
Distances entre individus
Choix des proximités
Définition du paramètre k
La régression logistique
Variable explicative et variable expliquée (continue / binaire)
Différences entre la régression linéaire classique et la régression logistique
Estimation et interprétation des coefficients du modèle
Test de significativité du modèle (validation du modèle)
Tests d'apport d'une variable (test de Wald, tests sur les rapports de vraisemblance)
Interprétation du Khi² de Wald
Odds-ratios
Parallèle odds ratios et risques relatifs
Mise en œuvre et analyse des résultats d'un modèle de régression logistique multiple
Estimation et interprétation des coefficients du modèle multiple
L'analyse factorielle discriminante
Structure du jeu de données et contexte d'application
Objectifs détaillés de l'AFD
Notions de classement et de discrimination
Méthodologie de l'AFD
Comparaison avec l'ACP
Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
Qualité de l'AFD (de la discrimination obtenue)
Tests univariés et multivariés (lambda de Wilks)
Graphique des individus
Matrice de confusion (et éventuellement courbe ROC)
Les confusions et erreurs à ne pas commettre
Les supports vecteurs machines (SVM)
Démarche des svm
Notions de marge
Séparation linéaire
Séparation non linéaire
Fonction noyau
Les arbres de décision
Structure du jeu de données
Principes, vocabulaire et objectifs
Notion d'échantillon d'apprentissage, de validation et de test
Comparaison de méthodes de type régression linéaire / logistique aux arbres de décision
Principe de la segmentation selon le type de variable : Arbre de régression ou arbre de classification
Définir les conditions d'arrêt de construction d'un arbre : Notion de pré-élagage
Définition des groupes après construction de l'arbre
Indicateurs de qualité
Comparaison d'arbre de décision selon un certain type d'algorithme : CHAID vs CART
Avantages et inconvénients : limites des arbres de décision
Mise en œuvre et interprétation des résultats obtenus après application d'une analyse par arbre de décision
De l'arbre à la foret - Random Forest
Pourquoi avoir recourt aux forêts aléatoires ?
Principes et objectifs
Instabilité de l'arbre
Notion de Bagging
Les erreurs liées à l'échantillonnage (Out-Of-Bag)
Prédiction avec un algorithme de Forêt aléatoire : Les paramètres
Evaluer l'importance des variables
Notion d'importance
Comportement de l'importance
Lien entre diversité des arbres et l'importance
Influence des paramètres
Sélection de variables
Généralités et principes de la sélection
Procédure de sélection
Les paramètres de sélection
Validation
VOLET 2 : VALIDATIONS DES METHODES, MESURE DES PERFORMANCES
Partitionnement des données disponibles
Jeu d'entrainement
Jeu de validation
Tests sur le jeu d'entrainement
Tests sur le jeu de validation
La validation croisée
Leave one out
K fold
Leave v out
Compromise biais / variance
Mesures des performances des classifications
Matrices de confusions
Courbe Roc
Aire sous la courbe (AUC)
Sensibilité & spécificité
Compétences acquises à l'issue de la formation
Identifier le contexte et les conditions dapplication des méthodes dapprentissage supervisé et non supervisé
Maîtriser le vocabulaire spécifique aux méthodes dapprentissage à finalité de classement
Connaître les objectifs et les différences entre les méthodes de classement
Décrire la méthodologie inhérente à ces méthodes
Mettre en uvre et interpréter les résultats des méthodes dapprentissage supervisé
Connaître les principaux indicateurs de cohérence liés aux méthodes dapprentissage
Maitriser les paramètres permettant destimer la qualité de ces analyses
Modalités pédagogiques
Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Votre formation a lieu en présentiel :
1 vidéoprojecteur par salle
1 ordinateur
Votre formation se déroule à distance avec :
1 ordinateur
1 connexion Internet
1 adresse e-mail valide
1 équipement audio (micro et enceintes ou casque)
1 Webcam (facultatif – dans l'idéal)
1 deuxième écran (facultatif – dans l'idéal)
Votre formation se déroule sur notre plate-forme de formation avec :
1 ordinateur
1 connexion Internet
1 adresse e-mail valide
1 équipement audio (micro et enceintes ou casque - facultatif)
Support stagiaire :
À l'issue de la formation, les exercices et travaux pratiques réalisés, leurs corrigés ainsi qu'un support de cours dématérialisé sera fourni à chaque stagiaire par e-mail ou via la plate-forme FOAD.
Modalités d'évaluation et de suivi
L'acquisition des compétences de la formation se fait à travers le suivi du formateur tout au long de la formation (séquences synchrones et asynchrones). Elle s'appuie également sur la réalisation d'exercices et de TP. Enfin, des quiz s'ajoutent aux différents outils de validation de l'acquisition des compétences visées. Une évaluation est systématiquement réalisée par chaque stagiaire, à l'issue de la formation.
Profil du formateur
Nos formateurs sont certifiés à l'issue d'un parcours organisé par nos soins. Ils bénéficient d'un suivi de maintien et d'évolution de leurs compétences aussi bien au niveau technique que pédagogique. Chacun de nos formateurs a bénéficié d'une formation spécifique à l'animation de classe virtuelle et à l'utilisation des solutions de formation à distance du Groupe ARKESYS.
Informations sur l'accessibilité
Cette formation est accessible à toute personne en situation de handicap. Notre référent handicap prendra contact avec les stagiaires concernés pour adapter l'animation à leurs besoins et rendre l'apprentissage accessible à tous. Enfin, nos centres de formation sont accessibles aux personnes à mobilité réduite.
Nous utilisons les cookies afin de fournir les services et fonctionnalités proposés sur notre site et afin d’améliorer l’expérience de nos utilisateurs.
Aucune information personnelle n'est transmise à des tiers.
Notre site internet groupe-arkesys.com utilise des cookies. Un cookie est un petit fichier qui est envoyé avec les pages de ce site Web et/ou les applications Flash et qui est stocké par votre navigateur sur votre disque dur à partir de votre ordinateur, téléphone portable, montre connectée ou tablette. Les informations qui y sont stockées peuvent être retournées à nos serveurs lors d'une visite ultérieure.
L'utilisation de cookies est d'une grande importance pour le bon fonctionnement de notre site web. Grâce à la contribution (anonyme) des visiteurs, nous pouvons améliorer l'utilisation du site internet et le rendre plus convivial. Votre consentement est requis pour l'utilisation de certains cookies. Nous le recueillons au moyen d'une bannière informative. Vous disposez d'un droit d'accès, de rectification, de limitation et de suppression de vos données personnelles.
Si vous avez des questions et/ou des commentaires, veuillez nous contacter à l'adresse e-mail suivante : philippe.requet@arkesys.fr
Ces cookies nous permettent de fournir les services et fonctionnalités proposés sur notre site internet et de le rendre plus convivial pour le visiteur. Par exemple, nous stockons vos données de connexion. Sans ces cookies, notre site ne fonctionnera pas.
Les cookies de mesure d\'audience et d\'amélioration du site. Un cookie anonyme est généré à chaque fois que vous visitez un site internet. Ces cookies permettent de savoir si vous avez déjà visité le site auparavant ou non. Ce n\'est que lors de la première visite qu’un cookie est créé. Lors des visites suivantes, l\'utilisation du cookie déjà existant est automatique. Ce cookie n\'est utilisé qu\'à des fins statistiques.