La formation en quelques mots
Cette formation s'adresse à des personnes souhaitant appréhender les méthodes de classement. Les méthodes étudiées porteront sur le classement d’individus à attributs qualitatifs.
Même si l’essentiel des méthodes étudiées sont des méthodes supervisées, il pourra être évoqué des méthodes type classement k-means en complément.
Concernant la mise en œuvre des méthodes, deux approches seront traitées :
- L’approche statistique classique basée sur les méthodes régression
- L’approche Machine Learning basée sur les méthodes d’apprentissage type knn, svm, random forest, …
Deux compétences distinctes seront abordées lors de cette formation :
- Passer en revue l’éventail des méthodes de classements disponibles (comment prédire)
- Mettre en place une stratégie permettant de valider les classements effectués (comment vérifier qu’on prédit bien !)
La formation conviendra à un public venant chercher du savoir statistique sur :
- Les concepts des différentes méthodes d’apprentissage supervisé d’arbre de décision et de forêt aléatoire
- Les contextes d’application de chaque méthode
- La méthodologie des méthodes d’apprentissage supervisé
- La mise en œuvre et l’interprétation des résultats
- La validation des méthodes de classement
Cette formation ne traite pas de l’usage des réseaux de neurones.
De même, elle n’est pas orientée spécifiquement vers les méthodes de type modèles prédictifs pour variables quantitatives.
Thèmes principaux
- Régression logistique
- Analyse factorielle discriminante
- Knn
- SVM
- Random forest
- Forêt aléatoire
- Méthodes de validation des prédictions
Jeux de données
Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Ce souhait est un facteur de réussite pour la formation. Elle permet aux apprenants de :
- Se "reconnaitre" dans les thèmes abordés,
- Mieux percevoir l'intérêt des notions étudiées
- S'approprier le contenu de la formation
Outil logiciel
Les mises en applications pourront se faire autour du logiciel R si les apprenants sont autonomes, sous XlStat ou sous JMP.
Infos pratiques
- Durée : 4 jours soit 28 heures
- Tarif public intra : à partir de 1450 € / jour
- Tarif public inter : 750 € / jour / personne
- Population visée : Statisticiens – Data scientists – Ingénieurs et chargés d’études/d’analyses – Chercheurs – Doctorants
- Public concerné : Toute personne souhaitant comprendre le contexte d’utilisation, les concepts, et la mise en œuvre des méthodes de classements et de prédiction d’une variable qualitative.