La formation en quelques mots
Cette formation s'adresse à des personnes souhaitant découvrir les nouvelles méthodes statistiques pour l’analyse des données massives (big data). Les deux principaux aspects des big data qui seront abordés sont le volume des données ainsi que leur variété. En particulier, nous nous intéresserons aux problèmes de grande dimension où le nombre de variables est grand devant le nombre d’observations. Les méthodes de régression, classification et clustering spécifiques à la grande dimension seront abordées.
Concernant la variété des données, nous verrons comment prendre en charge dans une tâche d’apprentissage des données de natures différentes.
La mise en application sera réalisée sous le logiciel R.
Thèmes principaux
- Données en grande dimension
- Données de nature hétérogènes
- Classification
- Régression
- Clustering
Jeux de données
Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Ce souhait est un facteur de réussite pour la formation. Elle permet aux apprenants de :
- Se "reconnaitre" dans les thèmes abordés,
- Mieux percevoir l'intérêt des notions étudiées
- S'approprier le contenu de la formation
Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.
Outil logiciel
Cette formation n’est pas dédiée à la pratique d’un logiciel particulier mais nous proposons de nous appuyer sur le logiciel R pour les exercices et les illustrations.
Infos pratiques
- Durée : 3 jours soit 21 heures
- Tarif public intra : à partir de 1450 € / jour
- Tarif public inter : 750 € / jour / personne
- Population visée : Cadre – Chercheur – Etudiant
- Public concerné : Statisticiens et data miner souhaitant se mettre à jour sur les dernières méthodes statistiques pour les données massives (Big Data).