JMP - Statistiques Notions fondamentales, Tests d’hypothèses et Traitement des petits échantillons

Référence : STAT-N1-StatNFJMP

La formation en quelques mots

Dans ce module de formation, nous proposons de baser notre pédagogie autour des thèmes suivants :

  • Acquérir un crédit de confiance dans la manipulation des outils statistiques
  • Trouver dans le potentiel des méthodes statistiques un intérêt et des outils en phase avec son métier et applicables
  • Avoir une vue d'ensemble du potentiel des outils statistiques de base et comprendre leurs domaines d'applications
  • Mettre en œuvre sous le logiciel JMP et manipuler les outils statistiques de base dans le domaine de la statistique descriptive et inférentielle (intervalles de confiance et tests d’hypothèses)

Au-delà des compétences statistiques pures, l'important dans ce type de formation est de comprendre les mécanismes fondamentaux présents dans la plupart des manipulations des outils statistiques :
D'une façon générale, ces mécanismes sont les suivants :

  • Savoir à quoi sert un outil statistique précis
  • Savoir dans quelles conditions on peut l'utiliser
  • Interpréter les résultats
  • Attribuer un sens physique à l'outil statistique 

Par exemple, dans le calcul d'un écart-type, élément clé présent dans un grand nombre de méthodes statistiques, il nous paraît plus important d'appréhender le sens physique de l'écart-type plus que la formule mathématique en traitant les points suivants :

  • Que mesure un écart-type ?
  • Dans quelle unité de mesures s'exprime un écart-type ?
  • A partir de combien de valeurs, je peux raisonnablement mesurer un écart-type ?
  • De quel écart-type je parle (s, sigma, …) ?

Spécificités des petits échantillons

Cette formation intègre le traitement statistique des petits échantillons.
Cette spécificité nous amène ainsi à aborder certains thèmes tels que :

  • Problème de puissance
  • Hypothèses fondamentales délicates à vérifier
  • Fragilité des jeux de données

Thèmes principaux

  • JMP
  • Outils statistiques descriptifs de base 
  • Intervalles de confiance
  • Tests d'hypothèses - Démarche méthodologique
  • Tests d'hypothèses - Mise en pratique des tests classiques
  • Traitement statistique des petits échantillons
  • Calculs de taille d'échantillons requis et puissance de test

Jeux de données

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :

  • Se "reconnaitre" dans les thèmes abordés, 
  • Mieux percevoir l'intérêt des notions étudiées 
  • S'approprier le contenu de la formation

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.

Outil logiciel

Au-delà de l'apprentissage des thématiques statistiques, la mise en application s'effectuera sur le logiciel JMP.
Environ une demi-journée de travail sera donc consacrée à l'apprentissage du logiciel, son ergonomie, la structuration des données permettant aux apprenants d'acquérir l'autonomie sur ce logiciel.
 

Infos pratiques

  • Durée : 4 jours soit 28 heures
  • Tarif public intra : à partir de 1450 € / jour
  • Tarif public inter : 750 € / jour / personne
  • Population visée : Technicien – Employé – Cadre – Chercheur – Etudiant
  • Public concerné : Toute personne souhaitant s’initier et maitriser les outils fondamentaux en statistique en intégrant le contexte des petits échantillons avec mise en application sous Jmp.

Programme

Objectifs pédagogiques

A l’issue de cette formation, l’apprenant sera capable avec Jmp :

  • Structurer des données 
  • Maîtriser l'interface du logiciel 
  • Décrire synthétiquement et graphiquement une série de mesures quantitatives
  • Donner un sens physique aux indicateurs tels que la moyenne, la médiane, l’écart-type, le CV, …
  • Comprendre la notion d'échantillonnage et de population
  • Calculer et interpréter un intervalle de confiance pour une moyenne, une proportion
  • Différencier la notion d’écart-type (s) et erreur-type (Sem)
  • Comprendre la démarche et mettre en œuvre un test d'hypothèse (t, F, Khi², …)
  • Comprendre le contexte de mise en œuvre des tests sur données appariées
  • Traduire en connaissances métiers les résultats statistiques issus d'un test d'hypothèse
  • Choisir entre un test paramétrique et non paramétrique
  • Calculer la taille des échantillons nécessaire dans un test ainsi que la puissance associée au test.
  • Interpréter les sorties de logiciels de statistiques

Pré-requis

Aucun prérequis n'est nécessaire pour le suivi de cette formation. Un accompagnement sur l’utilisation du logiciel Jmp est effectué. 

Objectifs opérationnels et contenu de la formation

Prise en main de l’interface Jmp

  • Généralités et interface utilisateur
    • Gestion et organisation des données
    • Gestions des fichiers générés sous Jmp
    • Utilisation des barres d'outils
    • Présentations des menus
    • Présentations des différentes analyses statistiques disponibles
  • Paramétrage de la feuille de données
    • Définition des variables
    • Paramétrage des types de variables
    • Création de formules
    • Gestion des données
    • Saisie, Ajout, Suppression de données
    • Sélection de données 
    • Filtrage de données dans les analyses
    • Filtrage de données par les graphiques
    • Structuration, manipulation des données (split, stack…)
    • Importation d’un fichier de données (Excel)
  • Gestion des analyses
    • Paramétrage des variables
    • Gestion des fenêtres d'analyses
    • Gestion des scripts
    • Sauvegarde des scripts
    • Mise à jour d'une fenêtre d'analyse
    • Association feuille de données & Analyses
    • Edition de scripts (Découverte des principes)
  • Outils divers
    • Configuration du logiciel
    • Paramétrage de base
    • Utilisation de l'aide
  • Outils graphiques
    • Manipulation de graphiques
    • Exploration de données via les graphiques
    • Personnalisation de graphiques

Notions générales

  • Vocabulaire de base
  • Statistique et statistiques 
  • Raisonnement général en statistique
  • Présentation des grands objectifs de la statistique
    • Description numérique
    • Comparaison
    • Prédiction

Nature et typologie des données

  • Les données quantitatives
  • Les données qualitatives
  • Données réelles, données estimées
  • Incertitude de la mesure
  • Population et échantillon

Analyse descriptive des données

  • Objectifs de la description (synthèse, objectivité, …)
  • La description par le chiffre
    • Grandeurs de position : moyenne, médiane…
    • Grandeurs de dispersion : écart-type, variance, coefficient de variation…
  • La description par le graphique
    • Histogrammes de fréquences
    • Boîtes à moustaches
    • Nuages de points
  • Conventions d'écriture
    • Grandeurs réelles
    • Grandeurs estimées 
  • Tableaux de comptage
    • Tri à plat
    • Tableau croisé
  • Liens entre deux variables quantitatives : coefficients de corrélation

Traitement des valeurs suspectes

  • Approche visuelle et graphique
  • Approche quantitative (z score)
  • Approche statistique (Test de Grubbs)

Notions de lois de distributions

  • Données brutes
  • Classes, fréquences et distribution d'effectifs
  • Histogrammes de fréquences
  • Règles de constructions des classes (racine de N, Loi de Sturges, …)
  • Distributions observées expérimentalement
  • Distributions théoriques : sens théorique et physique d'une loi
  • Présentation des lois de distributions usuelles (Normale, LogNormale, …)

Intervalles de confiance

  • Objectifs d’un intervalle de confiance
  • Interprétation statistique et physique
  • Le rôle de l'inférence
  • Relation échantillon & population
  • Calculs d’intervalles de confiance : d'une moyenne, d'une proportion, d'un écart-type
  • Erreurs à ne pas commettre (confusion IC moyenne & dispersion valeurs individuelles)

La démarche des tests d’hypothèses

  • Objectifs d’un test d’hypothèses
  • Relation entre intervalle de confiance et test d’hypothèse
  • Les hypothèses en jeu
    • Hypothèse nulle H0
    • Hypothèse alternative H1
  • Prise de décision
    • Rejet de H0
    • La p-value
    • Le risque alpha
    • Graduation du risque
    • Significativité physique et statistique
  • Test unilatéral ou bilatéral

Mise en œuvre des tests paramétriques

  • Tests de comparaisons de 2 moyennes (Student)
  • Tests de comparaisons de 2 variances (Fisher)
  • Tests de comparaisons de proportions (Khi deux)
  • Ouverture en fin de formation sur l’ANOVA à un facteur
  • Hypothèses fondamentales des différents tests

Mise en œuvre des tests non paramétriques

  • Avantages et inconvénients :
    • Des tests paramétriques
    • Des tests non paramétriques
  • Tests de comparaisons de 2 médianes (Wilcoxon, Mann-Whitney)
  • Tests de comparaisons de 2 proportions (Fisher exact)

Puissance et dimensionnement des tests

  • Risque béta
  • Puissance
  • Taille d’échantillon requise
  • Delta mis en évidence
  • Les stratégies de mise en œuvre
  • Mise en pratique sur les tests de comparaisons de moyennes
  • Mise en pratique sur les tests de comparaisons de proportions

Corrélation

  • Le contexte de la corrélation
  • Les différents indicateurs (r de Pearson, r de Spearman)
  • Interprétation
  • Approche graphique

Méthodes et moyens

  • Explications théoriques suivies de pratiques guidées puis mises en autonomie
  • 1 vidéoprojecteur par salle
  • 1 ordinateur par stagiaire

Méthodes d’évaluation des acquis

  • Exercices de synthèse et d’évaluation
  • Evaluation de fin de stage

Profil formateur

Nos formateurs sont certifiés à l’issue d’un parcours organisé par nos soins. Ils bénéficient d’un suivi de compétences aussi bien au niveau technique que pédagogique.

Support stagiaire

  • Support papier ou électronique (dématérialisé)
  • Les exercices d’accompagnement peuvent être récupérés sur clef USB