Python - Data Management

Référence : 2020-STA-N2-PythonDM

La formation en quelques mots

Python est un langage devenu populaire en raison de la simplicité d’écriture et de mise en œuvre des analyses et des programmes, de son accessibilité (environnement open-source), et de son champ d’application complet grâce aux nombreuses librairies qui disposent de fonctions relatives à plusieurs domaines comme la Data Science, la Data Visualisation, le calcul scientifique. Ce langage permet de développer des applications variées.
La formation a pour objectif de permettre aux personnes ayant des bases en programmation Python de se familiariser avec les outils de manipulation de données, d’exploiter des volumes de données importants et de différents types référencés dans la bibliothèque Pandas.

Thèmes principaux

  • Python
  • Pandas
  • Manipulation de données
  • Fonctions

Infos pratiques

  • Durée : 2 jours soit 14 heures
  • Population visée : Informaticiens - Développeurs - Ingénieurs
  • Public concerné : Personnes souhaitant apprendre à gérer des données avec Python à l’aide des outils des bibliothèques Pandas et NumPy.

Programme

Objectifs pédagogiques

A l’issue de cette formation, l’apprenant sera capable de :

  • Utiliser les différents composants de l’interface Python
  • Utiliser les outils de la bibliothèque Pandas pour la gestion de données
  • Construire, déclarer et manipuler les objets Python (DataFrame, Series, …)
  • Construire des graphiques avec la bibliothèque Matplotlib

Pré-requis

Cette formation nécessite de posséder des bases de programmation en Python.

Objectifs opérationnels et contenu de la formation

Introduction

  • Présentation de Python : Historique
  • Pourquoi utiliser Python ?
  • Le langage de programmation
  • Installation de Python
  • Description de l’environnement et de l’interface de Python

Syntaxe du langage Python

  • Conventions et règles 
  • Définition des blocs et des commentaires
  • Les différents types de données
  • Les variables
  • Les différentes manipulations des types de données de base : numérique et chaîne de caractères
  • Les structures conditionnelles
  • Les opérateurs de comparaisons
  • Les boucles : While et For
  • Les fonctions

Importation de données

  • Chemin d’accès
  • Copier-coller
  • Fichiers Excel

Définition des données en Python

  • Notion de variable
  • Création de variables
  • Les différents types de données en Python
    • Qu’est-ce qu’un « type » de données ?
    • Définition des types de données
  • Quels sont les différents types de manipulation de données en Python ?
  • Les différentes structures d’objet

La bibliothèque NumPy

  • Présentation et outils de la bibliothèque
  • Importation de la bibliothèque

La bibliothèque Pandas

  • Présentation et outils de la bibliothèque
  • Importation de la bibliothèque

Manipulation des vecteurs et des matrices avec la bibliothèque NumPy

  • Manipulation des vecteurs
    • Création
    • Extraction
    • Calculs
  • Manipulation des matrices
    • Création
    • Extraction
    • Calculs matriciels

Les Index

  • Définition d’un Index
  • Manipulation de base d’un ou plusieurs Index

Les Series

  • Définition d’une Serie
  • Manipulation de base d’une ou plusieurs Series
  • Opération sur les Series

Les DataFrame

  • Définition d’un DataFrame
  • Construction et déclaration d’un DataFrame
  • Caractéristiques d’un DataFrame
    • Type
    • Structure
  • Manipulation des variables
    • Accès et extraction des données
      • Par nom de variable
      • Par les indices
    • Opérations sur les variables

Gestion de DataFrame

  • Tri et filtre
  • Utilisation des boucles
  • Croisement de variables : Création d’un tableau récapitulatif
  • Opérations selon une ou plusieurs variables de groupement
  • Construction de variables calculées
  • Manipulation de plusieurs DataFrame
    • Jointure
    • Concaténation

Gestion de données manquantes

  • Recherche des données manquantes
  • Suppression des données manquantes
  • Imputation de données manquantes
  • Remplacement des données manquantes

Création de graphiques avec les outils de la bibliothèque Matplotlib

  • Présentation et importation de la bibliothèque Matplotlib
  • Les différents types de graphiques
  • Réalisation des graphiques :
    • Histogramme
    • Courbe
    • Boxplot
    • Scatterplot
    • Diagramme en secteurs
  • Gestion et visualisation des graphiques

Méthodes et moyens

  • Explications théoriques suivies de pratiques guidées puis mises en autonomie
  • 1 vidéoprojecteur par salle
  • 1 ordinateur par stagiaire

Méthodes d’évaluation des acquis

  • Exercices de synthèse et d’évaluation
  • Evaluation de fin de stage

Profil formateur

Nos formateurs sont certifiés à l’issue d’un parcours organisé par nos soins. Ils bénéficient d’un suivi de compétences aussi bien au niveau technique que pédagogique.

Support stagiaire

  • Support papier ou électronique (dématérialisé)
  • Les exercices d’accompagnement peuvent être récupérés sur clef USB