Logiciel R - niveau 2 Orienté programmation

Référence : STA-N2-R-Prog

Cette formation s'adresse à des personnes souhaitant se perfectionner dans l’utilisation du logiciel R dans un contexte de programmation et d’automatisation du traitement de leurs données. Elle conviendra à des utilisateurs de R venant chercher du savoir-faire logiciel sur la programmation « avancée » : utilisation des boucles, des tests conditionnels, création de fonctions d’automatisation performantes…

Il ne s’agit donc pas d’une formation sur le fond statistique mais bien d’une formation orientée logiciel. En outre, cette formation n’est pas adaptée aux apprenants à la recherche d’un savoir-faire sur la mise en œuvre des analyses statistiques sous R.

Infos pratiques

  • Durée : 3 jours soit 21 heures
  • Population visée : Employé – Technicien – Cadre – Chercheur – Etudiant
  • Public concerné : Toute personne souhaitant se perfectionner dans l’utilisation du logiciel R dans un contexte de programmation et d’automatisation du traitement de leurs données

Programme

Objectifs pédagogiques

A l’issue de cette formation, l’apprenant sera capable de :

  • Utiliser les fonctions les plus courantes du logiciel R
  • Manipuler efficacement les objets (vecteurs, matrices, data frames, listes) sous R
  • Lire et écrire des scripts élaborés
  • Trier, filtrer et fusionner des tableaux de données
  • Utiliser des tests conditionnels et des boucles de répétition dans un programme
  • Créer des fonctions personnelles d’automatisation des tâches
  • Optimiser un programme

Pré-requis

  • Il est INDISPENSABLE que l’apprenant soit déjà un utilisateur du logiciel R. La création et la manipulation des objets sous R, l’importation des données, l’utilisation de R en mode script ou en mode console sont des pré-requis essentiels pour s’inscrire à cette formation.

Thèmes principaux

  • EDI (Rstudio)
  • Manipulation avancée des objets sous R
  • Tri, filtre et fusion de tableaux de données
  • Structure de contrôle : tests conditionnes, boucles…
  • Création de fonctions et de scripts utilisateurs performants
  • Vectorisation d’un programme

Quelques mots-clés

  • Scripts
  • Fonctions
  • Manipulation avancée des données
  • Opérateurs logiques
  • Opérateurs de comparaison
  • Tests conditionnels
  • Boucles

Objectifs opérationnels et contenu de la formation

Revoir les fondamentaux sur le logiciel R

  • Fonctionnement général du logiciel et documentation en ligne
  • Conseils sur l’organisation d’un projet R
  • Affichage, sauvegarde, suppression et chargement des objets en mémoire
  • Importation des données contenues dans fichier ASCII ou dans un classeur Excel
  • Installation et utilisation d’un package
  • Trucs et astuces

Utiliser un EDI

  • Avantages et inconvénients
  • Présentation de différents EDI
  • Installation et prise en main de Rstudio

Créer et manipuler efficacement les objets sous R

  • Création et manipulation efficace des objets sous R
    • Vecteurs : séquences régulières, vecteurs de nombres aléatoires…
    • Matrices
    • Data frames
    • Listes simples et listes imbriquées
  • Ajout d’éléments à un objet
  • Concaténation 
    • des chaînes de caractères
    • des vecteurs : commandes cbind, rbind…
  • Contrôle du type des objets et conversion des objets
    • Transformer un vecteur en matrice ou en data frame
    • Transformer un variable numérique en variable catégorielle
    • Commandes is.something
    • Commandes as.something

Trier, filtrer et fusionner des tableaux de données sous R

  • Tri un tableau de données
  • Filtrage des données d’un tableau (lignes et/ou colonnes)
    • Par le biais des noms des éléments
    • Par le biais des indices des éléments
    • Par le biais des opérateurs de comparaison (extraction par condition)
    • Par le biais des opérateurs de comparaison et des opérateurs logiques (extraction par conditions)
  • Extraction aléatoire d’observations d’un tableau
  • Fusion de plusieurs tableaux de données

Maîtriser l’utilisation des fonctions les plus courantes du logiciel R

  • Fonctions d’information sur les objets : which, unique, sort, table, « na. »…
  • Principales fonctions mathématiques : log, exp, mean, median, cumsum…
  • Fonctions de type apply : apply, tapply…
  • Fonctions dédiées à l’algèbre linéaire : %*%, solve…
  • Fonctions dédiées au traitement des chaînes de caractères : paste, grep, match, %in%...

Importer et exporter des données sous R

  • Présentation des différentes fonctions d’importation et d’exportation des données
  • Importation des données
    • Contenues dans un fichier ASCII
    • Contenues dans un fichier CSV
    • Contenues dans un classeur Excel
    • Provenant d’un autre logiciel de statistique : Minitab, SAS, S-plus, SPSS, Stata…(sur demande)
  • Exportation des données
  • Utilisation de la fonction scan() pour l’importation de grands tableaux de données au format ASCII

Créer et exécuter des scripts élaborés 

  • Exécution des scripts : dans la console, à partir d’un autre script
  • Entrées clavier et sorties écran
    • Commande scan(), package svDialogs
    • Commandes cat et print
  • Structure de contrôle
    • Sélection : if, if else, ifelse, switch
    • Boucles : for, while, repeat
    • Commandes break, stop, next
  • Extraire les éléments d’une analyse statistique : p-values d’une ANOVA, résidus d’une régression…

Créer et exécuter des fonctions utilisateur

  • Accéder au programme d’une fonction R (pour s’en inspirer, pour la modifier)
  • Expression générale des fonctions
  • Valeur par défaut des paramètres d’une fonction
  • Les « … »
  • Exécution d’une fonction
  • Création d’une fonction d’automatisation de tâches complexes
  • Chargement d’une fonction utilisateur en mémoire
  • Débogage d’une fonction

Optimiser un programme

  • Les erreurs à ne pas commettre
  • Les solutions permettant d’éviter les boucles et les instructions de sélection
  • Vectorisation d’un programme

Méthodes et moyens

Explications théoriques suivies de pratiques guidées puis mises en autonomie

  • 1 vidéoprojecteur par salle
  • 1 ordinateur par stagiaire

Méthodes d’évaluation des acquis

  • Exercices d’applications
  • Evaluation de fin de stage

Profil formateur

Nos formateurs sont certifiés à l’issue d’un parcours organisé par nos soins. Ils bénéficient d’un suivi de compétences aussi bien au niveau technique que pédagogique.

Support stagiaire

  • Support électronique (dématérialisé)
  • Les exercices d’accompagnement peuvent être récupérés sur clef USB