Apprendre à réécrire sous R un programme SAS faisant appel à des étapes de manipulation, de traitement, d'analyse et de visualisation de données
- Présentation de R et son interface R Studio
- Spécificités de l'approche R et de la syntaxe R (par rapport à SAS)
Manipulations de base
- Généralités sur le langage R "historique", installation et chargement de packages, types de données sous R
- Importer des fichiers sous R
- Récupérer les caractéristiques d'un objet
- Calculer des indicateurs statistiques + comparaison par rapport aux procédures type MEANS / FREQ de SAS
- Pratique : importer un fichier SAS depuis R, le décrire et calculer des statistiques descriptives
Traitement de données
- Le dataframe et ses manipulations courantes : équivalent sous R des dataset SAS
- Package dyplr : manipuler les données dans une logique similaire à celle des étapes data / proc SQL
- Autres packages du tidyverse : manipulations sur les dates, facteurs, chaînes de caractère, transpositions de données Pratique : manipuler sous R un fichier de données
Visualisations
- Présentation succincte des fonctions natives de visualisation sous R
- Package ggplot2 : principes, syntaxe et comparaison par rapport aux procédures GPLOT et SGPLOT
- Pratique : produire sous R différentes visualisations graphiques
Analyse de données + machine learning
- Tests statistiques et ACP : mise en œuvre sous R et interprétation des sorties
- Régression linéaire : comparaison des approches et sorties de R par rapport à SAS (proc REG)
- Intro au machine learning
- Pratique : mettre en œuvre une régression et / ou une ACP sous R et comparer les sorties obtenues avec celles de SAS
Aperçu des possibilités de R avec des packages additionnels
- Packages SQL : pour rester dans la syntaxe d'une proc SQL
- Markdown : pour générer des fichiers de sortie html / pdf dans la logique des sorties ODS de SAS
- Shiny et/ou plotly : pour aller plus loin dans la visualisation interactive
- Caret : pour aller plus loin dans le machine learning
- Pratique : avoir un aperçu concret de ce que permettent ces packages à partir d'exemples déjà fournis
Programmation
- Boucles et conditions sous R
- Fonctions sous R : une alternative au macro langage de SAS
- Fonctions de type apply : une autre alternative au macro langage
- Pratique : transposer une macro SAS existante en un traitement automatisé sous R
Cas pratique : transposer 1 code SAS en R
- Réécrire sous R un programme SAS constitué de plusieurs étapes data, de macros / macro-variables et de procédures de visualisations
- Etudier les différentes alternatives possibles sous R
Attestation de formation
Non certifiante
Sans niveau spécifique