Apprendre à réécrire sous R un programme SAS faisant appel à des étapes de manipulation, de traitement, d'analyse et de visualisation de données
- Introduction
- Présentation de R et son interface R Studio
- Spécificités de l'approche R (par rapport à SAS)
- Spécificités de la syntaxe R (par rapport à SAS)
- Manipulations de base sous R
- Généralités sur le langage R "historique"
- Installation et chargement de packages
- Types de données sous R
- Importer des fichiers sous R (textes bruts, Excel, dataset SAS)
- Récupérer les caractéristiques d'un objet (équivalent procédure CONTENTS)
- Calculer des indicateurs statistiques, et comparaison par rapport aux procédures type MEANS / FREQ de SAS
- Pratique : importer un fichier SAS depuis R, le décrire et calculer des statistiques descriptives
- Traitement de données sous R
- Le dataframe et ses manipulations courantes : équivalent sous R des dataset SAS
- Package dyplr : manipuler les données dans une logique similaire à celle des étapes data / proc SQL
- Autres packages du tidyverse : manipulations sur les dates, facteurs, chaînes de caractère, transpositions de données
- Pratique : manipuler sous R un fichier de données
- Visualisations
- Présentation succincte des fonctions natives de visualisation sous R
- Package ggplot2 : principes, syntaxe et comparaison par rapport aux procédures GPLOT et SGPLOT
- Pratique : produire sous R différentes visualisations graphiques
- Analyse de données et machine learning
- Tests statistiques et ACP : mise en œuvre sous R et interprétation des sorties
- Régression linéaire : comparaison des approches et sorties de R par rapport à SAS (proc REG)
- Introduction rapide au machine learning sous R
- Pratique : mettre en œuvre une régression et / ou une ACP sous R et comparer les sorties obtenues avec celles de SAS
- Aperçu des possibilités de R avec des packages additionnels
- Packages SQL : pour rester dans la syntaxe d'une proc SQL
- Markdown : pour générer des fichiers de sortie html / pdf dans la logique des sorties ODS de SAS
- Shiny et/ou plotly : pour aller plus loin dans la visualisation interactive
- Caret : pour aller plus loin dans le machine learning
- Pratique : avoir un aperçu concret de ce que permettent ces packages à partir d'exemples déjà fournis
- Programmation sous R
- Boucles et conditions sous R
- Fonctions sous R : une alternative au macro langage de SAS
- Fonctions de type apply : une autre alterna
Attestation de formation
Non certificiante
Sans niveau spécifique