S'approprier les outils, et les méthodes permettant de rendre son processus d'analyse de données sous R, aisé, reproductible, et performant.
Compétences visées
- Adopter une organisation efficace de son travail sous R
- Importer et nettoyer ses données avant analyse
- Simplifier la manipulation de données avec le package dplyr
- Manipuler aisément les champs catégoriels (package forecats), textuels (package stringr) et de date (package lubridate)
- Assembler des tables par jointure (par colonnes) et par fusion (par lignes)
- Construire des graphiques élaborés grâce au package ggplot2
- Réaliser des documents automatisés à l'aide de Quarto
Programme
- Organisation de son travail sous R
- Création de projet R
- Architecture du projet R
- Versionnage des scripts en local avec git
- Importations et nettoyage
- Accélération et automatisation des importations
- Uniformisation des noms des variables
- Création de labels
- Suppression des espaces
- Gestion des doublons
- Nettoyage et corrections diverses
- Manipulations avancées des data frame
- Introduction au package tidyverse
- Création de subsets, ajout de variables, transformation de variables
- Création de tables aggrégées par groupe
- Autres manipulations utiles
- Jointure de tables à l'aide d'une clé primaire
- Assemblage de tables de même structure
- Passage en format long et wide
- Gestion des variables de type factor avec forecats
- Afficher et renommer les niveaux
- Modifier l'ordre des niveaux manuellement et automatiquement
- Réaliser des regroupements de niveaux automatiquement
- Gestion des variables de types chaînes de caractères
- Découpage, recherche, suppression, remplacement de pattern avec le package stringr
- Création de chaîne de caractères complexes avec le package glue
- Initiation aux expression régulières
- Gestion des données de dates et d'heures avec lubridate
- Conversion d'une chaîne de caractères en date
- Extraction de différents éléments d'une date
- Diverses manipulations : calcul de délais, arrondi, ...
- Initiation au reporting avec Quarto
- Principe
- Premiers éléments : titre, texte, code, graphiques, tables
- Améliorations : numérotation, table des matières, légende et renvois
- Réalisation de graphiques avec ggplot2
- Principe du package
- Premiers graphiques de type scatterplot
- Gestion des couleurs, forme, taille, courbe de tendance
- Division en plusieurs sous fenêtre
- Autres types de graphiques
Attestation de formation
Non certifiante
Sans niveau spécifique