14_AF_0000050220_SE_0000968692 http://www.defi-metiers.fr/dm_search/formation/AF_50220 Réaliser ses analyses statistiques avec le logiciel R Data Value

Réaliser ses analyses statistiques avec le logiciel R

Date de mise à jour : 21/11/2023 | Identifiant OffreInfo : 14_AF_0000050220
Organisme responsable : Data Value

Objectifs

Objectifs :
Apprendre à utiliser le logiciel R pour analyser des données.
Mettre en oeuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles
Compétences visées :
- Importer, manipuler et analyser des données dans R
- Effectuer des analyses statistiques univariées
- Établir avec R des intervalles de confiance autour de paramètres comme moyenne, proportion et variance
- Réaliser les principaux tests d'hypothèses paramétriques et non paramétriques dans le logiciel
- Étudier numériquement et graphiquement la liaison entre 2 variables quantitatives, qualitatives ou de chaque nature
- Mettre en oeuvre des analyses de la variance à un ou plusieurs facteurs pour la comparaison de moyennes de population
- Élaborer un modèle établissant une relation linéaire entre une variable à expliquer et une (régression simple) ou plusieurs (régression multiple) variables explicatives.
- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide du package FactoMineR

Programme de la formation

- Statistiques descriptives
Gestion d'un jeu de données - dataframe
Importation, caractérisation, sélection, sous-ensembles
Premières analyses d'un jeu de données
Premières vérifications, valeurs manquantes, recodage
Résumé d'une variable quantitative - numeric
Indicateurs numériques, représentations graphiques
Résumé d'une variable qualitative - factor
Indicateurs numériques, représentations graphiques
- Intervalle de confiance
Le raisonnement à partir d'un échantillon
Généralités, échantillonnage, estimation d'un paramètre
Intervalle de confiance d'une moyenne
Intervalle de confiance d'une proportion
Intervalle de confiance d'une variance
- Tests d'hypothèses
Qu'est-ce qu'un test d'hypothèse ?
Généralités, règle de décision, risques d'erreur, puissance
Les tests de conformité ou de comparaison à une norme
Conformité d'une moyenne, d'une proportion
Les tests de comparaison de deux populations
Comparaison de deux moyennes, de deux proportions
Test d'ajustement à une loi de probabilité normale
Le test de Shapiro-Wilk
Introduction aux tests non paramétriques
Test de Wilcoxon, Mann et Whitney, Kruskal Wallis, Friedman
- Liaisons entre deux variables
Liaison entre deux variables quantitatives
Nuage de points, intensité de la liaison, significativité
Liaison entre deux variables qualitatives
Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2
Liaison entre une variable qualitative et quantitative
Comparaison de plusieurs populations, le rapport de corrélation
Liaisons entre plusieurs variables
Approches graphiques : matrice de nuages de points, treillis
Caractériser des sous-populations par plusieurs variables
- L'analyse de la variance - Anova
Analyse de la variance à un facteur
Variabilité inter, intra, totale - Rapport de corrélation - Le test de Fisher
Comparaisons multiples de moyennes
Analyses post hoc, la procédure de Tukey
Analyse de la variance à deux facteurs et interaction
Extensions de l'Anova
Modèle à effet fixe ou aléatoire, modèle hiérarchisé
- Régression linéaire simple et multiple
De la corrélation à la régression
L'intérêt d'un modèle - Variables à expliquer, explicatives, erreur
La régression linéaire simple
Ajustement par la méthode des moindres carrés - Tests et validation du modèle
La régression linéaire multiple
Choix d'un modèle de régression
Pourquoi sélectionner un sous-ensemble de variables explicatives ?
Les différentes approches et critères de sélection d'un modèle
- Analyse de données multidimensionnelles
Un panorama des méthodes multidimensionnelles
Analyses factorielles, classification - Le package FactoMineR
ACP : Analyse en Composantes principales
AFC : Analyse Factorielle des Correspondances
ACM : Analyse des correspondances Multiples
CAH : Classification Ascendante Hiérarchique

Validation et sanction

Attestation d'acquis ou de compétences;Attestation de suivi de présence

Type de formation

Non certifiante

Sortie

Sans niveau spécifique

Contact de la formation

Contact de l'organisme formateur

Data Value
SIRET : 81837224500014

Information fournie par :