- Apprendre à utiliser le logiciel R pour analyser des données.
- Mettre en oeuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
Statistiques descriptives
- Gestion d'un jeu de données - dataframe
- Importation, caractérisation, sélection, sous-ensembles
- Premières analyses d'un jeu de données
- Premières vérifications, valeurs manquantes, recodage
- Résumé d'une variable quantitative – numeric
- Indicateurs numériques, représentations graphiques
- Résumé d'une variable qualitative – factor
- Indicateurs numériques, représentations graphiques
Intervalle de confiance
- Le raisonnement à partir d'un échantillon
- Généralités, échantillonnage, estimation d'un paramètre
- Intervalle de confiance d'une moyenne
- Intervalle de confiance d'une proportion
- Intervalle de confiance d'une variance
Tests d'hypothèses
- Test d'hypothèse
- Généralités, règle de décision, risques d'erreur, puissance
- Tests de conformité ou de comparaison à 1 norme
- Conformité d'une moyenne, d'une proportion
- Les tests de comparaison de deux populations
- Comparaison de 2 moyennes, de 2 proportions
- Test d'ajustement à 1 loi de probabilité normale
- Test de Shapiro-Wilk
- Intro aux tests non paramétriques
- Test de Wilcoxon, Mann et Whitney, Kruskal Wallis, Friedman
Liaisons entre 2 variables
- Liaison entre 2 variables quantitatives
- Nuage de points, intensité de la liaison, significativité
- Liaison entre deux variables qualitatives
- Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2
- Liaison entre une variable qualitative et quantitative
- Comparaison de plusieurs populations, rapport de corrélation
- Liaisons entre plusieurs variables
- Approches graphiques : matrice de nuages de points, treillis
- Caractériser des sous-populations par plusieurs variables
L'analyse de la variance – Anova
- Analyse de la variance à un facteur
- Variabilité inter, intra, totale – Rapport de corrélation - Test de Fisher
- Comparaisons multiples de moyennes
- Analyses post hoc, procédure de Tukey
- Analyse de la variance à deux facteurs et interaction
- Extensions de l'Anova
- Modèle à effet fixe ou aléatoire, modèle hiérarchisé
Régression linéaire simple & multiple
- De la corrélation à la régression
- L'intérêt d'un modèle - Variables à expliquer, explicatives, erreur
- La régression linéaire simple
- Ajustement par la méthode des moindres carrés - Tests et validation du modèle
- La régression linéaire multiple
- Choix d'un modèle de régression
- Pourquoi sélectionner un sous-ensemble de variables explicatives ?
- Les différentes approches & critères de sélection d'un modèle
Analyse de données multidimensionnelles
Attestation de formation
Non certifiante
Sans niveau spécifique