Apprendre à utiliser le logiciel R pour analyser des données.Mettre en œuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
- Statistiques descriptives
- Gestion d'un jeu de données - dataframe
Importation, caractérisation, sélection, sous-ensembles - Premières analyses d'un jeu de données
Premières vérifications, valeurs manquantes, recodage - Résumé d'une variable quantitative – numeric
- Résumé d'une variable qualitative – factor
- Intervalle de confiance
- Le raisonnement à partir d'un échantillon
Généralités, échantillonnage, estimation d'un paramètre - Intervalle de confiance d'une moyenne, d'une proportion, d'une variance
- Tests d'hypothèses
- Qu'est-ce qu'un test d'hypothèse ?
Généralités, règle de décision, risques d'erreur, puissance - Les tests de conformité ou de comparaison à une norme
- Les tests de comparaison de deux populations
- Test d'ajustement à une loi de probabilité normale
- Introduction aux tests non paramétriques
- Liaisons entre deux variables
- Liaison entre deux variables quantitatives
Nuage de points, intensité de la liaison, significativité - Liaison entre deux variables qualitatives
Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2 - Liaison entre une variable qualitative et quantitative
Comparaison de plusieurs populations, le rapport de corrélation - Liaisons entre plusieurs variables
Approches graphiques : matrice de nuages de points, treillis
Caractériser des sous-populations par plusieurs variables
- L'analyse de la variance – Anova
- Analyse de la variance à un facteur
Variabilité inter, intra, totale – Rapport de corrélation - Le test de Fisher - Comparaisons multiples de moyennes
Analyses post hoc, la procédure de Tukey - Analyse de la variance à deux facteurs et interaction
- Extensions de l'Anova
Modèle à effet fixe ou aléatoire, modèle hiérarchisé
- Régression linéaire simple et multiple
- De la corrélation à la régression
L'intérêt d'un modèle - Variables à expliquer, explicatives, erreur - La régression linéaire simple
Ajustement par la méthode des moindres carrés - Tests et validation du modèle - La régression linéaire multiple
- Choix d'un modèle de régression
Pourquoi sélectionner un sous-ensemble de variables explicatives ?
Les différentes approches et critères de sélection d'un modèle
- Analyse de données multidimensionnelles
- Un panorama des méthodes mult
Attestation de formation
Non certificiante
Sans niveau spécifique