- Comprendre les fondamentaux de la Data Science
- Maîtriser le langage Python pour l'analyse de données
- Manipuler, nettoyer et préparer des données
- Réaliser des analyses exploratoires de données
- Utiliser les principales bibliothèques Python de Data Science
- Créer des visualisations pertinentes
- Mettre en œuvre des modèles statistiques et de machine learning
- Interpréter et communiquer les résultats d'analyse
Module 1 : Introduction à la Data Science et à Python
- Concepts clés de la Data Science
- Environnement de travail Python (Anaconda, Jupyter Notebook)
- Rappels sur les bases du langage Python
Module 2 : Manipulation et préparation des données
- Structures de données Python
- Introduction à NumPy
- Manipulation de données avec Pandas
- Nettoyage, transformation et préparation des jeux de données
Module 3 : Analyse exploratoire des données
- Statistiques descriptives
- Détection des valeurs aberrantes
- Analyse de corrélations
- Études de cas pratiques
Module 4 : Visualisation des données
- Principes de la data visualisation
- Bibliothèques Matplotlib et Seaborn
- Création de graphiques adaptés aux analyses
Module 5 : Introduction au Machine Learning
- Concepts fondamentaux du Machine Learning
- Apprentissage supervisé et non supervisé
- Mise en œuvre avec Scikit-learn
- Évaluation des modèles
Module 6 : Projet Data Science
- Analyse complète d'un jeu de données réel
- Choix des méthodes et modèles
- Interprétation et présentation des résultats
Attestation de formation
Non certifiante
Sans niveau spécifique