- Comprendre l'écosystème Python dédié à la Data Science
- Maîtriser les bases du langage Python appliquées à l'analyse de données
- Manipuler, nettoyer et préparer des jeux de données
- Réaliser des analyses statistiques exploratoires
- Créer des visualisations de données pertinentes
- Appliquer des algorithmes de Machine Learning supervisés et non supervisés
- Évaluer et améliorer les performances des modèles
- Mettre en œuvre un projet Data Science complet
Module 1 : Introduction à la Data Science et à Python
- Présentation de la Data Science
- Cas d'usage et métiers associés
- Installation de l'environnement de travail (Python, Anaconda, Jupyter)
- Présentation des bibliothèques clés
Module 2 : Fondamentaux de Python pour la Data Science
- Syntaxe de base et structures de données
- Conditions, boucles et fonctions
- Manipulation de fichiers
- Bonnes pratiques de programmation
Module 3 : Manipulation et analyse de données
- Introduction à NumPy
- Manipulation de données avec Pandas
- Importation et exportation de données
- Nettoyage et préparation des datasets
Module 4 : Analyse exploratoire et statistiques
- Statistiques descriptives
- Analyse univariée et bivariée
- Détection des valeurs aberrantes
- Introduction aux probabilités
Module 5 : Visualisation des données
- Principes de la data visualisation
- Visualisation avec Matplotlib
- Visualisation avancée avec Seaborn
- Création de graphiques interprétables
Module 6 : Introduction au Machine Learning
- Concepts fondamentaux du Machine Learning
- Apprentissage supervisé et non supervisé
- Séparation des jeux de données
- Métriques d'évaluation des modèles
Module 7 : Algorithmes de Machine Learning avec Python
- Régression linéaire et logistique
- K-means et clustering
- Arbres de décision et forêts aléatoires
- Utilisation de Scikit-learn
Module 8 : Projet Data Science
- Définition d'une problématique métier
- Analyse complète d'un jeu de données
- Construction et évaluation d'un modèle
- Présentation et interprétation des résultats
Attestation de formation
Non certifiante
Sans niveau spécifique