- Identifier les différents types de données et leurs usages dans un contexte professionnel.
- Collecter, nettoyer et structurer des données de manière rigoureuse.
- Comprendre les notions essentielles liées à la qualité et à la représentativité des données.
- Explorer et visualiser des données pour en extraire des informations clés.
- Identifier les enjeux éthiques, réglementaires et environnementaux liés à la donnée et à l'IA.
- Documenter et présenter un mini-projet de préparation de données en vue d'une application IA.
Jour 1 : Comprendre la donnée et l'IA
- Introduction à l'intelligence artificielle et à la donnée.
- Les différents types de données (structurées, non structurées, massives).
- Les principales sources de données en entreprise.
- Chaîne de valeur de la donnée : de la collecte à l'exploitation.
- Activité : Identifier les données présentes dans son environnement professionnel.
Jour 2 : Collecter et préparer les données
- Méthodes de collecte et d'intégration des données.
- Principes de la qualité et de l'intégrité des données.
- Initiation aux techniques de nettoyage (données manquantes, doublons, anomalies).
- Introduction aux outils de manipulation de données (Excel, Python, Power Query).
- Cas pratique : préparation d'un jeu de données simple.
Jour 3 : Explorer et visualiser les données
- Concepts d'analyse exploratoire de données.
- Comprendre la distribution, la corrélation et les indicateurs statistiques.
- Visualisation : principes et bonnes pratiques.
- Outils de visualisation (Tableau, Power BI, Python / Matplotlib).
- Mini-projet : création d'un tableau de bord synthétique.
Jour 4 : Qualité, éthique et projet final
- Évaluer la représentativité et la pertinence d'un jeu de données.
- Identifier les biais et risques éthiques.
- Rappel du RGPD et de la protection des données.
- Construire une documentation de données (« datasheet »).
- Cas final : présentation d'un mini-projet de préparation et visualisation de données.
Non prévu;
Certifiante