Date de mise à jour : 01/09/2025 | Identifiant OffreInfo :
02_202508335546
Organisme responsable :
EVOLUTION5
• Comprendre la différence entre données non structurées et structurées.
• Identifier les principales sources de données non structurées.
• Apprendre les méthodes et outils pour transformer les données.
• Intégrer les bonnes pratiques de qualité, d'éthique et de sécurité.
• Mettre en pratique sur des cas génériques applicables à différentes spécialités : marketing, ingénierie, médical, financier…
Module 1 – Comprendre les données structurées et non structurées
Définir les notions de données structurées et non structurées
Illustrer par des cas concrets en entreprise (rapports, emails, images, notes, enregistrements, etc.)
Expliquer pourquoi transformer les données en informations exploitables est essentiel à la performance
Module 2 – Identifier les sources et formats de données non structurées
Analyser les textes libres (emails, contrats, rapports PDF, comptes rendus)
Explorer les données visuelles et multimédia (images, vidéos, schémas techniques)
Examiner les données issues de capteurs, logs systèmes ou monitoring
Rechercher et exploiter les informations issues de la documentation, de la veille ou de bases externes
Module 3 – Utiliser les techniques et outils d'extraction
Appliquer les méthodes classiques (règles, dictionnaires métiers, taxonomies)
Introduire le NLP (traitement automatique du langage naturel)
Exploiter les grands modèles de langage (LLMs, ex. GPT)
Mettre en œuvre l'OCR pour traiter les documents scannés
Transformer les données extraites en formats structurés (CSV, JSON, bases relationnelles, etc.)
Module 4 – Garantir la qualité, la fiabilité et la validation
Détecter les erreurs fréquentes (OCR, ambiguïtés, doublons)
Valider les extractions par relecture humaine (human-in-the-loop)
Mesurer la performance avec des métriques adaptées (précision, rappel, cohérence)
Adopter les bonnes pratiques pour fiabiliser les résultats
Module 5 – Respecter l'éthique, la réglementation et la sécurité
Protéger la confidentialité et la sensibilité des données
Appliquer les cadres légaux (RGPD, normes sectorielles)
Mettre en œuvre l'anonymisation et la pseudonymisation
Assurer un hébergement sécurisé conforme aux standards internationaux
Module 6 – Mettre en pratique sur un cas concret
Extraire des informations clés d'un rapport, d'un contrat ou d'un document technique
Convertir un document PDF ou une source brute en tableau structuré exploitable
-
Non certifiante
Information non communiquée