Traitement des données

Habilitation

[Code Certif Info N°96515]
Avertissement : cette fiche est en état archivé
Niveau de qualification
Sans équivalence de niveau
Sortie
Sans niveau spécifique
Objectif

Analyse qualitative et quantitative des données.

T1 : Identification du périmètre des données.

  • Classer les données, préalablement listées, en distinguant les sources internes et externes pour qualifier leurs fiabilités en fonction de leurs typologies
  • Appréhender les enjeux de chaque métier et des cas d'usage associés pour intégrer les objectifs à viser et les besoins à satisfaire
  • Créer les liens entre les données mises à disposition et les différents métiers concernés pour définir le périmètre de l'analyse
  • Exploiter la connaissance sur les données détenue par leurs propriétaires et gestionnaires pour les enrichir et mieux les interpréter

T2 : Qualification des données.

  • Appliquer les procédés statistiques pour dénombrer le contenu de l'échantillon des données.
  • Appliquer les techniques d'évaluation de la qualité des données pour apprécier celle de l'échantillon et y accorder un niveau de confiance.
  • Analyser les écarts constatés entre les résultats intermédiaires obtenus et les objectifs associés pour évaluer la nécessité de compléter ou non l'analyse, en y attribuant des moyens supplémentaires.
  • Formaliser un rapport de description des données, incluant des représentations graphiques afin de restituer un état des lieux sur la qualité et la quantité des données.
  • Présenter le rapport d'analyse de données en s'adaptant à l'auditoire.
  • Déterminer les corrélations entre les données pour les aligner aux enjeux des métiers existants. (Gestion des risques - Réduction des coûts - Génération de revenus additionnels)

Préparation des données.

T1 : Sélection des données

  • Sélectionner les enregistrements et les attributs de données en lien avec les objectifs métiers pour permettre l'analyse de l'exploitation des données.
  • Arbitrer suivant une logique d'ensemble, entre la décision d'inclure ou non les données, en fonction des objectifs métiers, pour clarifier le traitement qui sera mis en place.

T2 - Nettoyage des données.

  • Exploiter le rapport de description des données mettant en exergue l'état des lieux sur leur qualité pour choisir les techniques de nettoyage les plus appropriées.
  • Appliquer les procédés de nettoyage de la donnée pour fiabiliser les résultats.
  • Élaborer un rapport sur le nettoyage des données pour présenter le niveau d'utilité des données dans leur futur traitement.

T3 - Construction de nouvelles données.

  • Appliquer des techniques de calcul de nouveaux attributs et de normalisation des données (création de champ calculé à partir de champ existant) pour permettre l'exécution des algorithmes de modélisation retenus.

T4 - Agrégation de la donnée.

  • Appliquer les deux méthodes d'agrégation des données (fusion des données - ajout des données) pour créer le référentiel des données à modéliser excluant les doublons.
  • Évaluer le niveau de confiance relatif au référentiel de données préalablement élaboré pour confirmer l'intérêt d'engager ou non les traitements futurs.

T5 - Formatage de la donnée

  • Mettre en adéquation des formats de données au regard des algorithmes de modélisation qui seront appliqués pour optimiser le traitement. (chemin d'utilisation - délais de traitement- durée de modélisation).

Traitement des données.

  • Appliquer les critères de modélisation (types de données disponibles pour l'exploration - objectifs d'analyse de données - exigences de modélisation particulières) pour sélectionner les techniques de modélisation adaptées.
  • Transformer le problème Métier initial en un problème mathématique pour le traduire en algorithme
  • Concevoir le modèle mathématique et estimer les paramètres afin de choisir les techniques de modélisation les plus appropriées.
  • Appliquer les techniques de modélisation des données à travers la création de modèles qui répondent aux problématiques posées tout en s'assurant de la traçabilité des actions menées.

T2 - Évaluation des résultats du traitement des données

  • Évaluer la pertinence des résultats au niveau de leurs utilités et de leurs exploitabilités, à partir de critères de réussite préalablement prédéfinis pour valider l'atteinte des objectifs.

T3- Évaluation des modèles et techniques de modélisation

  • Évaluer la pertinence des modèles et techniques en fonction des objectifs d'analyse préalablement définis pour une réexécution possible des modèles et/ou un ajustement des valeurs de paramètres.
  • Mettre en oeuvre les procédés d'amélioration et d'adaptation des modèles et techniques de modélisation pour correspondre aux évolutions futures des données.

Restitution des résultats.

T1 - Interprétation des résultats du traitement de la donnée et communication

  • Interpréter les résultats en lien avec les objectifs métiers visés et les marges de progression identifiées pour aboutir à une analyse finale circonstanciée.
  • Formaliser un rapport des résultats d'exploitation des données, incluant des représentations graphiques afin de restituer un état des lieux sur les résultats
  • Communiquer sur le rapport d'exploitation des données, en élaborant une `'histoire à raconter'' mettant en lumière les principaux points pertinents aux yeux des Métiers.

T2 - Déploiement des résultats du projet.

  • Accompagner les équipes-métiers dans l'utilisation des résultats du traitement de la donnée, en faisant preuve de pédagogie, pour mettre en place les améliorations possibles.
  • Relever les retours d'expériences obtenus auprès des équipes-métiers corrélés à sa propre expérience pour réaliser une révision finale du projet.
RNCP
Non
Répertoire spécifique
Certificateur
  • École supérieure d'assurances
Valideur
  • École supérieure d'assurances
    1ère habilitation Début validité Fin validité
    31/12/2021
Session de l'examen
Année de la première session Année de la dernière session
Domaine de formation (Formacode® V13)
  • 31054 : Informatique et systèmes d'information
Groupes formation emploi (GFE)
  • P : Gestion et traitement de l'information
Domaine de spécialité (NSF)
320 : Spécialité plurivalentes de la communication
Accessibilité
Formation initiale Formation continue Apprentissage Contrat de pro VAE ou par expérience Demande individuelle
Informations mises à jour le 28/08/2019 par Certif Info.