- Identifier les possibilités d'utilisation des données, en fonction des besoins métier, en étant force de proposition dans l'exploration, l'évaluation de la qualité et l'interprétation de ces données
- Définir une stratégie de prise de décision par les données suivant les besoins métier
- Modéliser des bases de données relationnelles
- Réaliser des requêtes avancées répondant à des besoins métier complexes
- Automatiser des collectes de données
- Mettre en place une interface standard de partage automatique de données entre différentes applications et langages
- Contrôler les modalités de collecte et d'utilisation de données et mesurer les enjeux du RGPD
- Effectuer des choix méthodologiques pour l'automatisation des traitements et les documenter avec clarté et concision
- Utiliser les outils et méthodes modernes : méthodes agiles afin de permettre le travail en équipe, outils de suivi de projets, logiciel adapté à la rédaction de code
- Manipuler des structures de données et utiliser l'algorithmie afin de traduire en script des besoins de traitements de données
- Appliquer les bonnes pratiques de la programmation afin d'avoir un code organisé, réutilisable et partageable
- Utiliser les tableaux de données afin de faciliter l'import, la manipulation et la fusion de données
- Nettoyer les données, retraiter les valeurs aberrantes (outliers) et les valeurs manquantes
- Utiliser les expressions régulières (RegEx) pour traiter les valeurs textuelles et permettre une anonymisation des données personnelles dans le cadre du RGPD
- Utiliser les statistiques descriptives afin de modéliser les données
- Maîtriser le process d'apprentissage automatique (Machine Learning)
- Modéliser des régressions afin de définir des modèles de prévisions, et de trouver des tendances futures
- Modéliser des classifications et interpréter les métriques associées afin de catégoriser automatiquement des informations
- Traiter automatiquement le langage naturel (NLP) à partir de texte brut
- Contrôler et documenter les biais d'un modèle et des données d'entrainement afin d'estimer les risques éthiques
- Identifier et prioriser les informations à rendre accessibles et à présenter visuellement
- Utiliser les visualisations descriptives afin de représenter graphiquement des données statistiques et des informations modélisées
- Manipuler la Dataviz interactive et dynamique
- Réaliser de la cartographie
- Utiliser un Tableur afin de proposer des croisements de variables pour obtenir des informations recherchées
- Réaliser des tableaux de bord avec des outils de Business Intelligence afin d'intégrer et de croiser des informations utiles à des approches stratégiques de problématiques
- Prendre en compte les handicaps visuels afin de produire des graphiques...
COLLECTE DE DONNÉES :
- Identification des données disponibles,
- Recherche de données à partir de besoins définis,
- Gestion d'opérations de collecte et de qualification de données.
AUTOMATISATION DU TRAITEMENT DES DONNÉES :
- Analyse des besoins de traitement de données,
- Structuration d'outils et d'algorithmes de traitements de données,
- Fiabilisation d'outils de traitements de bases de données et organisation de codes.
MODÉLISATION DES DONNÉES STRUCTURÉES :
- Sélection d'informations utiles,
- Elaboration de structures de traitement d'informations,
- Modélisation de données.
VISUALISATION DES DONNÉES :
- Visualisation de données,
- Présentation et partage de données et d'informations.
DEVENIR UN PROFESSIONNEL DE LA TECH :
- Contribuer à une communauté de data analysts,
- Créer un portfolio professionnel,
- Développer sa présence en ligne,
- Postuler à des offres d'emploi de data analyst.
Data analyst
Certifiante
Bac + 3 et 4