14_AF_0000029266_SE_0001325459 # Introduction au big data Data Value

Introduction au big data

Date de mise à jour : 18/08/2025 | Identifiant OffreInfo : 14_AF_0000029266
Organisme responsable : Data Value

Objectifs

Comprendre le concept du Big Data

Être capable d'identifier l'écosystème et comprendre les technologies associées

Savoir anticiper son intégration dans les activités informatiques de l'entreprise


Compétences visées

- Avoir une introduction dédiée à la compréhension du Big Data

- Comprendre et appréhender le potentiel de rupture qu'offre la Big Data

- Connaître les méthodes et outils pour gérer efficacement un projet Big Data

- Cerner les fondamentaux du Big Data pour optimiser son Business

- Disposer d'une démonstration des principales technologies pour en comprendre les potentialités et les enjeux

Programme de la formation

Programme

- Définition commune du Big Data selon les grands acteurs du marché


  • Caractéristiques techniques des 3V de Gartner (Vélocité, Variété et Volume) et les variantes (Véracité, Valeur, Validité....)

  • Big Data : pourquoi maintenant ?

  • Traitement des données structurées, semi-structurées et déstructurées

  • Transformation des données massives en informations utiles et en valeur

  • Gestion des données en cycles, de l'acquisition à la gouvernance. Use Case et stratégies (GAFA (Google, Apple, Facebook, Amazon), exemples santé, grande distribution, bancassurance…)

  • Les grands acteurs et le marché du Big Data


- Description des technologies de référence du Big Data

  • NoSQL (Not Only SQL) et les nouvelles compétences attendues (Python, R, Scala, Java)…

  • Hadoop : un modèle d'open source du Big Data adopté par les grands acteurs de l'informatique (IBM, Oracle, Amazone, EMC, Google...)

  • Principaux composants d'Hadoop : HDFS (Hadoop Distributed File System), MapReduce, Pig, Flume, Zookeeper, H-BASE, Lucene, Hive, Cloudera, Oozie, Cassandra, Machine Learning...

  • Autres solutions : Docker, OpenStack, Elastic, Splunk…

  • Nouvelles architectures techniques pour traiter des données massives et non-structurées, en temps réel (SPARK)


- Relation entre Big Data et Cloud DaaS (Data as a Service)

  • Technologies associées au Cloud (datacenters, stockage, virtualisation, Grid, OS d'orchestration d'Openstack, réseaux...)

  • Emergence des solutions Big Data proposées en mode Cloud DaaS (Data as a service)


- Déploiement et utilisation du Big Data

  • Description d'une plate-forme de Big Data et bonnes pratiques

  • Intégration des données et systèmes existants à la plate-forme Big Data

  • Acquisition et qualification des données ouvertes des organisations publiques et sociales (Open Data)

  • Traitement des données à la volée (Data Streaming)

  • Analyse de données (Data Analytics et Business Intelligence)

  • Présentation des informations (Data Visualization)


- L'apport du NoSQL

  • Description des principales familles de bases de données NoSQL

  • Zoom sur MongoDb

  • Zoom sur Cassandra

  • Zoom sur Neo4j


- Une journée au cœur des écosystèmes Hadoop et Spark

  • Introduction générale

  • Les principales briques et leur rôle

  • PIG, Hive, Oozie, Flume, HDFS, MapReduce, Sqoop, Zookeeper, Hbase, Mahout, les connecteurs, …

  • SparkML, SparkQL, MLlib, Kafka, Storm, Flink , Beam, …

  • Démonstrations et discussions

Validation et sanction

Attestation de formation

Type de formation

Non certifiante

Sortie

Sans niveau spécifique

Contact de la formation

41 Rue de la Découverte
CS 37621
31670 - Labège
Téléphone fixe : 0176543916
Contacter l'organisme

Contact de l'organisme formateur

Data Value
SIRET : 81837224500014
Responsable : Monsieur Cédric CALAS
Téléphone fixe : 0176543916
Contacter l'organisme

Information fournie par :