DES RESSOURCES ET DES OUTILS AU SERVICE DES ACTEURS ET DES PROFESSIONNELS.

Analyse de données en environnement Hadoop

Date de mise à jour : 31/10/2025 | Identifiant OffreInfo : 03_2100653F

Information fournie par :
Via Compétences (Carif-Oref Auvergne-Rhône-Alpes)

Objectifs, programme, validation de la formation

Objectifs

Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce

Savoir explorer HDFS et suivre l'exécution d'une application YARN

Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Programme de la formation

- Hadoop


  • Comprendre Hadoop 2.0 et son écosystème

  • Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?

  • Le Hadoop Distributed File System (HDFS)

  • Introduction aux données dans HDFS

  • MapReduce Framework et YARN

- Pig

  • Introduction à Pig

  • Programmation Pig avancée

  • Troubles hooting et optimisation avec Pig

  • Résolution des problèmes avec Pig

  • Utiliser l'UI Web d'Hadoop

  • Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web

  • Échantillonnage de données et débogage

  • Vue d'ensemble des performances

  • Comprendre le plan d'exécution

  • Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

  • Programmation Hive

  • Utilisation de HCatalog

  • Programmation Hive avancée

  • Étendre Hive

  • Transformation de données avec des Scripts personnalisés

  • Fonctions définies par l'utilisateur

  • Paramétrer les requêtes

  • Exercices « Hands-On » : transformation de données avec Hive

  • Programmation Hive avancée (suite)

  • Analyse de données et statistiques

- Sqoop

  • Import/Export avec Sqoop (SGBDR HDFS)

  • Sqoop, fonctions avancées

  • Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

  • Introduction à H-Base

  • Exemple d'ingestion de données avec l'ETL Talend

  • Créer son propre cluster Hadoop (plateforme de test).

Validation et sanction

- Comprendre ce que sont Hadoop et YARN

- Connaître les différents outils et les Framework dans un environnement Hadoop

- Appréhender MapReduce

- Comprendre comment exécuter une tâche de MapReduce sur YARN

- Exécuter des modifications en masse avec PIG

- Savoir écrire des requêtes pour HIVE afin d'analyser ses données

- Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle

- Découverte d'autres briques : automatiser vos process avec Oozie

- Utiliser une base de données No-SQL (HBase)

Type de formation

Non certificiante

Sortie

Sans niveau spécifique

Métiers visés

Code Rome

Durée, rythme, financement

Modalités pédagogiques
Durée
21 heures en centre

Conventionnement : Non

Financeur(s)

Bénéficiaire de l'action

Entreprise

Conditions d'accès

Public(s)
Salarié, Tout public
Modalités de recrutement et d'admission

Niveau d'entrée : Sans niveau spécifique

Conditions spécifiques et prérequis

Aucun

Modalités d'accès

Lieu de réalisation de l'action

formation entièrement présentielle
Adresse
33 Rue de la République
69002 - Lyon 2e
Responsable : ASI
Téléphone fixe :
Contacter l'organisme

Contacts

Contact sur la formation
41 Rue de la Découverte
31670 - Labège
Responsable :
Téléphone fixe : 0972567567
fax :
Site web :
Contacter l'organisme
Contacter l'organisme formateur
Data Value
SIRET: 81837224500014
31670 Labège
Responsable : CALAS
Téléphone fixe : 0972567567
Site web :
Contacter l'organisme

Période prévisibles de déroulement des sessions

du 21/10/2026 au 23/10/2026
débutant le : 21/10/2026
Adresse d'inscription
41 rue de la Découverte
31676 - Labège
Etat du recrutement : Ouvert
Modalités : Entrées / Sorties à dates fixes

Organisme responsable

Data Value
SIRET : 81837224500014

Adresse
41 Rue de la Découverte
31670 - Labège
Téléphone fixe : 0972567567
Contacter l'organisme