Imprimer la fiche

Objectifs, programme, validation de la formation

Objectifs

Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce

Savoir explorer HDFS et suivre l'exécution d'une application YARN

Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Programme de la formation

- Hadoop

Comprendre Hadoop 2.0 et son écosystème

Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?

Le Hadoop Distributed File System (HDFS)

Introduction aux données dans HDFS

MapReduce Framework et YARN

- Pig

Introduction à Pig

Programmation Pig avancée

Troubles hooting et optimisation avec Pig

Résolution des problèmes avec Pig

Utiliser l'UI Web d'Hadoop

Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web

Échantillonnage de données et débogage

Vue d'ensemble des performances

Comprendre le plan d'exécution

Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

Programmation Hive

Utilisation de HCatalog

Programmation Hive avancée

Étendre Hive

Transformation de données avec des Scripts personnalisés

Fonctions définies par l'utilisateur

Paramétrer les requêtes

Exercices « Hands-On » : transformation de données avec Hive

Programmation Hive avancée (suite)

Analyse de données et statistiques

- Sqoop

Import/Export avec Sqoop (SGBDR HDFS)

Sqoop, fonctions avancées

Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

Introduction à H-Base

Exemple d'ingestion de données avec l'ETL Talend

Créer son propre cluster Hadoop (plateforme de test).

Validation et sanction

Attestation de formation

Type de formation

Non certificiante

Sortie

Sans niveau spécifique

Métiers visés

Code Rome

Durée, rythme, financement

Modalités pédagogiques

Durée

21 heures en centre

Conventionnement : Non

Financeur(s)

Bénéficiaire de l'action

Entreprise

Conditions d'accès

Public(s)

Salarié, Tout public

Modalités de recrutement et d'admission

Niveau d'entrée : Sans niveau spécifique

Conditions spécifiques et prérequis

Aucun

Modalités d'accès

Lieu de réalisation de l'action

formation entièrement présentielle

Adresse

33 Rue de la République
69002 - Lyon 2e

Responsable : ASI
Téléphone fixe :
Contacter l'organisme

Contacts

Contact sur la formation

41 Rue de la Découverte
31670 - Labège

Responsable :
Téléphone fixe : 0972567567
fax :
Site web :
Contacter l'organisme

Contacter l'organisme formateur

Data Value
SIRET: 81837224500014
31670 Labège
Responsable : CALAS
Téléphone fixe : 0972567567
Site web :
Contacter l'organisme

Période prévisibles de déroulement des sessions

du 20/10/2025 au 22/10/2025
débutant le : 20/10/2025

Adresse d'inscription

41 rue de la Découverte
31676 - Labège

Etat du recrutement : Ouvert
Modalités : Entrées / Sorties à dates fixes

Organisme responsable

Data Value
SIRET : 81837224500014

Adresse

41 Rue de la Découverte
31670 - Labège

Téléphone fixe : 0972567567
Contacter l'organisme

Analyse de données en environnement Hadoop

Objectifs, programme, validation de la formation

Objectifs

Programme de la formation

Validation et sanction

Type de formation

Sortie

Métiers visés

Code Rome

Durée, rythme, financement

Modalités pédagogiques

Durée

Financeur(s)

Conditions d'accès

Public(s)

Modalités de recrutement et d'admission

Conditions spécifiques et prérequis

Modalités d'accès

Lieu de réalisation de l'action

Adresse

Contacts

Contact sur la formation

Contacter l'organisme formateur

Période prévisibles de déroulement des sessions

Adresse d'inscription

Organisme responsable

Adresse