03_2100653F_2474436S https://www.coteformations.fr/je-recherche/une-formation/recherche/1062815 Analyse de données en environnement Hadoop Data Value

Analyse de données en environnement Hadoop

Date de mise à jour : 31/10/2025 | Identifiant OffreInfo : 03_2100653F
Organisme responsable : Data Value

Objectifs

Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce

Savoir explorer HDFS et suivre l'exécution d'une application YARN

Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Programme de la formation

- Hadoop


  • Comprendre Hadoop 2.0 et son écosystème

  • Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?

  • Le Hadoop Distributed File System (HDFS)

  • Introduction aux données dans HDFS

  • MapReduce Framework et YARN

- Pig

  • Introduction à Pig

  • Programmation Pig avancée

  • Troubles hooting et optimisation avec Pig

  • Résolution des problèmes avec Pig

  • Utiliser l'UI Web d'Hadoop

  • Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web

  • Échantillonnage de données et débogage

  • Vue d'ensemble des performances

  • Comprendre le plan d'exécution

  • Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

  • Programmation Hive

  • Utilisation de HCatalog

  • Programmation Hive avancée

  • Étendre Hive

  • Transformation de données avec des Scripts personnalisés

  • Fonctions définies par l'utilisateur

  • Paramétrer les requêtes

  • Exercices « Hands-On » : transformation de données avec Hive

  • Programmation Hive avancée (suite)

  • Analyse de données et statistiques

- Sqoop

  • Import/Export avec Sqoop (SGBDR HDFS)

  • Sqoop, fonctions avancées

  • Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

  • Introduction à H-Base

  • Exemple d'ingestion de données avec l'ETL Talend

  • Créer son propre cluster Hadoop (plateforme de test).

Validation et sanction

- Comprendre ce que sont Hadoop et YARN

- Connaître les différents outils et les Framework dans un environnement Hadoop

- Appréhender MapReduce

- Comprendre comment exécuter une tâche de MapReduce sur YARN

- Exécuter des modifications en masse avec PIG

- Savoir écrire des requêtes pour HIVE afin d'analyser ses données

- Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle

- Découverte d'autres briques : automatiser vos process avec Oozie

- Utiliser une base de données No-SQL (HBase)

Type de formation

Non certifiante

Sortie

Sans niveau spécifique

Contact de la formation

41 Rue de la Découverte
31670 - Labège
Téléphone fixe : 0972567567
Contacter l'organisme

Contact de l'organisme formateur

Data Value
SIRET : 81837224500014
31670 Labège
Responsable : Monsieur Cédric CALAS
Téléphone fixe : 0972567567
Contacter l'organisme

Information fournie par :