DES RESSOURCES ET DES OUTILS AU SERVICE DES ACTEURS ET DES PROFESSIONNELS.

Analyse de données en environnement Hadoop

Date de mise à jour : 20/12/2023 | Identifiant OffreInfo : 03_2100653F

Information fournie par :
Via Compétences (Carif-Oref Auvergne-Rhône-Alpes)

Objectifs, programme, validation de la formation

Objectifs


  • Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce

  • Savoir explorer HDFS et suivre l'exécution d'une application YARN

  • Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Programme de la formation

- Hadoop


  • Comprendre Hadoop 2.0 et son écosystème

  • Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?

  • Le Hadoop Distributed File System (HDFS)

  • Introduction aux données dans HDFS

  • MapReduce Framework et YARN

- Pig

  • Introduction à Pig

  • Programmation Pig avancée

  • Troubles hooting et optimisation avec Pig

  • Résolution des problèmes avec Pig

  • Utiliser l'UI Web d'Hadoop

  • Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web

  • Échantillonnage de données et débogage

  • Vue d'ensemble des performances

  • Comprendre le plan d'exécution

  • Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

  • Programmation Hive

  • Utilisation de HCatalog

  • Programmation Hive avancée

  • Étendre Hive

  • Transformation de données avec des Scripts personnalisés

  • Fonctions définies par l'utilisateur

  • Paramétrer les requêtes

  • Exercices « Hands-On » : transformation de données avec Hive

  • Programmation Hive avancée (suite)

  • Analyse de données et statistiques

- Sqoop

  • Import/Export avec Sqoop (SGBDR HDFS)

  • Sqoop, fonctions avancées

  • Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

  • Introduction à H-Base

  • Exemple d'ingestion de données avec l'ETL Talend

  • Créer son propre cluster Hadoop (plateforme de test).

Validation et sanction

Attestation de formation

Type de formation

Non certificiante

Sortie

Sans niveau spécifique

Métiers visés

Code Rome

Durée, rythme, financement

Modalités pédagogiques
Durée
21 heures en centre

Conventionnement : Non

Financeur(s)

Bénéficiaire de l'action

Entreprise

Conditions d'accès

Public(s)
Salarié, Tout public
Modalités de recrutement et d'admission

Niveau d'entrée : Sans niveau spécifique

Conditions spécifiques et prérequis

-

Modalités d'accès

Lieu de réalisation de l'action

formation entièrement présentielle
Adresse
33 Rue de la République
69002 - Lyon 2e
Responsable : ASI
Téléphone fixe :
Contacter l'organisme

Contacts

Contact sur la formation
41 rue de la Découverte
CS 37621
31676 - Labège
Responsable :
Téléphone fixe : 0972567567
fax :
Site web :
Contacter l'organisme
Contacter l'organisme formateur
Data Value
SIRET: 81837224500014

Responsable : CALAS
Téléphone fixe : 0972567567
Site web :
Contacter l'organisme

Période prévisibles de déroulement des sessions

du 13/05/2024 au 15/05/2024
débutant le : 13/05/2024
Adresse d'inscription
41 rue de la Découverte
31676 - Labège
Etat du recrutement : Ouvert
Modalités : Entrées / Sorties à dates fixes

Organisme responsable

Data Value
SIRET : 81837224500014

Adresse
41 rue de la Découverte
CS 37621
31676 - Labège
Téléphone fixe : 0972567567
Contacter l'organisme