DES RESSOURCES ET DES OUTILS AU SERVICE DES ACTEURS ET DES PROFESSIONNELS.

Analyse de données en environnement Hadoop

Date de mise à jour : 08/01/2024 | Identifiant OffreInfo : 19_1803019534

Information fournie par :
Carif-Oref Occitanie

Objectifs, programme, validation de la formation

Objectifs

Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce
Savoir explorer HDFS et suivre l'exécution d'une application YARN
Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Programme de la formation

- Hadoop

  • Comprendre Hadoop 2.0 et son écosystème
  • Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?
  • Le Hadoop Distributed File System (HDFS)
  • Introduction aux données dans HDFS
  • MapReduce Framework et YARN

- Pig
  • Introduction à Pig
  • Programmation Pig avancée
  • Troubleshooting et optimisation avec Pig
  • Résolution des problèmes avec Pig
  • Utiliser l'UI Web d'Hadoop
  • Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web
  • Echantillonnage de données et débogage
  • Vue d'ensemble des performances
  • Comprendre le plan d'exécution
  • Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive
  • Programmation Hive
  • Utilisation de HCatalog
  • Programmation Hive avancée
  • Etendre Hive
  • Transformation de données avec des Scripts personnalisés
  • Fonctions définies par l'utilisateur
  • Paramétrer les requêtes
  • Exercices « Hands-On » : transformation de données avec Hive
  • Programmation Hive avancée (suite)
  • Analyse de données et statistiques

- Sqoop
  • Import/Export avec Sqoop (SGBDR HDFS)
  • Sqoop, fonctions avancées
  • Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)
  • Introduction à H-Base
  • Exemple d'ingestion de données avec l'ETL Talend
  • Créer son propre cluster Hadoop (plateforme de test)

Validation et sanction

Attestation de formation

Type de formation

Non certificiante

Sortie

Sans niveau spécifique

Métiers visés

Code Rome

Durée, rythme, financement

Modalités pédagogiques
Durée
21 heures en centre, 35 heures hebdomadaires

Conventionnement : Non

Financeur(s)

Autre

Conditions d'accès

Public(s)
Tout public
Modalités de recrutement et d'admission

Niveau d'entrée : Sans niveau spécifique

Conditions spécifiques et prérequis

Aucun

Modalités d'accès

Lieu de réalisation de l'action

formation entièrement présentielle
Adresse
41 rue de la Découverte
CS 37621
31676 - Labège
Responsable :
Téléphone fixe :
Contacter l'organisme

Contacts

Contact sur la formation
Responsable : Monsieur Cédric CALAS
Téléphone fixe : 09 72 56 75 67
fax :
Site web :
Contacter l'organisme
Contacter l'organisme formateur
Data Value
SIRET: 81837224500014
31676 Labège
Responsable :
Téléphone fixe : 0972567567
Site web :
Contacter l'organisme

Période prévisibles de déroulement des sessions

du 29/05/2024 au 31/05/2024
débutant le : 29/05/2024
Adresse d'inscription
41 rue de la Découverte
CS 37621
DATA VALUE
41 rue de la Decouverte
31676 - Labège
Etat du recrutement : Ouvert
Modalités : Entrées / Sorties à dates fixes

Organisme responsable

Data Value
SIRET : 81837224500014

Adresse
41 rue de la Découverte
CS 37621
DATA VALUE
41 rue de la Decouverte
31676 - Labège
Téléphone fixe : 0972567567
Contacter l'organisme