DES RESSOURCES ET DES OUTILS AU SERVICE DES ACTEURS ET DES PROFESSIONNELS.

Pandas - Avancé

Date de mise à jour : 21/12/2023 | Identifiant OffreInfo : 03_231123370F

Information fournie par :
Via Compétences (Carif-Oref Auvergne-Rhône-Alpes)

Objectifs, programme, validation de la formation

Objectifs



Exploiter la librairie Pandas du langage Python pour traiter vos problématiques et projets en Data Science

Programme de la formation

Tour d'horizon de la librairie Pandas
Vous utilisez Pandas pour vos analyses de données ou vos projets de Data Science, mais vous n'en maîtrisez pas tous les aspects ? Ce tour d'horizon vous permettra d'identifier toutes les possibilités qu'offre cette librairie. Par un exercice guidé, vous pourrez revoir les notions de bases pour l'utilisation de Pandas, des notions de visualisation de données avec Matplotlib, Pandas et Seaborn


  • Rappels sur les notions de bases de Pandas

  • Lecture de fichiers de données (csv, excel, SQL, parquet)

  • Description du jeu de données et analyse statistique simple

  • Implémenter des analyses et des visualisations différentes en fonction du type de données

  • Gestion des données manquantes

  • Manipulation de dates pour les Time Series

  • Gestion des chaînes de caractères

  • Mise en place des bonnes pratiques en Data Science
Maîtriser les subtilités des groupbys
Les groupbys peuvent vous permettre de mieux appréhender les modalités dans votre jeu de données.

  • Groupby à simple indice avec les fonctions d'agrégations classiques

  • Personnalisation des fonctions d'agrégations

  • Groupby à multiples indices

  • Différence entre les fonctions apply et transform

  • Rappels sur les fonctions anonymes
Tables pivots et tableaux croisés
Vous verrez par le biais de nombreux exemples et exercices, l‘intérêt des tables pivots et des tableaux croisés pour une représentation différente des jeux de données.

  • Fonctions d'agrégation et tables pivots

  • Matrice de contingence

  • Tableaux croisés
Jointure de tables
Pour joindre des tables, il est possible de procéder par indice ou par colonne.

  • Notions d'axes

  • Concaténation

  • Merge selon une ou plusieurs clés

  • Jointure par rapport aux indices
Atelier de mise en pratique sur une journée

Toutes les notions vues précédemment seront mises en pratique lors d'une journée de travaux pratiques sur un problème d'analyse de données complet mettant en œuvre les bonnes pratiques à utiliser en Data Science.

Accélération du calcul avec Pandas
Vous verrez quelles sont les librairies qui vous permettent de faire du multiprocessing avec Pandas

  • Boucler sur les lignes et les colonnes

  • Revenir aux basiques avec NumPy

  • Exemples avec la librairie Modin

  • Exemples avec la librairie Numba

Validation et sanction

Attestation de formation

Type de formation

Non certificiante

Sortie

Sans niveau spécifique

Métiers visés

Code Rome

Durée, rythme, financement

Modalités pédagogiques
Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel Python.
Durée
21 heures en centre

Conventionnement : Non

Financeur(s)

Entreprise

Bénéficiaire de l'action

Conditions d'accès

Public(s)
Salarié, Tout public
Modalités de recrutement et d'admission

Niveau d'entrée : Sans niveau spécifique

Conditions spécifiques et prérequis

Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation Python – Bases et introduction aux librairies scientifiques ou d'avoir atteint par la pratique un niveau équivalent

Modalités d'accès

Lieu de réalisation de l'action

formation entièrement présentielle
Adresse
33 Rue de la République
69002 - Lyon 2e
Responsable : ASI
Téléphone fixe :
Contacter l'organisme

Contacts

Contact sur la formation
41 rue de la Découverte
CS 37621
31676 - Labège
Responsable :
Téléphone fixe : 0972567567
fax :
Site web :
Contacter l'organisme
Contacter l'organisme formateur
Data Value
SIRET: 81837224500014

Responsable : CALAS
Téléphone fixe : 0972567567
Site web :
Contacter l'organisme

Période prévisibles de déroulement des sessions

du 21/10/2024 au 23/10/2024
débutant le : 21/10/2024
Adresse d'inscription
41 rue de la Découverte
31676 - Labège
Etat du recrutement : Ouvert
Modalités : Entrées / Sorties à dates fixes

Organisme responsable

Data Value
SIRET : 81837224500014

Adresse
41 rue de la Découverte
CS 37621
31676 - Labège
Téléphone fixe : 0972567567
Contacter l'organisme