06_1701970F_1759032S https://www.formation.gref-bretagne.com/formation/41787 Ingénierie de la fouille et de la visualisation de données massives - RCP216 CNAM DE BRETAGNE

Ingénierie de la fouille et de la visualisation de données massives - RCP216

Date de mise à jour : 06/08/2025 | Identifiant OffreInfo : 06_1701970F
Organisme responsable : CNAM DE BRETAGNE

Objectifs

Cet enseignement s'intéresse à l'impact des caractéristiques des données massives (volume, variété, vélocité) sur les méthodes de fouille de données. Sont examinées les approches actuelles qui permettent de faire passer à l'échelle les méthodes de fouille, en insistant sur les spécificités des opérations de fouille en environnement distribué. Les caractéristiques mentionnées sont ensuite considérées de façon plus spécifique pour certains problèmes fréquents dans le traitement des données massives. Sont ainsi abordés les systèmes de recommandation et la recherche efficace par similarité, la classification automatique et l'apprentissage supervisé sur une plate-forme distribuée, les opérations spécifiques au traitement des données textuelles souvent hétérogènes, les implications de la vélocité sur la fouille de flux de données, l'analyse de grands graphes et de réseaux sociaux. L'UE s'intéresse ensuite au rôle de la visualisation et de l'interaction, non seulement dans la présentation des résultats, mais aussi dans les opérations de fouille de données.

Programme de la formation

1. Introduction : applications, typologie des données, typologie des problèmes

2. Approches : réduction de la complexité, distribution

3. Passage à l'échelle de quelques problèmes fréquents a. Recherche par similarité, systèmes de recommandation b. Classification automatique c. Fouille de données textuelles d. Fouille de flux de données e. Apprentissage supervisé à large échelle f. Fouille et visualisation de graphes et réseaux sociaux

4. Visualisation d'information : historique, applications, outils

5. Aspects éthiques dans la fouille de données. Le cours est complété par des travaux pratiques (TP) permettant de mettre en pratique des techniques présentées. Pour la partie fouille de données, les TP seront réalisés à l'aide de Apache Spark. Pour le travail sur le projet les auditeurs peuvent utiliser le JupyterHub du Cnam.

Validation et sanction

Attestation de formation

Type de formation

Non certifiante

Sortie

Sans niveau spécifique

Contact de la formation

2 Rue Camille Guérin
22440 - Ploufragan
Téléphone fixe : 0972311312
Site web : http://www.cnam-bretagne.fr

Contact de l'organisme formateur

Conservatoire national des arts et métiers - centre régional de Bretagne
SIRET : 43411361900119
22440 Ploufragan
Responsable : Madame Emeline JAHIER
Téléphone fixe : 0972311312
Contacter l'organisme

Information fournie par :