DES RESSOURCES ET DES OUTILS AU SERVICE DES ACTEURS ET DES PROFESSIONNELS.

Text mining

Date de mise à jour : 21/12/2023 | Identifiant OffreInfo : 03_2205289F

Information fournie par :
Via Compétences (Carif-Oref Auvergne-Rhône-Alpes)

Objectifs, programme, validation de la formation

Objectifs

Découvrir comment décrire, comparer, classer, analyser des ensembles de textes.

Il peut s'agir de textes littéraires, scientifiques (bibliométrie, recherche documentaire), économiques, sociologiques (réponses aux questions ouvertes dans des enquêtes socio-économiques, entretiens divers en marketing, psychologie appliquée, pédagogie, médecine), de textes historiques, politiques…

Programme de la formation

- Introduction


  • Présentation de l'analyse statistique textuelle

  • Domaines d'application

  • Exemples d'utilisation

  • Présentation du logiciel de traitement

- Importation des données

  • Les diverses natures et sources de données textuelles utilisables

  • Procédures d'importation selon la nature des données

  • Exemples d'importation

- Codification : du texte brut au tableau statistique

  • Données textuelles et données contextuelles

  • Création du tableau lexical : la création des documents

  • Prétraitement des données textuelles (mise en forme, lemmatisation)

  • Dictionnaire des termes

- Analyse descriptive

  • Calcul de la fréquence de mots : identifier les termes ou concepts les plus récurrents

  • Bilan lexical par document, par variable de contexte

  • Table de dissimilarité entre documents ou entre modalités de variable contexte

  • Spécificités : termes sur- ou sous-représentés dans une modalité d'une variable de contexte

  • Co-occurrences : termes spécifiques des documents qui contiennent un terme donné.

  • Contexte dans lequel un mot est cité, permet d'éclairer le sens du texte

  • Nuage de mots (« word_cloud »)

- Analyse multidimensionnelle

  • Permet de révéler le sens profond des données textuelles et de synthétiser l'information contenue dans les données

  • Analyse factorielle des correspondances (examen multidimensionnel du lien des termes entre eux, avec les documents et avec les variables de contexte)

  • Classification ascendante hiérarchique des documents en groupes homogènes au regard des termes et des variables de contexte

- Traitement complet d'un exemple réel

Validation et sanction

Attestation de formation

Type de formation

Non certificiante

Sortie

Sans niveau spécifique

Métiers visés

Code Rome

Durée, rythme, financement

Modalités pédagogiques
Durée
21 heures en centre

Conventionnement : Non

Financeur(s)

Entreprise

Bénéficiaire de l'action

Conditions d'accès

Public(s)
Salarié, Tout public
Modalités de recrutement et d'admission

Niveau d'entrée : Sans niveau spécifique

Conditions spécifiques et prérequis

Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation statistique descriptive (exploratoire) : savoir décrire des observations ou d'avoir atteint par la pratique un niveau équivalent

Modalités d'accès

Lieu de réalisation de l'action

formation entièrement présentielle
Adresse
33 Rue de la République
69002 - Lyon 2e
Responsable : ASI
Téléphone fixe :
Contacter l'organisme

Contacts

Contact sur la formation
41 rue de la Découverte
CS 37621
31676 - Labège
Responsable :
Téléphone fixe : 0972567567
fax :
Site web :
Contacter l'organisme
Contacter l'organisme formateur
Data Value
SIRET: 81837224500014

Responsable : CALAS
Téléphone fixe : 0972567567
Site web :
Contacter l'organisme

Période prévisibles de déroulement des sessions

du 30/09/2024 au 02/10/2024
débutant le : 30/09/2024
Adresse d'inscription
41 rue de la Découverte
31676 - Labège
Etat du recrutement : Ouvert
Modalités : Entrées / Sorties à dates fixes

Organisme responsable

Data Value
SIRET : 81837224500014

Adresse
41 rue de la Découverte
CS 37621
31676 - Labège
Téléphone fixe : 0972567567
Contacter l'organisme