19 Août – Atelier Méthodes | Fouille de données textuelles avec des logiciels de lexicométrie

09 h30

ATELIER MÉTHODES

atelier méthodes 19 août 2021

BÉNÉDICTE GARNIER* (INED)

Fouille de données textuelles avec des logiciels de lexicométrie

Objectif : Explorer des textes avec des outils permettant de repérer automatiquement des structures, des spécificités, des thématiques (univers lexicaux). Interpréter, présenter et valoriser les résultats.

Description : La formation abordera les principes de la statistique textuelle et sa mise en œuvre sur des corpus de textes variés (discours, titres d'articles, résumés, réponses à une question ouverte, entretiens...)
Public : Toute personne souhaitant mettre en œuvre des techniques de text mining
Pré-requis : Installation des logiciels gratuits R, RStudio et IRaMuTeQ
Visionnage du séminaire Metsem ici 
Programme :

  • Développements de la statistique textuelle et ses outils : Retour sur le séminaire du Metsem : questions, réactions, évolutions …
  • Collecter des données textuelles non structurées et métadonnées associés ; et les préparer en corpus analysables avec les outils dédiés
  • Présentation générale des méthodes embarquées dans les outils de statistique textuelle
  • Répondre à sa problématique : Construire un lexique associé au corpus, lemmatiser, mobiliser des métadonnées
  • Interpréter les résultats : Occurrences, spécificités, similitudes, plans factoriels et arbres de classification et identifier des thématiques.
  • Sauvegarder ses résultats et analyses pour les réutiliser, les transmettre.
  • Logiciels utilisés : IRaMuTeQ (méthode Alceste), Scripts fournis en R pour utiliser le package R.temis en particulier dans Rstudio

 
Des logiciels à installer avant la formation ?
R version 4, RStudio et IRaMuTeQ
Biographie de l’intervenante : * Bénédicte Garnier est ingénieure au service méthodes statistiques de l’Ined. Elle dispense régulièrement des conseils en méthodologie et dans l'utilisation de logiciels de statistique textuelle et plus largement de l’analyse exploratoire.
Elle mobilise ces méthodes dans plusieurs projets de recherches auxquels elle collabore et intervient régulièrement dans des formations aux chercheur·ses ou doctorant·es sur le traitement et l'exploitation de données textuelles.
 

JEUDI 19 AOÛT 2021 

9·30-17·00

Sur inscription (v.le.hay@sciencespobordeaux.fr)

Localisation de l’événement