bandeauEGC2021

e-EGC > e-EGC - Programme

Lundi 25/01/2021

Fouille de données textuelles : mise en pratique en Python (niveau débutant)

Intervenants : Jérôme Azé (LIRMM) - Pascal Poncelet (LIRMM) 

Pré-requis : Python, Jupyter

Résumé : Les textes sont des données actuellement omniprésentes. L'objectif de cette journée est de découvrir de manière pratique et interactive comment manipuler ces données. 

La journée sera principalement consacrée à la classification supervisée. Après une présentation rapide de la théorie associée et des principales approches de classification, une mise en pratique immédiate à l'aide de la librairie Scikit-learn sera réalisée au travers de notebooks.

Nous aborderons ainsi les différentes questions essentielles :

  • quelles sont les étapes d'ingénierie de données à effectuer ?
  • comment utiliser un classifieur ?
  • comment évaluer les résultats de la classification ?
  • comment tester automatiquement plusieurs classifieurs ?
  • comment mettre en place une chaine automatique de traitement ?
  • comment déployer mon modèle ?

Un petit défi sera également proposé de manière à pouvoir comparer les propositions.

Par la suite, nous étudierons d'autres approches utiles pour travailler sur des textes. Nous verrons notamment comment enrichir des données, détecter automatiquement des topics, la notion de plongement de mots, etc.

Mardi 26/01/2021

Deep Learning : théorie et pratique (initiation)

Intervenants : Maximilien Servajean (LIRMM), Jérôme Pasquet (TETIS)

Pré-requis : Python

Résumé : Le Deep Learning s'est imposé depuis plusieurs années, notamment dans l'analyse des images mais également dans l'analyse des textes et autres données.

L'objectif de cette journée est de découvrir les bases du deep learning.

Cette journée sera rythmée par des notions théoriques simples et des notions pratiques.

Nous utiliserons l'outil Pytorch pour la partie pratique.

La matinée se concentrera sur la notion de différentiation automatique et d'optimisation au cœur des frameworks de deep learning.

L'après-midi abordera des problèmes de classification d'images et de transfers learning.

Encore une fois, la maîtrise du langage Python est souhaitée pour profiter de cette journée.

 

Capacité d'accueil : 50 participants

Personnes connectées : 1 Flux RSS