|
|
Nous avons le plaisir d'avoir comme orateurs invités, et qui ont accepté, les cinq personnes ci-dessous (liste alphabétique).
Position actuelle : Professeur, MAP5 (UMR CNRS 8145), Université de Paris
Page web : http://helios.mi.parisdescartes.fr/~chambaz/
Présentation : Targeted Machine Learning: how we can use machine learning for causal inference
Résumé: Coined by Mark van der Laan and Dan Rubin in 2006, targeted learning is a general approach to learning from data that reconciles machine learning and statistical inference. On the one hand, ``machine learning'' refers to the estimation of infinite-dimensional features of the law of the data, P, for instance a regression function. Machine learning algorithms are versatile, and produce (possibly highly) data-adaptive estimators. Driven by the need to make accurate predictions, they do not care so much about the assessment of prediction uncertainty. On the other hand, ``statistical inference'' refers to the estimation of finite-dimensional parameters of P, for instance a measure of association with a causal interpretation. It focuses on the construction of confidence regions or the development of hypotheses tests. Emphasis is placed on robustness (guaranteeing that one goes to the truth even under mild and reasonable assumptions on P), efficiency (trying to draw as much information from the data as possible), and controlling the asymptotic levels or type I errors. Targeted learning has been applied and studied in a great variety of contexts. Its analysis is framed in the theory of inference based on semiparametric models. We will illustrate how targeted learning unfolds in examples from causal analysis.
Position actuelle : Professor, Statistics Department, John Henry Samter Fellow in Undergraduate Education,
Page web : http://www-stat.stanford.edu/~susan/
Présentation : Integrating trees and networks into reproducible data analytic workflows.
Résumé: Biomedical data often contain information from different sources or sources.
Interaction networks and phylogenetic trees are omnipresent in biomedical and genomic data
and their integration into longitudinal multivariate analyses can be challenging.
As examples, I will show how our group has developed software (phyloseq, structSSII and adaptivegPCA)
that can incorporate phylogenetic trees into count abundance data
and modulate the influence of the tree using tree-based regularization and testing.
Position actuelle : Directeur de recherche à l'Inria, directeur scientifique et technique de Pl@ntNet
Page web : http://www-sop.inria.fr/members/Alexis.Joly/wiki/pmwiki.php
Présentation : Pl@ntNet, la science des données au service de la biodiversité végétale
Résumé: Pl@ntNet est une plateforme participative de collecte de données botaniques dont l’originalité est de reposer sur des technologies d’intelligence artificielle pour aider les contributeurs à identifier les plantes avec leur smartphone. Pl@ntNet a été conçu à l'origine comme un instrument scientifique de surveillance de la biodiversité végétale mais son impact sociétal va désormais bien au-delà de ce seul objectif avec plus de 10 millions de personnes l'utilisant partout dans le monde dont des centaines de milliers d'agriculteurs et de gestionnaires d'espaces naturels. Pour atteindre cet objectif, l'équipe Pl@ntNet a dû relevé un grand nombre de défis dans le domaine de la science des données et continue aujourd’hui encore à jouer un rôle majeur sur les problématiques liées aux données de biodiversité. Dans cette présentation, nous dresserons un panorama des approches algorithmiques et méthodologiques mises en oeuvre dans la plateforme et nous focaliserons ensuite sur les derniers travaux de recherche en cours, à la croisée de l’IA et de l’écologie.
Marie-Jeanne Lesot (explicabilité)
Position actuelle : maître de conférences, Sorbonne Université, LIP6
Page web : https://webia.lip6.fr/~lesot/publications.html
Présentation : Explications de données et de classifieurs : quelques méthodes et risques notables
Résumé: Au delà de la question de la performance des méthodes d'apprentissage automatique, il est devenu crucial d'augmenter la lisibilité des résultats obtenus, pour permettre aux utilisateurs de les comprendre et d'interpréter. Ces problématiques sont regroupées sous le terme "eXplainable Artificial Intelligence" (XAI). Au sein de ce vaste domaine, cet exposé aborde deux niveaux : le premier porte sur la compréhension des données elles-mêmes, dans un cadre d'analyse exploratoire et de description intelligible. L'objectif est de permettre à un utilisateur de comprendre le contenu des données en les résumant par le biais de formulations linguistiques, ce qui soulève en particulier les problèmes de choix des mots et de cohérence des résumés.
Le second niveau considéré est celui de tâches de classification, dans le cadre classique de l'interprétation locale, post-hoc et agnostique de la prédiction d'une classe pour une donnée. Les questions soulevées sont celles des risques liés à la définition de la localité et à la génération d'explications non justifiées.
Position actuelle : Senior research scientist, Idiap Research Institute (Switzerland)
Page web : https://www.idiap.ch/~marcel
Présentation : "Deep Convolutional Neural Networks: from recognition to anti-spoofing"
Résumé:
In biometrics, Presentation Attacks (PA also referred to as spoofing) are performed by falsifying the biometric trait and then presenting this falsified information to the biometric system, one such example is to fool a fingerprint system by copying the fingerprint of another person and creating an artificial or gummy finger which can then be presented to the biometric system to falsely gain access. This is an issue that needs to be addressed because it has recently been shown that conventional biometric techniques are vulnerable to presentation attacks. One of the main challenges in Presentation Attack Detection (PAD also referred to as anti-spoofing) is to find a set of features and models (mostly classifiers) that allows systems to effectively distinguish signals that were directly emitted by a human from those reproduced by an attacker. This talk will focus on the use of Deep Convolutional Neural Networks (DCNNs) in face recognition and face PAD.
Personnes connectées : 10 | Flux RSS | Vie privée |