Apprentissage séquentiel en observation partielle.

Vianney Perchet (ENS Cachan)
vendredi 1er avril 2011

Résumé : L’apprentissage est séquentiel lorsque les données arrivent "à la volée" et sont traitées les unes après les autres (par exemple pour donner une étiquette, prendre une décision, prédire la prochaine donnée, etc.) en vue d’optimiser un critère cumulé (comme minimiser le nombre d’erreurs, maximiser la moyenne de paiements, etc.). Les exemples types de ces modèles sont les problèmes d’allocations dynamiques de ressources ou d’envois de données dans un réseau ; cela dit, on montrera qu’ils peuvent également être pertinents en apprentissage statistique, notamment pour la classification. On présentera dans cet exposé un algorithme adapté à des données incomplètes, manquantes, bruitées — les observations sont dites partielles — et non-nécessairement stochastiques (ou "prédiction de suites individuelles"). L’utilisation de techniques d’estimation issues des bandits-manchots et de la théorie des jeux permettent d’obtenir, pour la première fois dans ce cadre général, une vitesse de convergence optimale.


Cet exposé se tiendra en salle C20-13, 20ème étage, Université Paris 1, Centre Pierre Mendès-France, 90 rue de Tolbiac, 75013 Paris (métro : Olympiades).


Agenda

<<

2017

>>

<<

Mai

>>

Aujourd'hui

LuMaMeJeVeSaDi
1234567
891011121314
15161718192021
22232425262728
2930311234

Annonces

ESANN 2016 : European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning


STATLEARN 2016


ICOR 2016