Master Informatique - Université de Bordeaux

Ceci est une ancienne révision du document !

Game Synthesis & Control

Responsables : Anca Muscholl et Nathanaël Fijalkow

Partie 1 (Anca Muscholl):

Todo

Partie 2 (Nathanaël Fijalkow):

Nous présentons différents aspects de l'apprentissage (machine learning en anglais). D'abord nous introduisons les notions importantes pour quantifier et formaliser les objectifs d'apprentissage supervisés : PAC (algorithmes probablement approximativement corrects), dimension VC, et complexité de Rademacher. Dans une deuxième partie nous étudions les fondements théoriques de l'apprentissage par récompense (reinforcement learning), autrement dit apprendre dans une situation de jeux. L'objectif est de présenter les idées derrière l'algorithme d'AlphaGo, le premier qui dépasse les humains au jeu de Go (2016).

Master Informatique - Université de Bordeaux

Outils pour utilisateurs

Outils du site

Game Synthesis & Control

Partie 1 (Anca Muscholl):

Partie 2 (Nathanaël Fijalkow):

Outils de la page