if-gsc [Master Informatique - Université de Bordeaux]

Outils pour utilisateurs

Outils du site


if-gsc

Ceci est une ancienne révision du document !


Game Synthesis & Control

Partie 1 (Anca Muscholl):

Todo

Partie 2 (Nathanaël Fijalkow):

Nous présentons différents aspects de l'apprentissage (machine learning en anglais). D'abord nous introduisons les notions importantes pour quantifier et formaliser les objectifs d'apprentissage supervisés : PAC (algorithmes probablement approximativement corrects), dimension VC, et complexité de Rademacher. Dans une deuxième partie nous étudions les fondements théoriques de l'apprentissage par récompense (reinforcement learning), autrement dit apprendre dans une situation de jeux. L'objectif est de présenter les idées derrière l'algorithme d'AlphaGo, le premier qui dépasse les humains au jeu de Go (2016).

if-gsc.1602078210.txt.gz · Dernière modification : 2020/10/07 13:43 de vpenelle