Responsables : Anca Muscholl et Nathanaël Fijalkow
Ce cours du S9 est obligatoire pour VL et en option pour AM. Il vaut 6ECTS.
Le cours est une introduction à la théorie des jeux pour la vérification et la synthèse de systèmes. On y aborde différents types de jeux : jeux à deux joueurs sur les graphes finis, jeux distribués, synthèse de contrôleurs.
Nous présentons différents aspects de l'apprentissage (machine learning en anglais). D'abord nous introduisons les notions importantes pour quantifier et formaliser les objectifs d'apprentissage supervisés : PAC (algorithmes probablement approximativement corrects), dimension VC, et complexité de Rademacher. Dans une deuxième partie nous étudions les fondements théoriques de l'apprentissage par récompense (reinforcement learning), autrement dit apprendre dans une situation de jeux. L'objectif est de présenter les idées derrière l'algorithme d'AlphaGo, le premier qui dépasse les humains au jeu de Go (2016).