Sujets de stage
Je recherche deux stagiaires, en sortie de M2 Recherche, informatique théorique ou mathématiques, pour travailler sur :
Stage 1 : Q-learning et processus de décision Markoviens.
Il est très courant de modéliser le comportement d’un système dans un contexte « adversarial » : on va regarder comment le système évolue face à un adversaire. On retrouve cette idée en économie des ressources (meilleure stratégie de pêche en mer avec la météo comme adversaire), en économie (meilleure stratégie de placement en bourse avec le marché comme adversaire), sur le web (spammeurs contre moteurs de recherche), dans les jeux, etc.
Les processus de décision Markovien sont un outil de modélisation classique dans ce contexte, et il existe de nombreux algorithmes d’analyse. Ce stage a pour but de tester la validité d’une approche mêlant Q-learning et schémas d’approximation randomisés totalement probabilistes pour trouver des stratégies quasi-optimales au sein d’un processus de décision Markovien.
Le candidat doit avoir :
– un bon niveau en informatique fondamentale
– un bon niveau en programmation (langage au choix, mais C/C++ sont un plus)
Stage 2 : Modélisation probabiliste et environnement incertain.
Les systèmes non déterministes probabilistes sont intensivement utilisés pour modéliser des systèmes évoluant dans un environnement incertain (protocoles de communications subissant des attaques, programmes, équilibres économiques, jeux à information incomplète, etc.).
Le but de ce stage est de faire progresser la connaissance sur les méthodes d’analyse de ces systèmes. Il peut être orienté de différentes manières : design d’algorithmes pour résoudre des problèmes concernant ces systèmes, mise au point de méthode de vérification ou encore mise en place de nouvelles formalisations permettant une étude différente des propriétés de ces systèmes.
Le candidat doit avoir :
– un bon niveau en informatique fondamentale
– un bon niveau en mathématiques
– des connaissances en programmation en C/C++