Mean field games : numerical methods and case of risk-averse agents - Centre de mathématiques appliquées (CMAP) Accéder directement au contenu
Thèse Année : 2021

Mean field games : numerical methods and case of risk-averse agents

Jeux à champ moyen : méthodes numériques et cas d'agents averses au risque

Résumé

Mean field games (abbreviated MFGs) are both a mathematical theory and a modeling tool. Developed in 2006 independently by Jean-Michel Lasry and Pierre-Louis Lions and Minyi Huang, Roland P. Malhamé, and Peter E. Caines, MFGs provide a framework to analyze interactions among a large number of rational and anonymous agents.In this thesis we provide several developments to this theory:1) Using the concept of composite risk measure, we study a discrete-time MFG model involving risk-averse agents. We show the existence of a solution via a fixed point approach. We show that an optimal policy of the MFG is ε(N)-optimal for a certain N-player game. The sequence ε(N) converges to zero as the number of players tends to infinity.2) We study discrete time and finite state space potential (also called variational) MFGs with hard constraints, that is with convex potentials, possibly non-differentiable and with bounded domain. We study a primal and a dual problem, and we show: a duality result, the existence and uniqueness (in the differentiable case) of a solution to the MFG system.Then we implement two families of numerical methods: primal-dual proximal methods (Chambolle-Pock and Chambolle-Pock-Bregman) and augmented Lagrangian based methods (ADMM and ADM-G).We propose a congestion model and a price model that we solve with these methods. We compare the empirical performance of each method for each problem.3) We apply the generalized conditional gradient algorithm for potential MFGs in a PDE framework. We highlight the connection between this algorithm and a learning method called fictitious play algorithm.We show that for the learning rate δ_k = 2/(k + 2),the potential cost converges in O(1/k); the exploitability the variables of the problem converge in O(1/k^1/2), for specific norms.
Les jeux à champ moyen (abrégés MFG) sont à la fois une théorie mathématique et un outil de modélisation. Développés indépendamment en 2006 par Jean-Michel Lasry et Pierre-Louis Lions, et Minyi Huang, Roland P. Malhamé, et Peter E. Caines, les MFG offrent un cadre particulièrement adapté pour analyser les interactions stratégiques entre un grand nombre de joueurs rationnels et anonymes.Dans cette thèse, nous proposons plusieurs développements à cette théorie :1) En utilisant le concept de mesure de risque composite, nous étudions un modèle MFG en temps discret impliquant des agents averses au risque. Nous montrons l'existence d'une solution via une approche de point fixe. Nous montrons qu'une politique optimale du MFG est ε(N)-optimale pour un certain jeu à N joueurs. La suite ε(N) converge vers zéro lorsque le nombre de joueurs tend vers l'infini.2) Nous étudions des MFG potentiels (aussi appelés variationnels) en espace de temps discret et en espace d'état fini avec des contraintes dures, c'est-à-dire avec des potentiels convexes, éventuellement non différentiables et à domaine borné. Nous étudions un problème primal et un problème dual, et nous montrons : un résultat de dualité, l'existence et l'unicité (dans le cas différentiable) d'une solution au système MFG.Ensuite, nous implémentons deux familles de méthodes numériques : des méthodes proximales primales-duales (Chambolle-Pock et Chambolle-Pock-Bregman) et des méthodes de Lagrangien augmenté (ADMM et ADM-G).Nous proposons un modèle de congestion et un modèle de prix que nous résolvons avec ces méthodes. Nous comparons les performances empiriques de chacune des méthodes pour chaque problème.3) Nous appliquons l'algorithme du gradient conditionnel généralisé pour les MFG potentiels, dans un cadre EDP. Nous mettons en évidence le lien entre cet algorithme et une méthode d'apprentissage appelée fictitious play.On montre que pour le taux d'apprentissage δ_k = 2/(k + 2),le coût potentiel converge en O(1/k); l'exploitabilité et les variables du problème convergent en O(1/k^1/2), pour des normes spécifiques.
Fichier principal
Vignette du fichier
101921_LAVIGNE_2021_archivage2.pdf (3.59 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03556749 , version 1 (04-02-2022)

Identifiants

  • HAL Id : tel-03556749 , version 1

Citer

Pierre Lavigne. Mean field games : numerical methods and case of risk-averse agents. Optimization and Control [math.OC]. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAX094⟩. ⟨tel-03556749⟩
188 Consultations
167 Téléchargements

Partager

Gmail Facebook X LinkedIn More