Génération de séries temporelles, et apprentissage par renforcement

Orateur: Carl REMLINGER
Type: Thèse
Directeur: Romuald ÉLIE , Sophie LARUELLE
Site: Hors LAMA
Salle: EDF LABO - Paris Saclay - Salle 03FG31
Date de début: 19/05/2022 - 10:00
Date de fin: 19/05/2022 - 12:30

Nous développons dans cette thèse une modélisation robuste basée sur les données pour les marchés de l'énergie ou la consommation d'électricité. Nous nous concentrons d’abord sur la génération de séries temporelles réalistes avec des modèles d'apprentissage automatique. La simulation de scénarios crédibles est primordiale dans de nombreux domaines tels que la physique, la finance ou ici l'énergie. Capturer la dépendance temporelle est un élément clé pour ces générateurs mais reste un problème ouvert. Nous proposons de passer en revue les différentes solutions qui ont émergé depuis ces dernières années. Nous décrivons également les défis que la génération de séries temporelles soulève, comme la conception de métriques d'évaluation efficaces. Puis, nous présentons un modèle combinant une formulation par équation différentielle stochastique et une fonction objectif conditionnelle sur les distributions de probabilité à chaque pas de temps. Le générateur bénéficie de garanties théoriques sur l'erreur d'approximation et apprend mieux la structure temporelle que les méthodes de l'état-de-l'art. Une application aux marchés de l'énergie est proposée, nous guidant vers une nouvelle métrique d'évaluation opérationnelle pour évaluer la fidélité et l'utilité des séries temporelles synthétiques. Ensuite, nous cherchons à apprendre les décisions optimales pour une tâche donnée de manière flexible et robuste. Le développement de modèles à la fois optimaux et généraux sur des données inconnues est crucial dans de nombreuses applications, notamment celles du marché de l'énergie où les prix de l'électricité dépendent largement de phénomènes externes, comme la météo. Cependant, en pratique, ces modèles sont entravés par les changements de régime de l'environnement auxquels les décisions doivent s'adapter en conséquence. Nous mettons donc en évidence les relations étroites entre l'apprentissage par renforcement les problèmes classiques de l'économie et de la finance. Ensuite, nous proposons de répondre à la difficulté d'avoir à choisir entre plusieurs stratégies d'investissement, en utilisant l'agrégation en ligne d'experts en ligne. Dans le dernier chapitre, nous introduisons une méthode résolvant une famille d'équations différentielles partielles impliquées dans la couverture de risque avec un seul apprentissage, et capable de généraliser avec des modèles inconnus. Notre modèle apprend de multiples opérateurs de fonctions caractérisant le processus sous-jacent ou les options dans un problème de couverture de risque. Enfin, nous concluons cette thèse par une approche entièrement non supervisée et reposant sur les données pour la gestion des risques, de la génération de séries temporelles réalistes jusqu'à l'apprentissage d'une politique optimale. Des générations de prix de matières premières de plusieurs positions géographiques sont d'abord réalisées, conjointement avec des variables exogènes corrélées, telles que la date, la production renouvelable et la demande résiduelle. Ces données synthétiques sont ensuite utilisées pour entraîner un réseau d'opérateur profond dédié à la couverture des risques. Cela permet de répondre à certains problèmes classiques en finance, mais aussi d'aborder la transition énergétiques avec de nouveaux outils, complémentaires des approches probabilistes.