2025-11-23T02:40:16.760420

Dual-Regularized Riccati Recursions for Interior-Point Optimal Control

Sousa-Pinto, Orban

We derive closed-form extensions of Riccati's recursions (both sequential and parallel) for solving dual-regularized LQR problems. We show how these methods can be used to solve general constrained, non-convex, discrete-time optimal control problems via a regularized interior point method, while guaranteeing that each step is a descent direction of an Augmented Barrier-Lagrangian merit function. We provide MIT-licensed implementations of our methods in C++ and JAX.

academic

Récursions de Riccati à Double Régularisation pour la Commande Optimale par Points Intérieurs

Informations Fondamentales

ID de l'article : 2509.16370
Titre : Dual-Regularized Riccati Recursions for Interior-Point Optimal Control
Auteurs : João Sousa-Pinto, Dominique Orban
Classification : math.OC cs.MS cs.RO cs.SY eess.SY
Date de publication : 15 octobre 2025 (arXiv v2)
Lien de l'article : https://arxiv.org/abs/2509.16370

Résumé

Cet article dérive les extensions en forme fermée des récursions de Riccati pour résoudre les problèmes LQR à double régularisation (incluant les versions séquentielles et parallèles). Les auteurs démontrent comment utiliser ces méthodes pour résoudre des problèmes généraux de commande optimale discrète non-convexe avec contraintes, via une méthode de points intérieurs régularisée, en garantissant que chaque étape constitue une direction de descente pour la fonction de Lagrangien-barrière augmentée. L'article fournit des implémentations sous licence MIT en C++ et JAX.

Contexte et Motivation de la Recherche

Problème Fondamental

La recherche aborde le problème fondamental de la résolution efficace des problèmes de commande optimale discrète non-convexe avec contraintes d'égalité et d'inégalité. Les méthodes traditionnelles présentent les défis suivants :

Problèmes d'efficacité computationnelle : Les méthodes de points intérieurs standards nécessitent la résolution de systèmes linéaires de grande taille lors du traitement des problèmes de commande optimale, entraînant une complexité computationnelle élevée
Stabilité numérique : Lorsque les paramètres de régularisation tendent vers zéro, les méthodes traditionnelles peuvent présenter une instabilité numérique
Difficultés de parallélisation : Les méthodes existantes exploitent difficilement les ressources de calcul parallèle

Importance du Problème

Les problèmes de commande optimale trouvent des applications étendues en robotique, aérospatiale, conduite autonome et autres domaines. La résolution efficace de ces problèmes est cruciale pour les systèmes de commande en temps réel, particulièrement dans les scénarios nécessitant le traitement de contraintes complexes.

Limitations des Méthodes Existantes

Algorithme DDP : Bien que soit la méthode la plus couramment utilisée en pratique, en tant que méthode de tir simple, il ne peut pas initialiser indépendamment les trajectoires d'état
Méthodes LQR standards : Applicables uniquement aux systèmes linéaires sans contraintes ou avec contraintes simples
Méthodes de points intérieurs existantes : Des solveurs génériques comme IPOPT ne peuvent pas exploiter pleinement les caractéristiques structurelles des problèmes de commande optimale

Contributions Fondamentales

Contributions théoriques : Dérivation des extensions en forme fermée des récursions de Riccati pour résoudre les problèmes LQR à double régularisation, incluant les versions séquentielles et parallèles
Innovation algorithmique : Proposition d'une méthode de points intérieurs régularisée garantissant les directions de descente, utilisant la fonction de Lagrangien-barrière augmentée comme fonction de mérite
Stabilité numérique : Conception d'un algorithme numériquement stable lorsque le paramètre de régularisation δ→0, capable de récupérer l'algorithme LQR standard
Algorithme parallélisé : Implémentation d'un algorithme de résolution avec complexité temporelle parallèle O(log N) basé sur les balayages associatifs
Contributions logicielles : Fourniture d'implémentations open-source en C++ et JAX, supportant les opérations d'algèbre linéaire creuse efficaces

Détails de la Méthode

Définition du Problème

Considérons le problème de commande optimale discrète :

$\min_{x_0,u_0,\ldots,x_N} \sum_{i=0}^{N-1} f_i(x_i, u_i) + f_N(x_N)$

Sous les contraintes :

État initial : $x_0 = s_0$
Contraintes de dynamique : $x_{i+1} = d_i(x_i, u_i), \forall i \in \{0,\ldots,N-1\}$
Contraintes d'égalité : $c_i(x_i, u_i) = 0, \forall i \in \{0,\ldots,N-1\}$
Contraintes d'inégalité : $g_i(x_i, u_i) \leq 0, \forall i \in \{0,\ldots,N-1\}$
Contraintes terminales : $c_N(x_N) = 0, g_N(x_N) \leq 0$

undefined