We derive closed-form extensions of Riccati's recursions (both sequential and parallel) for solving dual-regularized LQR problems. We show how these methods can be used to solve general constrained, non-convex, discrete-time optimal control problems via a regularized interior point method, while guaranteeing that each step is a descent direction of an Augmented Barrier-Lagrangian merit function. We provide MIT-licensed implementations of our methods in C++ and JAX.
Récursions de Riccati à Double Régularisation pour la Commande Optimale par Points Intérieurs
- ID de l'article : 2509.16370
- Titre : Dual-Regularized Riccati Recursions for Interior-Point Optimal Control
- Auteurs : João Sousa-Pinto, Dominique Orban
- Classification : math.OC cs.MS cs.RO cs.SY eess.SY
- Date de publication : 15 octobre 2025 (arXiv v2)
- Lien de l'article : https://arxiv.org/abs/2509.16370
Cet article dérive les extensions en forme fermée des récursions de Riccati pour résoudre les problèmes LQR à double régularisation (incluant les versions séquentielles et parallèles). Les auteurs démontrent comment utiliser ces méthodes pour résoudre des problèmes généraux de commande optimale discrète non-convexe avec contraintes, via une méthode de points intérieurs régularisée, en garantissant que chaque étape constitue une direction de descente pour la fonction de Lagrangien-barrière augmentée. L'article fournit des implémentations sous licence MIT en C++ et JAX.
La recherche aborde le problème fondamental de la résolution efficace des problèmes de commande optimale discrète non-convexe avec contraintes d'égalité et d'inégalité. Les méthodes traditionnelles présentent les défis suivants :
- Problèmes d'efficacité computationnelle : Les méthodes de points intérieurs standards nécessitent la résolution de systèmes linéaires de grande taille lors du traitement des problèmes de commande optimale, entraînant une complexité computationnelle élevée
- Stabilité numérique : Lorsque les paramètres de régularisation tendent vers zéro, les méthodes traditionnelles peuvent présenter une instabilité numérique
- Difficultés de parallélisation : Les méthodes existantes exploitent difficilement les ressources de calcul parallèle
Les problèmes de commande optimale trouvent des applications étendues en robotique, aérospatiale, conduite autonome et autres domaines. La résolution efficace de ces problèmes est cruciale pour les systèmes de commande en temps réel, particulièrement dans les scénarios nécessitant le traitement de contraintes complexes.
- Algorithme DDP : Bien que soit la méthode la plus couramment utilisée en pratique, en tant que méthode de tir simple, il ne peut pas initialiser indépendamment les trajectoires d'état
- Méthodes LQR standards : Applicables uniquement aux systèmes linéaires sans contraintes ou avec contraintes simples
- Méthodes de points intérieurs existantes : Des solveurs génériques comme IPOPT ne peuvent pas exploiter pleinement les caractéristiques structurelles des problèmes de commande optimale
- Contributions théoriques : Dérivation des extensions en forme fermée des récursions de Riccati pour résoudre les problèmes LQR à double régularisation, incluant les versions séquentielles et parallèles
- Innovation algorithmique : Proposition d'une méthode de points intérieurs régularisée garantissant les directions de descente, utilisant la fonction de Lagrangien-barrière augmentée comme fonction de mérite
- Stabilité numérique : Conception d'un algorithme numériquement stable lorsque le paramètre de régularisation δ→0, capable de récupérer l'algorithme LQR standard
- Algorithme parallélisé : Implémentation d'un algorithme de résolution avec complexité temporelle parallèle O(log N) basé sur les balayages associatifs
- Contributions logicielles : Fourniture d'implémentations open-source en C++ et JAX, supportant les opérations d'algèbre linéaire creuse efficaces
Considérons le problème de commande optimale discrète :
minx0,u0,…,xN∑i=0N−1fi(xi,ui)+fN(xN)
Sous les contraintes :
- État initial : x0=s0
- Contraintes de dynamique : xi+1=di(xi,ui),∀i∈{0,…,N−1}
- Contraintes d'égalité : ci(xi,ui)=0,∀i∈{0,…,N−1}
- Contraintes d'inégalité : gi(xi,ui)≤0,∀i∈{0,…,N−1}
- Contraintes terminales : cN(xN)=0,gN(xN)≤0
Définition de la fonction de Lagrangien-barrière :
L(x,s,y,z;μ)=f(x)−μ∑ilog(si)+yTc(x)+zT(g(x)+s)
Version augmentée :
A(x,s,y,z;μ,η)=L(x,s,y,z;μ)+2η(∥c(x)∥2+∥g(x)+s∥2)
Chaque itération nécessite la résolution du système linéaire :
undefined