We derive closed-form extensions of Riccati's recursions (both sequential and parallel) for solving dual-regularized LQR problems. We show how these methods can be used to solve general constrained, non-convex, discrete-time optimal control problems via a regularized interior point method, while guaranteeing that each step is a descent direction of an Augmented Barrier-Lagrangian merit function. We provide MIT-licensed implementations of our methods in C++ and JAX.
- ID del Artículo: 2509.16370
- Título: Dual-Regularized Riccati Recursions for Interior-Point Optimal Control
- Autores: João Sousa-Pinto, Dominique Orban
- Clasificación: math.OC cs.MS cs.RO cs.SY eess.SY
- Fecha de Publicación: 15 de octubre de 2025 (arXiv v2)
- Enlace del Artículo: https://arxiv.org/abs/2509.16370
Este artículo deriva extensiones de forma cerrada de las recursiones de Riccati para resolver problemas LQR dualmente regularizados (incluyendo versiones secuencial y paralela). Los autores demuestran cómo utilizar estos métodos mediante métodos de punto interior regularizados para resolver problemas generales de control óptimo discreto en tiempo, no convexos y con restricciones, garantizando que cada paso sea una dirección de descenso de la función de barrera-Lagrangiano aumentada. El artículo proporciona implementaciones con licencia MIT en C++ y JAX.
La investigación aborda el problema central de cómo resolver eficientemente problemas de control óptimo discreto en tiempo, no convexos, con restricciones de igualdad y desigualdad. Los métodos tradicionales enfrentan los siguientes desafíos:
- Problemas de Eficiencia Computacional: Los métodos de punto interior estándar requieren resolver sistemas lineales de gran escala al tratar problemas de control óptimo, con alta complejidad computacional
- Estabilidad Numérica: Cuando los parámetros de regularización tienden a cero, los métodos tradicionales pueden presentar inestabilidad numérica
- Dificultades de Paralelización: Los métodos existentes tienen dificultades para aprovechar plenamente los recursos de computación paralela
Los problemas de control óptimo tienen aplicaciones amplias en robótica, aeronáutica, conducción autónoma y otros campos. Resolver eficientemente estos problemas es crucial para sistemas de control en tiempo real, especialmente en escenarios que requieren manejar restricciones complejas.
- Algoritmo DDP: Aunque es el método más utilizado en la práctica, como método de disparo único, no puede inicializar independientemente trayectorias de estado
- Métodos LQR Estándar: Solo aplicables a sistemas lineales sin restricciones o con restricciones simples
- Métodos de Punto Interior Existentes: Solucionadores de propósito general como IPOPT no pueden aprovechar plenamente las características estructurales de los problemas de control óptimo
- Contribución Teórica: Derivación de extensiones de forma cerrada de recursiones de Riccati para resolver problemas LQR dualmente regularizados, incluyendo versiones secuencial y paralela
- Innovación Algorítmica: Propuesta de método de punto interior regularizado que garantiza dirección de descenso, utilizando la función de barrera-Lagrangiano aumentada como función de mérito
- Estabilidad Numérica: Diseño de algoritmo numéricamente estable cuando el parámetro de regularización δ→0, capaz de recuperar el algoritmo LQR estándar
- Algoritmo Paralelizado: Implementación de algoritmo de resolución con complejidad de tiempo paralelo O(log N) basado en escaneos asociativos
- Contribución de Software: Proporciona implementación de código abierto en C++ y JAX, soportando operaciones eficientes de álgebra lineal dispersa
Considere el problema de control óptimo discreto en tiempo:
minx0,u0,…,xN∑i=0N−1fi(xi,ui)+fN(xN)
Restricciones:
- Estado inicial: x0=s0
- Restricciones de dinámica: xi+1=di(xi,ui),∀i∈{0,…,N−1}
- Restricciones de igualdad: ci(xi,ui)=0,∀i∈{0,…,N−1}
- Restricciones de desigualdad: gi(xi,ui)≤0,∀i∈{0,…,N−1}
- Restricciones terminales: cN(xN)=0,gN(xN)≤0
Defina la función de barrera-Lagrangiano:
L(x,s,y,z;μ)=f(x)−μ∑ilog(si)+yTc(x)+zT(g(x)+s)
Versión aumentada:
A(x,s,y,z;μ,η)=L(x,s,y,z;μ)+2η(∥c(x)∥2+∥g(x)+s∥2)
Cada iteración requiere resolver el sistema lineal:
undefined