2025-11-23T02:40:16.760420

Dual-Regularized Riccati Recursions for Interior-Point Optimal Control

Sousa-Pinto, Orban
We derive closed-form extensions of Riccati's recursions (both sequential and parallel) for solving dual-regularized LQR problems. We show how these methods can be used to solve general constrained, non-convex, discrete-time optimal control problems via a regularized interior point method, while guaranteeing that each step is a descent direction of an Augmented Barrier-Lagrangian merit function. We provide MIT-licensed implementations of our methods in C++ and JAX.
academic

Recursiones de Riccati Dualmente Regularizadas para Control Óptimo de Punto Interior

Información Básica

  • ID del Artículo: 2509.16370
  • Título: Dual-Regularized Riccati Recursions for Interior-Point Optimal Control
  • Autores: João Sousa-Pinto, Dominique Orban
  • Clasificación: math.OC cs.MS cs.RO cs.SY eess.SY
  • Fecha de Publicación: 15 de octubre de 2025 (arXiv v2)
  • Enlace del Artículo: https://arxiv.org/abs/2509.16370

Resumen

Este artículo deriva extensiones de forma cerrada de las recursiones de Riccati para resolver problemas LQR dualmente regularizados (incluyendo versiones secuencial y paralela). Los autores demuestran cómo utilizar estos métodos mediante métodos de punto interior regularizados para resolver problemas generales de control óptimo discreto en tiempo, no convexos y con restricciones, garantizando que cada paso sea una dirección de descenso de la función de barrera-Lagrangiano aumentada. El artículo proporciona implementaciones con licencia MIT en C++ y JAX.

Antecedentes de Investigación y Motivación

Problema Central

La investigación aborda el problema central de cómo resolver eficientemente problemas de control óptimo discreto en tiempo, no convexos, con restricciones de igualdad y desigualdad. Los métodos tradicionales enfrentan los siguientes desafíos:

  1. Problemas de Eficiencia Computacional: Los métodos de punto interior estándar requieren resolver sistemas lineales de gran escala al tratar problemas de control óptimo, con alta complejidad computacional
  2. Estabilidad Numérica: Cuando los parámetros de regularización tienden a cero, los métodos tradicionales pueden presentar inestabilidad numérica
  3. Dificultades de Paralelización: Los métodos existentes tienen dificultades para aprovechar plenamente los recursos de computación paralela

Importancia del Problema

Los problemas de control óptimo tienen aplicaciones amplias en robótica, aeronáutica, conducción autónoma y otros campos. Resolver eficientemente estos problemas es crucial para sistemas de control en tiempo real, especialmente en escenarios que requieren manejar restricciones complejas.

Limitaciones de Métodos Existentes

  1. Algoritmo DDP: Aunque es el método más utilizado en la práctica, como método de disparo único, no puede inicializar independientemente trayectorias de estado
  2. Métodos LQR Estándar: Solo aplicables a sistemas lineales sin restricciones o con restricciones simples
  3. Métodos de Punto Interior Existentes: Solucionadores de propósito general como IPOPT no pueden aprovechar plenamente las características estructurales de los problemas de control óptimo

Contribuciones Principales

  1. Contribución Teórica: Derivación de extensiones de forma cerrada de recursiones de Riccati para resolver problemas LQR dualmente regularizados, incluyendo versiones secuencial y paralela
  2. Innovación Algorítmica: Propuesta de método de punto interior regularizado que garantiza dirección de descenso, utilizando la función de barrera-Lagrangiano aumentada como función de mérito
  3. Estabilidad Numérica: Diseño de algoritmo numéricamente estable cuando el parámetro de regularización δ→0, capaz de recuperar el algoritmo LQR estándar
  4. Algoritmo Paralelizado: Implementación de algoritmo de resolución con complejidad de tiempo paralelo O(log N) basado en escaneos asociativos
  5. Contribución de Software: Proporciona implementación de código abierto en C++ y JAX, soportando operaciones eficientes de álgebra lineal dispersa

Detalles del Método

Definición de la Tarea

Considere el problema de control óptimo discreto en tiempo:

minx0,u0,,xNi=0N1fi(xi,ui)+fN(xN)\min_{x_0,u_0,\ldots,x_N} \sum_{i=0}^{N-1} f_i(x_i, u_i) + f_N(x_N)

Restricciones:

  • Estado inicial: x0=s0x_0 = s_0
  • Restricciones de dinámica: xi+1=di(xi,ui),i{0,,N1}x_{i+1} = d_i(x_i, u_i), \forall i \in \{0,\ldots,N-1\}
  • Restricciones de igualdad: ci(xi,ui)=0,i{0,,N1}c_i(x_i, u_i) = 0, \forall i \in \{0,\ldots,N-1\}
  • Restricciones de desigualdad: gi(xi,ui)0,i{0,,N1}g_i(x_i, u_i) \leq 0, \forall i \in \{0,\ldots,N-1\}
  • Restricciones terminales: cN(xN)=0,gN(xN)0c_N(x_N) = 0, g_N(x_N) \leq 0

Marco del Método de Punto Interior Regularizado

Función de Barrera-Lagrangiano Aumentada

Defina la función de barrera-Lagrangiano: L(x,s,y,z;μ)=f(x)μilog(si)+yTc(x)+zT(g(x)+s)L(x,s,y,z;\mu) = f(x) - \mu\sum_i \log(s_i) + y^T c(x) + z^T(g(x) + s)

Versión aumentada: A(x,s,y,z;μ,η)=L(x,s,y,z;μ)+η2(c(x)2+g(x)+s2)A(x,s,y,z;\mu,\eta) = L(x,s,y,z;\mu) + \frac{\eta}{2}(\|c(x)\|^2 + \|g(x)+s\|^2)

Resolución de Sistema Lineal

Cada iteración requiere resolver el sistema lineal:

undefined