2025-11-23T02:40:16.760420

Dual-Regularized Riccati Recursions for Interior-Point Optimal Control

Sousa-Pinto, Orban
We derive closed-form extensions of Riccati's recursions (both sequential and parallel) for solving dual-regularized LQR problems. We show how these methods can be used to solve general constrained, non-convex, discrete-time optimal control problems via a regularized interior point method, while guaranteeing that each step is a descent direction of an Augmented Barrier-Lagrangian merit function. We provide MIT-licensed implementations of our methods in C++ and JAX.
academic

내부점 최적제어를 위한 이중 정규화 Riccati 재귀

기본 정보

  • 논문 ID: 2509.16370
  • 제목: Dual-Regularized Riccati Recursions for Interior-Point Optimal Control
  • 저자: João Sousa-Pinto, Dominique Orban
  • 분류: math.OC cs.MS cs.RO cs.SY eess.SY
  • 발표 시간: 2025년 10월 15일 (arXiv v2)
  • 논문 링크: https://arxiv.org/abs/2509.16370

초록

본 논문은 이중 정규화 LQR 문제를 풀기 위한 Riccati 재귀의 폐쇄형 확장(순차 및 병렬 버전 포함)을 유도한다. 저자들은 정규화 내부점법을 통해 이러한 방법을 사용하여 일반적인 제약, 비볼록, 이산시간 최적제어 문제를 풀 수 있음을 보여주며, 각 단계에서 증강 배리어-라그랑주 함수의 하강 방향을 보장한다. 논문은 C++ 및 JAX의 MIT 라이선스 구현을 제공한다.

연구 배경 및 동기

핵심 문제

본 연구가 해결하고자 하는 핵심 문제는 등식 및 부등식 제약을 가진 비볼록 이산시간 최적제어 문제를 효율적으로 풀 수 있는 방법이다. 기존 방법들은 다음과 같은 과제를 안고 있다:

  1. 계산 효율성 문제: 표준 내부점법은 최적제어 문제를 처리할 때 대규모 선형 시스템을 풀어야 하므로 계산 복잡도가 높다
  2. 수치 안정성: 정규화 매개변수가 0으로 수렴할 때 기존 방법이 수치적 불안정성을 보일 수 있다
  3. 병렬화의 어려움: 기존 방법은 병렬 계산 자원을 충분히 활용하기 어렵다

문제의 중요성

최적제어 문제는 로봇공학, 항공우주, 자동주행 등 다양한 분야에서 광범위하게 적용된다. 이러한 문제를 효율적으로 풀 수 있는 능력은 실시간 제어 시스템에 매우 중요하며, 특히 복잡한 제약을 처리해야 하는 경우에 그러하다.

기존 방법의 한계

  1. DDP 알고리즘: 실무에서 가장 널리 사용되는 방법이지만, 단일 사격(single-shooting) 방법으로서 상태 궤적을 독립적으로 따뜻하게 시작할 수 없다
  2. 표준 LQR 방법: 무제약 또는 단순 제약의 선형 시스템에만 적용 가능하다
  3. 기존 내부점법: IPOPT 같은 범용 솔버는 최적제어 문제의 구조적 특성을 충분히 활용할 수 없다

핵심 기여

  1. 이론적 기여: 이중 정규화 LQR 문제를 풀기 위한 폐쇄형 Riccati 재귀 확장 유도 (순차 및 병렬 버전)
  2. 알고리즘 혁신: 증강 배리어-라그랑주 함수를 merit 함수로 사용하여 하강 방향을 보장하는 정규화 내부점법 제안
  3. 수치 안정성: 정규화 매개변수 δ→0일 때 수치적으로 안정적인 알고리즘 설계로 표준 LQR 알고리즘 복구 가능
  4. 병렬화 알고리즘: 결합 스캔(associative scans)을 기반으로 O(log N) 병렬 시간 복잡도의 풀이 알고리즘 구현
  5. 소프트웨어 기여: 효율적인 희소 선형대수 연산을 지원하는 C++ 및 JAX 오픈소스 구현 제공

방법 상세 설명

작업 정의

다음의 이산시간 최적제어 문제를 고려한다:

minx0,u0,,xNi=0N1fi(xi,ui)+fN(xN)\min_{x_0,u_0,\ldots,x_N} \sum_{i=0}^{N-1} f_i(x_i, u_i) + f_N(x_N)

제약 조건:

  • 초기 상태: x0=s0x_0 = s_0
  • 동역학 제약: xi+1=di(xi,ui),i{0,,N1}x_{i+1} = d_i(x_i, u_i), \forall i \in \{0,\ldots,N-1\}
  • 등식 제약: ci(xi,ui)=0,i{0,,N1}c_i(x_i, u_i) = 0, \forall i \in \{0,\ldots,N-1\}
  • 부등식 제약: gi(xi,ui)0,i{0,,N1}g_i(x_i, u_i) \leq 0, \forall i \in \{0,\ldots,N-1\}
  • 종료 제약: cN(xN)=0,gN(xN)0c_N(x_N) = 0, g_N(x_N) \leq 0

정규화 내부점법 프레임워크

증강 배리어-라그랑주 함수

배리어-라그랑주 함수를 다음과 같이 정의한다: L(x,s,y,z;μ)=f(x)μilog(si)+yTc(x)+zT(g(x)+s)L(x,s,y,z;\mu) = f(x) - \mu\sum_i \log(s_i) + y^T c(x) + z^T(g(x) + s)

증강 버전: A(x,s,y,z;μ,η)=L(x,s,y,z;μ)+η2(c(x)2+g(x)+s2)A(x,s,y,z;\mu,\eta) = L(x,s,y,z;\mu) + \frac{\eta}{2}(\|c(x)\|^2 + \|g(x)+s\|^2)

선형 시스템 풀이

각 반복에서 다음 선형 시스템을 풀어야 한다:

undefined