We derive closed-form extensions of Riccati's recursions (both sequential and parallel) for solving dual-regularized LQR problems. We show how these methods can be used to solve general constrained, non-convex, discrete-time optimal control problems via a regularized interior point method, while guaranteeing that each step is a descent direction of an Augmented Barrier-Lagrangian merit function. We provide MIT-licensed implementations of our methods in C++ and JAX.
- 논문 ID: 2509.16370
- 제목: Dual-Regularized Riccati Recursions for Interior-Point Optimal Control
- 저자: João Sousa-Pinto, Dominique Orban
- 분류: math.OC cs.MS cs.RO cs.SY eess.SY
- 발표 시간: 2025년 10월 15일 (arXiv v2)
- 논문 링크: https://arxiv.org/abs/2509.16370
본 논문은 이중 정규화 LQR 문제를 풀기 위한 Riccati 재귀의 폐쇄형 확장(순차 및 병렬 버전 포함)을 유도한다. 저자들은 정규화 내부점법을 통해 이러한 방법을 사용하여 일반적인 제약, 비볼록, 이산시간 최적제어 문제를 풀 수 있음을 보여주며, 각 단계에서 증강 배리어-라그랑주 함수의 하강 방향을 보장한다. 논문은 C++ 및 JAX의 MIT 라이선스 구현을 제공한다.
본 연구가 해결하고자 하는 핵심 문제는 등식 및 부등식 제약을 가진 비볼록 이산시간 최적제어 문제를 효율적으로 풀 수 있는 방법이다. 기존 방법들은 다음과 같은 과제를 안고 있다:
- 계산 효율성 문제: 표준 내부점법은 최적제어 문제를 처리할 때 대규모 선형 시스템을 풀어야 하므로 계산 복잡도가 높다
- 수치 안정성: 정규화 매개변수가 0으로 수렴할 때 기존 방법이 수치적 불안정성을 보일 수 있다
- 병렬화의 어려움: 기존 방법은 병렬 계산 자원을 충분히 활용하기 어렵다
최적제어 문제는 로봇공학, 항공우주, 자동주행 등 다양한 분야에서 광범위하게 적용된다. 이러한 문제를 효율적으로 풀 수 있는 능력은 실시간 제어 시스템에 매우 중요하며, 특히 복잡한 제약을 처리해야 하는 경우에 그러하다.
- DDP 알고리즘: 실무에서 가장 널리 사용되는 방법이지만, 단일 사격(single-shooting) 방법으로서 상태 궤적을 독립적으로 따뜻하게 시작할 수 없다
- 표준 LQR 방법: 무제약 또는 단순 제약의 선형 시스템에만 적용 가능하다
- 기존 내부점법: IPOPT 같은 범용 솔버는 최적제어 문제의 구조적 특성을 충분히 활용할 수 없다
- 이론적 기여: 이중 정규화 LQR 문제를 풀기 위한 폐쇄형 Riccati 재귀 확장 유도 (순차 및 병렬 버전)
- 알고리즘 혁신: 증강 배리어-라그랑주 함수를 merit 함수로 사용하여 하강 방향을 보장하는 정규화 내부점법 제안
- 수치 안정성: 정규화 매개변수 δ→0일 때 수치적으로 안정적인 알고리즘 설계로 표준 LQR 알고리즘 복구 가능
- 병렬화 알고리즘: 결합 스캔(associative scans)을 기반으로 O(log N) 병렬 시간 복잡도의 풀이 알고리즘 구현
- 소프트웨어 기여: 효율적인 희소 선형대수 연산을 지원하는 C++ 및 JAX 오픈소스 구현 제공
다음의 이산시간 최적제어 문제를 고려한다:
minx0,u0,…,xN∑i=0N−1fi(xi,ui)+fN(xN)
제약 조건:
- 초기 상태: x0=s0
- 동역학 제약: xi+1=di(xi,ui),∀i∈{0,…,N−1}
- 등식 제약: ci(xi,ui)=0,∀i∈{0,…,N−1}
- 부등식 제약: gi(xi,ui)≤0,∀i∈{0,…,N−1}
- 종료 제약: cN(xN)=0,gN(xN)≤0
배리어-라그랑주 함수를 다음과 같이 정의한다:
L(x,s,y,z;μ)=f(x)−μ∑ilog(si)+yTc(x)+zT(g(x)+s)
증강 버전:
A(x,s,y,z;μ,η)=L(x,s,y,z;μ)+2η(∥c(x)∥2+∥g(x)+s∥2)
각 반복에서 다음 선형 시스템을 풀어야 한다:
undefined