Distributionally Robust Control with End-to-End Statistically Guaranteed Metric Learning
Wu, Ning, Shi
Wasserstein distributionally robust control (DRC) recently emerges as a principled paradigm for handling uncertainty in stochastic dynamical systems. However, it constructs data-driven ambiguity sets via uniform distribution shifts before sequentially incorporating them into downstream control synthesis. This segregation between ambiguity set construction and control objectives inherently introduces a structural misalignment, which undesirably leads to conservative control policies with sub-optimal performance. To address this limitation, we propose a novel end-to-end finite-horizon Wasserstein DRC framework that integrates the learning of anisotropic Wasserstein metrics with downstream control tasks in a closed-loop manner, thus enabling ambiguity sets to be systematically adjusted along performance-critical directions and yielding more effective control policies. This framework is formulated as a bilevel program: the inner level characterizes dynamical system evolution under DRC, while the outer level refines the anisotropic metric leveraging control-performance feedback across a range of initial conditions. To solve this program efficiently, we develop a stochastic augmented Lagrangian algorithm tailored to the bilevel structure. Theoretically, we prove that the learned ambiguity sets preserve statistical finite-sample guarantees under a novel radius adjustment mechanism, and we establish the well-posedness of the bilevel formulation by demonstrating its continuity with respect to the learnable metric. Furthermore, we show that the algorithm converges to stationary points of the outer level problem, which are statistically consistent with the optimal metric at a non-asymptotic convergence rate. Experiments on both numerical and inventory control tasks verify that the proposed framework achieves superior closed-loop performance and robustness compared against state-of-the-art methods.
Wasserstein 분포 강건 제어(DRC)는 확률적 동역학계의 불확실성을 다루기 위한 원칙적 패러다임으로 최근 주목받고 있다. 그러나 기존 방법들은 균일 분포 편차를 통해 데이터 기반 모호 집합을 구성한 후 이를 순차적으로 하위 제어 합성에 통합한다. 이러한 모호 집합 구성과 제어 목표 간의 분리는 본질적으로 구조적 불일치를 야기하여 보수적인 제어 전략과 차선의 성능을 초래한다. 이러한 한계를 해결하기 위해 본 논문은 새로운 끝단간 유한 시간 Wasserstein DRC 프레임워크를 제안한다. 이 프레임워크는 폐루프 방식으로 이방성 Wasserstein 메트릭 학습을 하위 제어 작업과 통합하여 모호 집합이 성능 관련 방향을 따라 체계적으로 조정되도록 하며, 보다 효과적인 제어 전략을 생성한다.
확률적 제어는 로봇공학, 에너지 시스템, 금융 등 다양한 분야에서 불확실성 하에서의 의사결정에 광범위하게 적용된다. 전통적 이론은 제어 불확실성의 확률 분포가 완전히 알려져 있다고 가정하지만, 실제로는 이러한 분포를 거의 얻을 수 없으며, 제어기는 제한된 데이터로부터 추론된 근사 정보를 기반으로 설계되어야 한다. 이러한 근사의 내재적 불완전성은 추정 분포와 실제 분포 간의 차이를 초래하여 제어 성능을 크게 저하시킨다.