Control of Conditional Processes and Fleming--Viot Dynamics
Jettkant
We discuss equivalent formulations of the control of conditional processes introduced by Lions. In this problem, a controlled diffusion process is killed once it hits the boundary of a given domain and the controller's reward is computed based on the conditional distribution given the process's survival. So far there is no clarity regarding the relationship between the open- and closed-loop formulation of this nonstandard control problem. We provide a short proof of their equivalence using measurable selection and mimicking arguments. In addition, we link the closed-loop formulation to Fleming--Viot dynamics of McKean--Vlasov type, where upon being killed the diffusion process is reinserted into the domain according to the current law of the process itself. This connection offers a new interpretation of the control problem and opens it up to applications that feature costs caused by reinsertion.
본 논문은 Lions가 도입한 조건부 과정 제어 문제의 동등한 표현을 다룬다. 이 문제에서 제어된 확산 과정은 주어진 영역의 경계에 닿으면 "소멸"되며, 제어자의 보상은 과정이 생존하는 조건 하에서의 조건부 분포를 기반으로 계산된다. 현재까지 이 비표준 제어 문제의 개루프(open-loop)와 폐루프(closed-loop) 표현 간의 관계는 명확하지 않다. 저자는 측정 가능한 선택(measurable selection)과 모의 논증(simulation argument)을 사용하여 이들의 동등성에 대한 간단한 증명을 제공한다. 더욱이, 폐루프 표현을 McKean-Vlasov 유형의 Fleming-Viot 동역학과 연결하는데, 여기서 소멸된 확산 과정은 과정 자체의 현재 분포에 따라 영역에 다시 삽입된다. 이러한 연결은 제어 문제에 새로운 해석을 제공하며, 재삽입 비용을 포함하는 응용으로 확장된다.
본 논문은 Lions가 제시한 조건부 과정 제어 문제의 핵심 이론 문제를 성공적으로 해결하며, 개루프와 폐루프 제어의 동등성을 확립하고, Fleming-Viot 동역학을 통해 새로운 해석 관점을 제공한다. 기술적으로, 보조 과정 방법의 도입은 증명 복잡성을 단순화하며, 관련 연구에 가치 있는 도구를 제공한다. 이론적 결과는 수학적 우아함뿐만 아니라 재삽입 비용을 포함하는 실제 응용을 위한 길을 닦는다.