Control of Conditional Processes and Fleming--Viot Dynamics
Jettkant
We discuss equivalent formulations of the control of conditional processes introduced by Lions. In this problem, a controlled diffusion process is killed once it hits the boundary of a given domain and the controller's reward is computed based on the conditional distribution given the process's survival. So far there is no clarity regarding the relationship between the open- and closed-loop formulation of this nonstandard control problem. We provide a short proof of their equivalence using measurable selection and mimicking arguments. In addition, we link the closed-loop formulation to Fleming--Viot dynamics of McKean--Vlasov type, where upon being killed the diffusion process is reinserted into the domain according to the current law of the process itself. This connection offers a new interpretation of the control problem and opens it up to applications that feature costs caused by reinsertion.
academic
Controllo di Processi Condizionati e Dinamiche di Fleming--Viot
Questo articolo discute formulazioni equivalenti del problema di controllo dei processi condizionati introdotto da Lions. Nel problema in questione, un processo di diffusione controllato viene "ucciso" una volta che raggiunge il confine di una regione data, e il premio del controllore è calcolato sulla base della distribuzione condizionata dato che il processo sopravvive. Attualmente, la relazione tra le formulazioni in anello aperto e in anello chiuso per questo problema di controllo non standard rimane poco chiara. L'autore fornisce una breve dimostrazione della loro equivalenza utilizzando la selezione misurabile e argomenti di simulazione. Inoltre, collega la formulazione in anello chiuso alle dinamiche di Fleming-Viot di tipo McKean-Vlasov, dove i processi di diffusione uccisi vengono reintrodotti nella regione secondo la distribuzione attuale del processo stesso. Questo collegamento fornisce una nuova interpretazione del problema di controllo e lo estende ad applicazioni con costi di reintroduzione.
Questo articolo studia il problema di controllo dei processi condizionati introdotto da Lions nelle sue lezioni al Collège de France. La particolarità di questo problema risiede in:
Meccanismo di Uccisione: Un processo di diffusione controllato viene "ucciso" una volta che abbandona una regione data D
Premio Condizionato: Il premio del controllore è calcolato sulla base della distribuzione condizionata μₜ = L(Xₜ|τ > t) dato che il processo sopravvive
Natura Non Standard: Si tratta di un problema di controllo stocastico non standard, diverso dal controllo McKean-Vlasov classico
Il lavoro correlato di Campi et al. si basa su distribuzioni di sub-probabilità piuttosto che su distribuzioni condizionate
Carmona et al. considerano solo una versione rilassata di "uccisione morbida", senza affrontare direttamente il modello originale di "uccisione dura" di Lions
Manca un quadro teorico che colleghi il controllo dei processi condizionati alle dinamiche di Fleming-Viot
Dimostrazione di Equivalenza: Dimostra l'equivalenza tra le formulazioni in anello aperto e in anello chiuso nel problema di controllo dei processi condizionati (V = V_closed)
Innovazione Metodologica: Migliora il metodo di Lacker introducendo un processo ausiliario (X,Λ) che evita l'uso di funzioni di aggiornamento
Collegamento con Fleming-Viot: Stabilisce una corrispondenza tra il controllo in anello chiuso e le dinamiche di Fleming-Viot di tipo McKean-Vlasov
Estensione Applicativa: Fornisce un quadro teorico per applicazioni che includono costi di reintroduzione
Teorema 2.4 (Equivalenza): Sotto ipotesi appropriate, per ogni controllo ammissibile (α,μ), esiste un controllo in anello chiuso (α̃,μ) tale che J(α̃,μ) ≥ J(α,μ). In particolare, V_closed = V.
Teorema 3.4 (Esistenza e Unicità di Fleming-Viot): L'SDE McKean-Vlasov (3.1) ammette una soluzione forte con unicità di percorso, inoltre, L(Xₜ) = L(X'ₜ|τ' > t).
Questo articolo risolve con successo il problema teorico centrale nel problema di controllo dei processi condizionati proposto da Lions, stabilendo l'equivalenza tra il controllo in anello aperto e in anello chiuso, e fornendo una nuova prospettiva interpretativa attraverso le dinamiche di Fleming-Viot. Dal punto di vista tecnico, l'introduzione del metodo del processo ausiliario semplifica la complessità della dimostrazione, fornendo uno strumento prezioso per ricerche correlate. I risultati teorici non solo possiedono eleganza matematica, ma aprono anche la strada ad applicazioni pratiche che includono costi di reintroduzione.