2025-11-25T13:52:17.039270

On weak convergence of Gaussian conditional distributions

Lumpp, Drton
Weak convergence of joint distributions generally does not imply convergence of conditional distributions. In particular, conditional distributions need not converge when joint Gaussian distributions converge to a singular Gaussian limit. Algebraically, this is due to the fact that at singular covariance matrices, Schur complements are not continuous functions of the matrix entries. Our results lay out special conditions under which convergence of Gaussian conditional distributions nevertheless occurs, and we exemplify how this allows one to reason about conditional independence in a new class of graphical models.
academic

Sulla convergenza debole delle distribuzioni gaussiane condizionate

Informazioni Fondamentali

  • ID Articolo: 2510.12412
  • Titolo: On weak convergence of Gaussian conditional distributions
  • Autori: Sarah Lumpp, Mathias Drton
  • Classificazione: math.ST stat.TH
  • Data di Pubblicazione: 14 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.12412

Riassunto

La convergenza debole della distribuzione congiunta non implica generalmente la convergenza delle distribuzioni condizionate. In particolare, quando le distribuzioni gaussiane congiunte convergono a un limite gaussiano singolare, le distribuzioni condizionate non necessariamente convergono. Da un punto di vista algebrico, ciò è dovuto al fatto che il complemento di Schur non è una funzione continua degli elementi della matrice in corrispondenza di matrici di covarianza singolari. I risultati di questo articolo chiariscono le condizioni speciali sotto le quali le distribuzioni gaussiane condizionate convergono comunque, e illustrano come ciò consenta di ragionare sulla indipendenza condizionata in una nuova classe di modelli grafici.

Contesto di Ricerca e Motivazione

Problema Centrale

Il problema centrale affrontato da questa ricerca è: quando una sequenza di distribuzioni gaussiane X(m)N(0,Σ(m))X^{(m)} \sim N(0, Σ^{(m)}) converge debolmente a una distribuzione gaussiana singolare XN(0,Σ)X \sim N(0, Σ), le distribuzioni condizionate N(0,ΣRS(m))N(0, Σ_{R|S}^{(m)}) convergono a N(0,ΣRS)N(0, Σ_{R|S})?

Importanza del Problema

  1. Significato Teorico: La convergenza delle distribuzioni condizionate è un problema fondamentale nella teoria della probabilità, essenziale per comprendere il comportamento limite delle distribuzioni
  2. Valore Applicativo: Nei modelli grafici, l'analisi dell'indipendenza condizionata dipende dalle proprietà delle distribuzioni condizionate, in particolare nei nuovi modelli grafici definiti dall'equazione di Lyapunov continua

Limitazioni dei Metodi Esistenti

  1. Discontinuità nel Caso Generale: L'operazione di pseudoinversa ()+(·)^+ non è continua in corrispondenza di matrici singolari, causando la possibile non convergenza della matrice di covarianza condizionata ΣRS=ΣR,RΣR,S(ΣS,S)+ΣS,RΣ_{R|S} = Σ_{R,R} - Σ_{R,S}(Σ_{S,S})^+Σ_{S,R}
  2. Restrizioni nei Casi Speciali: I risultati noti si applicano principalmente a sequenze di matrici a rango costante, mentre le applicazioni pratiche spesso incontrano matrici di rango pieno che convergono a matrici singolari

Motivazione della Ricerca

Ispirato dal lavoro di Boege et al. (2025) sull'indipendenza condizionata, gli autori considerano il caso più impegnativo: ogni Σ(m)Σ^{(m)} è di rango pieno, mentre la matrice di covarianza limite ΣΣ è singolare.

Contributi Principali

  1. Stabilire Condizioni di Convergenza: Propone condizioni sufficienti per la convergenza delle distribuzioni gaussiane condizionate, anche nel caso di limiti singolari
  2. Generalizzazione del Lemma del Determinante Matriciale: Sviluppa una versione generalizzata del lemma del determinante matriciale per analizzare il comportamento asintotico di matrici singolari
  3. Applicazione ai Modelli Grafici: Dimostra come applicare i risultati teorici all'analisi dell'indipendenza condizionata in modelli grafici definiti dall'equazione di Lyapunov continua
  4. Caso Particolare delle Matrici Toeplitz: Fornisce una dimostrazione alternativa intuitiva per matrici Toeplitz speciali

Dettagli Metodologici

Definizione del Compito

Data una sequenza di vettori gaussiani casuali X(m)N(0,Σ(m))X^{(m)} \sim N(0, Σ^{(m)}) che converge debolmente a XN(0,Σ)X \sim N(0, Σ), dove Σ(m)Σ^{(m)} è invertibile ma ΣΣ è singolare. Per sottoinsiemi disgiunti S,R[p]S, R ⊆ [p], determinare se la matrice di covarianza condizionata ΣRS(m)Σ_{R|S}^{(m)} converge a ΣRSΣ_{R|S}.

Risultati Teorici Fondamentali

Teorema Principale (Teorema 1.2)

Sia Σ(m)Σ^{(m)} una sequenza di matrici simmetriche p×pp×p invertibili con limite singolare ΣΣ, e soddisfi lo sviluppo: Σ(m)=Σ+1mΣ(1,)+o(1m)Σ^{(m)} = Σ + \frac{1}{m}Σ^{(1,∞)} + o\left(\frac{1}{m}\right)

Per S[p]S ⊂ [p] con k=S<pk = |S| < p, R=[p]SR = [p] \setminus S, se le matrici ΣΣ e Σ(1,)Σ^{(1,∞)} soddisfano:

(i) f(U,ΣS,S(1,))0f(U, Σ_{S,S}^{(1,∞)}) ≠ 0, dove UU proviene dalla decomposizione di rango simmetrico ΣS,S=UBUTΣ_{S,S} = UBU^T
(ii) im(ΣS,R)im(ΣS,S)\text{im}(Σ_{S,R}) ⊆ \text{im}(Σ_{S,S})

allora la matrice di covarianza condizionata ΣRS(m)Σ_{R|S}^{(m)} converge a ΣRSΣ_{R|S}.

Definizione della Funzione Chiave

La funzione f:Rk×r×Rk×kRf: \mathbb{R}^{k×r} × \mathbb{R}^{k×k} → \mathbb{R} è definita come: f(U,G)=(1)s([kr])α[k]α=kr(1)s(α)det(G[k],αU)det(U[k]α,[r])f(U,G) = (-1)^{s([k-r])} \sum_{\substack{α⊆[k] \\ |α|=k-r}} (-1)^{s(α)} \det\begin{pmatrix} G_{[k],α} & U \end{pmatrix} \det(U_{[k]\setminus α,[r]})

Punti di Innovazione Tecnica

1. Generalizzazione del Lemma del Determinante Matriciale

Lemma 3.1: Per matrici U,VRk×rU, V ∈ \mathbb{R}^{k×r}, GRk×kG ∈ \mathbb{R}^{k×k}, BRr×rB ∈ \mathbb{R}^{r×r}, dove r<kr < k: det(UBVT+1mG)=1mkrdet(B)fasy(U,V,G)+o(1mkr)\det\left(UBV^T + \frac{1}{m}G\right) = \frac{1}{m^{k-r}} \cdot \det(B) \cdot f_{\text{asy}}(U, V, G) + o\left(\frac{1}{m^{k-r}}\right)

2. Applicazione della Regola di Cramer

Rappresentando ogni elemento della matrice di covarianza condizionata come: vmTAm1wm=det(Am[j])det(Am)v_m^T A_m^{-1} w_m = \frac{\det(A_m[j])}{\det(A_m)} e analizzando il comportamento asintotico del numeratore e del denominatore per provare la convergenza.

3. Gestione del Rumore

Il Lemma 3.2 gestisce l'effetto di termini di rumore aggiuntivi D(m)=o(1/m)D^{(m)} = o(1/m), garantendo che il termine asintotico principale non sia disturbato.

Configurazione Sperimentale

Scenario di Applicazione: Equazione di Lyapunov Continua

Considerare distribuzioni gaussiane che soddisfano l'equazione di Lyapunov continua: MΣ+ΣMT+2Ip=0MΣ + ΣM^T + 2I_p = 0 dove MM è una matrice stabile il cui schema di zeri codifica la struttura del grafo.

Esempi Concreti

Esempio 2.1: Trek T4:1234T_4: 1 ← 2 → 3 → 4

Costruire la matrice stabile:

undefined