2025-11-25T13:52:17.039270

On weak convergence of Gaussian conditional distributions

Lumpp, Drton
Weak convergence of joint distributions generally does not imply convergence of conditional distributions. In particular, conditional distributions need not converge when joint Gaussian distributions converge to a singular Gaussian limit. Algebraically, this is due to the fact that at singular covariance matrices, Schur complements are not continuous functions of the matrix entries. Our results lay out special conditions under which convergence of Gaussian conditional distributions nevertheless occurs, and we exemplify how this allows one to reason about conditional independence in a new class of graphical models.
academic

On weak convergence of Gaussian conditional distributions

基本信息

  • 论文ID: 2510.12412
  • 标题: On weak convergence of Gaussian conditional distributions
  • 作者: Sarah Lumpp, Mathias Drton
  • 分类: math.ST stat.TH
  • 发表时间: 2025年10月14日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2510.12412

摘要

联合分布的弱收敛通常不意味着条件分布的收敛。特别是,当联合高斯分布收敛到奇异高斯极限时,条件分布不一定收敛。从代数角度看,这是因为在奇异协方差矩阵处,Schur补不是矩阵元素的连续函数。本文的结果阐述了高斯条件分布仍然收敛的特殊条件,并举例说明了这如何允许人们在一类新的图模型中推理条件独立性。

研究背景与动机

核心问题

本研究解决的核心问题是:当高斯分布序列X(m)N(0,Σ(m))X^{(m)} \sim N(0, Σ^{(m)})弱收敛到奇异高斯分布XN(0,Σ)X \sim N(0, Σ)时,条件分布N(0,ΣRS(m))N(0, Σ_{R|S}^{(m)})是否收敛到N(0,ΣRS)N(0, Σ_{R|S})

问题重要性

  1. 理论意义:条件分布的收敛性是概率论中的基本问题,对于理解分布极限行为具有重要意义
  2. 应用价值:在图模型中,条件独立性的分析依赖于条件分布的性质,特别是在连续Lyapunov方程定义的新型图模型中

现有方法局限性

  1. 一般情况下的不连续性:伪逆运算()+(·)^+在奇异矩阵处不连续,导致条件协方差矩阵ΣRS=ΣR,RΣR,S(ΣS,S)+ΣS,RΣ_{R|S} = Σ_{R,R} - Σ_{R,S}(Σ_{S,S})^+Σ_{S,R}可能不收敛
  2. 特殊情况的限制:已知结果主要适用于常秩矩阵序列,而实际应用中常遇到满秩矩阵收敛到奇异矩阵的情况

研究动机

受Boege et al. (2025)关于条件独立性工作的启发,作者考虑更具挑战性的情况:每个Σ(m)Σ^{(m)}都是满秩的,而极限协方差矩阵ΣΣ是奇异的。

核心贡献

  1. 建立收敛条件:提出了高斯条件分布收敛的充分条件,即使在奇异极限情况下
  2. 矩阵行列式引理推广:发展了矩阵行列式引理的推广版本,用于分析奇异矩阵的渐近行为
  3. 图模型应用:展示了如何将理论结果应用于连续Lyapunov方程定义的图模型中的条件独立性分析
  4. Toeplitz矩阵特例:为特殊Toeplitz矩阵提供了直观的替代证明

方法详解

任务定义

给定高斯随机向量序列X(m)N(0,Σ(m))X^{(m)} \sim N(0, Σ^{(m)})弱收敛到XN(0,Σ)X \sim N(0, Σ),其中Σ(m)Σ^{(m)}可逆但ΣΣ奇异。对于不相交子集S,R[p]S, R ⊆ [p],确定条件协方差矩阵ΣRS(m)Σ_{R|S}^{(m)}是否收敛到ΣRSΣ_{R|S}

核心理论结果

主要定理(定理1.2)

Σ(m)Σ^{(m)}是可逆对称p×pp×p矩阵序列,具有奇异极限ΣΣ,且满足展开式: Σ(m)=Σ+1mΣ(1,)+o(1m)Σ^{(m)} = Σ + \frac{1}{m}Σ^{(1,∞)} + o\left(\frac{1}{m}\right)

对于S[p]S ⊂ [p]k=S<pk = |S| < pR=[p]SR = [p] \setminus S,如果矩阵ΣΣΣ(1,)Σ^{(1,∞)}满足:

(i) f(U,ΣS,S(1,))0f(U, Σ_{S,S}^{(1,∞)}) ≠ 0,其中UU来自对称秩分解ΣS,S=UBUTΣ_{S,S} = UBU^T
(ii) im(ΣS,R)im(ΣS,S)\text{im}(Σ_{S,R}) ⊆ \text{im}(Σ_{S,S})

则条件协方差矩阵ΣRS(m)Σ_{R|S}^{(m)}收敛到ΣRSΣ_{R|S}

关键函数定义

函数f:Rk×r×Rk×kRf: \mathbb{R}^{k×r} × \mathbb{R}^{k×k} → \mathbb{R}定义为: f(U,G)=(1)s([kr])α[k]α=kr(1)s(α)det(G[k],αU)det(U[k]α,[r])f(U,G) = (-1)^{s([k-r])} \sum_{\substack{α⊆[k] \\ |α|=k-r}} (-1)^{s(α)} \det\begin{pmatrix} G_{[k],α} & U \end{pmatrix} \det(U_{[k]\setminus α,[r]})

技术创新点

1. 矩阵行列式引理的推广

引理3.1:对于矩阵U,VRk×rU, V ∈ \mathbb{R}^{k×r}GRk×kG ∈ \mathbb{R}^{k×k}BRr×rB ∈ \mathbb{R}^{r×r},其中r<kr < kdet(UBVT+1mG)=1mkrdet(B)fasy(U,V,G)+o(1mkr)\det\left(UBV^T + \frac{1}{m}G\right) = \frac{1}{m^{k-r}} \cdot \det(B) \cdot f_{\text{asy}}(U, V, G) + o\left(\frac{1}{m^{k-r}}\right)

2. Cramer规则的应用

通过将条件协方差矩阵的每个元素表示为: vmTAm1wm=det(Am[j])det(Am)v_m^T A_m^{-1} w_m = \frac{\det(A_m[j])}{\det(A_m)} 并分析分子和分母的渐近行为来证明收敛性。

3. 噪声处理

引理3.2处理了额外噪声项D(m)=o(1/m)D^{(m)} = o(1/m)的影响,确保主要渐近项不受干扰。

实验设置

应用场景:连续Lyapunov方程

考虑满足连续Lyapunov方程的高斯分布: MΣ+ΣMT+2Ip=0MΣ + ΣM^T + 2I_p = 0 其中MM是稳定矩阵,其零模式编码图结构。

具体例子

例子2.1:Trek T4:1234T_4: 1 ← 2 → 3 → 4

构造稳定矩阵: M4=(1100010001100011)M_4 = \begin{pmatrix} -1 & 1 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 1 & -1 & 0 \\ 0 & 0 & 1 & -1 \end{pmatrix}

得到解: Σ4=(3/21/21/23/81/211/21/41/21/23/27/83/81/47/815/8)Σ_4 = \begin{pmatrix} 3/2 & 1/2 & 1/2 & 3/8 \\ 1/2 & 1 & 1/2 & 1/4 \\ 1/2 & 1/2 & 3/2 & 7/8 \\ 3/8 & 1/4 & 7/8 & 15/8 \end{pmatrix}

验证(Σ4)1423=1/100(Σ_4)_{14|23} = 1/10 ≠ 0

实验结果

Toeplitz矩阵应用

对于nn维对称Toeplitz矩阵: Tn=(ij)i,j=1,,nT_n = (-|i-j|)_{i,j=1,\ldots,n}

引理4.1证明了对于特定的矩阵UUGGf(U,G)=2k+1{1,nl}{1,nr}0f(U,G) = 2^{k+1-|\{1,n_l\}|-|\{1,n_r\}|} ≠ 0

主要结果验证

命题4.2(Boege et al. 2025的命题4.5):对于任意长度的trek T:1pT: 1 ← ··· → p,存在满足连续Lyapunov方程的协方差矩阵ΣΣ,使得X1⊥̸XpX2,,Xp1X_1 \not\perp X_p | X_2, \ldots, X_{p-1}

证明通过构造矩阵序列M(m)M^{(m)},使得相应的解满足定理1.2的条件,从而保证条件独立性不成立。

相关工作

理论基础

  1. Stewart (1969), Ben-Israel and Greville (2003):常秩矩阵序列的伪逆连续性
  2. Lauritzen (1996, 2024):条件分布收敛的一般理论
  3. Bérczi et al. (2023):本工作推广了其第7节的结果

应用背景

  1. Dettling et al. (2023), Varando and Hansen (2020):连续Lyapunov图模型
  2. Boege et al. (2025):条件独立性在图模型中的刻画

结论与讨论

主要结论

  1. 在特定条件下,即使极限协方差矩阵奇异,高斯条件分布仍可收敛
  2. 条件(i)确保Schur补的分母不趋于零,条件(ii)保证像空间的兼容性
  3. 理论结果成功应用于连续Lyapunov图模型的条件独立性分析

局限性

  1. 条件限制性:需要满足特定的矩阵结构条件
  2. 计算复杂性:函数ff的计算涉及多重求和,对于大矩阵可能计算困难
  3. 应用范围:主要针对高斯分布,对其他分布族的扩展性未知

未来方向

  1. 条件放宽:寻找更一般的收敛条件
  2. 计算优化:开发更高效的条件验证算法
  3. 非高斯扩展:将结果推广到其他分布族

深度评价

优点

  1. 理论严谨性:提供了完整的数学证明框架,从矩阵行列式引理推广到主要定理
  2. 实用价值:解决了图模型中的实际问题,特别是连续Lyapunov方程的应用
  3. 方法创新:巧妙地结合了矩阵分析、概率论和图论
  4. 写作清晰:论文结构清晰,例子丰富,便于理解

不足

  1. 条件复杂性:定理条件的验证可能比较困难,特别是函数ff的计算
  2. 应用局限:主要适用于特定类型的矩阵结构,一般性有待提高
  3. 数值稳定性:对于接近奇异的矩阵,数值计算可能存在稳定性问题

影响力

  1. 理论贡献:为奇异极限下的条件分布收敛提供了新的理论工具
  2. 应用前景:在图模型、时间序列分析等领域具有潜在应用价值
  3. 方法启发:为处理类似的矩阵极限问题提供了新思路

适用场景

  1. 图模型分析:特别是连续Lyapunov方程定义的模型
  2. 时间序列:具有特定协方差结构的多元时间序列
  3. 统计推断:需要分析条件分布极限行为的统计问题

参考文献

论文引用了多个重要的相关工作,包括:

  • Ben-Israel and Greville (2003): 广义逆理论
  • Lauritzen (1996, 2024): 图模型和条件分布理论
  • Boege et al. (2025): 条件独立性在扩散过程中的应用
  • Stewart (1969): 广义逆的连续性理论

本论文在理论和应用两个层面都有重要贡献,为理解奇异极限下的条件分布行为提供了新的数学工具,并成功应用于图模型的条件独立性分析中。