2025-11-25T13:52:17.039270

On weak convergence of Gaussian conditional distributions

Lumpp, Drton

Weak convergence of joint distributions generally does not imply convergence of conditional distributions. In particular, conditional distributions need not converge when joint Gaussian distributions converge to a singular Gaussian limit. Algebraically, this is due to the fact that at singular covariance matrices, Schur complements are not continuous functions of the matrix entries. Our results lay out special conditions under which convergence of Gaussian conditional distributions nevertheless occurs, and we exemplify how this allows one to reason about conditional independence in a new class of graphical models.

academic

Sur la convergence faible des distributions conditionnelles gaussiennes

Informations fondamentales

ID de l'article: 2510.12412
Titre: Sur la convergence faible des distributions conditionnelles gaussiennes
Auteurs: Sarah Lumpp, Mathias Drton
Classification: math.ST stat.TH
Date de publication: 14 octobre 2025 (prépublication arXiv)
Lien de l'article: https://arxiv.org/abs/2510.12412

Résumé

La convergence faible d'une distribution conjointe n'implique généralement pas la convergence des distributions conditionnelles. En particulier, lorsque les distributions gaussiennes conjointes convergent vers une limite gaussienne singulière, les distributions conditionnelles ne convergent pas nécessairement. D'un point de vue algébrique, cela est dû au fait que le complément de Schur n'est pas une fonction continue des éléments de la matrice au niveau des matrices de covariance singulières. Les résultats de cet article élucident les conditions spéciales sous lesquelles les distributions conditionnelles gaussiennes convergent néanmoins, et illustrent comment cela permet de raisonner sur l'indépendance conditionnelle dans une nouvelle classe de modèles graphiques.

Contexte de recherche et motivation

Problème fondamental

Le problème fondamental abordé par cette recherche est le suivant : lorsqu'une séquence de distributions gaussiennes $X^{(m)} \sim N(0, Σ^{(m)})$ converge faiblement vers une distribution gaussienne singulière $X \sim N(0, Σ)$ , les distributions conditionnelles $N(0, Σ_{R|S}^{(m)})$ convergent-elles vers $N(0, Σ_{R|S})$ ?

Importance du problème

Signification théorique : La convergence des distributions conditionnelles est une question fondamentale en théorie des probabilités, essentielle pour comprendre le comportement limite des distributions
Valeur applicative : Dans les modèles graphiques, l'analyse de l'indépendance conditionnelle dépend des propriétés des distributions conditionnelles, particulièrement dans les nouveaux modèles graphiques définis par l'équation de Lyapunov continue

Limitations des méthodes existantes

Discontinuité dans le cas général : L'opération de pseudo-inverse $(·)^+$ n'est pas continue aux matrices singulières, ce qui peut entraîner la non-convergence de la matrice de covariance conditionnelle $Σ_{R|S} = Σ_{R,R} - Σ_{R,S}(Σ_{S,S})^+Σ_{S,R}$
Restrictions des cas particuliers : Les résultats connus s'appliquent principalement aux séquences de matrices de rang constant, tandis que les applications pratiques rencontrent souvent des matrices de rang complet convergeant vers des matrices singulières

Motivation de la recherche

Inspirés par les travaux de Boege et al. (2025) sur l'indépendance conditionnelle, les auteurs considèrent le cas plus difficile où chaque $Σ^{(m)}$ est de rang complet, tandis que la matrice de covariance limite $Σ$ est singulière.

Contributions principales

Établissement des conditions de convergence : Proposition de conditions suffisantes pour la convergence des distributions conditionnelles gaussiennes, même dans le cas de limites singulières
Généralisation du lemme du déterminant matriciel : Développement d'une version généralisée du lemme du déterminant matriciel pour analyser le comportement asymptotique des matrices singulières
Application aux modèles graphiques : Démonstration de l'application des résultats théoriques à l'analyse de l'indépendance conditionnelle dans les modèles graphiques définis par l'équation de Lyapunov continue
Cas particulier des matrices de Toeplitz : Fourniture d'une preuve alternative intuitive pour les matrices de Toeplitz spéciales

Détail des méthodes

Définition de la tâche

Étant donnée une séquence de vecteurs aléatoires gaussiens $X^{(m)} \sim N(0, Σ^{(m)})$ convergeant faiblement vers $X \sim N(0, Σ)$ , où $Σ^{(m)}$ est inversible mais $Σ$ est singulière. Pour les sous-ensembles disjoints $S, R ⊆ [p]$ , déterminer si les matrices de covariance conditionnelle $Σ_{R|S}^{(m)}$ convergent vers $Σ_{R|S}$ .

Résultats théoriques fondamentaux

Théorème principal (Théorème 1.2)

Soit $Σ^{(m)}$ une séquence de matrices symétriques $p×p$ inversibles avec une limite singulière $Σ$ , satisfaisant le développement : $Σ^{(m)} = Σ + \frac{1}{m}Σ^{(1,∞)} + o\left(\frac{1}{m}\right)$

Pour $S ⊂ [p]$ avec $k = |S| < p$ , $R = [p] \setminus S$ , si les matrices $Σ$ et $Σ^{(1,∞)}$ satisfont :

(i) $f(U, Σ_{S,S}^{(1,∞)}) ≠ 0$ , où $U$ provient de la décomposition de rang symétrique $Σ_{S,S} = UBU^T$
(ii) $\text{im}(Σ_{S,R}) ⊆ \text{im}(Σ_{S,S})$

alors les matrices de covariance conditionnelle $Σ_{R|S}^{(m)}$ convergent vers $Σ_{R|S}$ .

Définition de la fonction clé

La fonction $f: \mathbb{R}^{k×r} × \mathbb{R}^{k×k} → \mathbb{R}$ est définie par : $f(U,G) = (-1)^{s([k-r])} \sum_{\substack{α⊆[k] \\ |α|=k-r}} (-1)^{s(α)} \det\begin{pmatrix} G_{[k],α} & U \end{pmatrix} \det(U_{[k]\setminus α,[r]})$

Points d'innovation technique

1. Généralisation du lemme du déterminant matriciel

Lemme 3.1 : Pour les matrices $U, V ∈ \mathbb{R}^{k×r}$ , $G ∈ \mathbb{R}^{k×k}$ , $B ∈ \mathbb{R}^{r×r}$ , où $r < k$ : $\det\left(UBV^T + \frac{1}{m}G\right) = \frac{1}{m^{k-r}} \cdot \det(B) \cdot f_{\text{asy}}(U, V, G) + o\left(\frac{1}{m^{k-r}}\right)$

2. Application de la règle de Cramer

En exprimant chaque élément de la matrice de covariance conditionnelle comme : $v_m^T A_m^{-1} w_m = \frac{\det(A_m[j])}{\det(A_m)}$ et en analysant le comportement asymptotique du numérateur et du dénominateur pour prouver la convergence.

3. Gestion du bruit

Le Lemme 3.2 traite l'effet des termes de bruit supplémentaires $D^{(m)} = o(1/m)$ , assurant que le terme asymptotique principal n'est pas perturbé.

Configuration expérimentale

Scénario d'application : Équation de Lyapunov continue

Considérer les distributions gaussiennes satisfaisant l'équation de Lyapunov continue : $MΣ + ΣM^T + 2I_p = 0$ où $M$ est une matrice stable dont le motif zéro encode la structure graphique.

Exemples concrets

Exemple 2.1 : Trek $T_4: 1 ← 2 → 3 → 4$

Construction de la matrice stable : $M_4 = \begin{pmatrix} -1 & 1 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 1 & -1 & 0 \\ 0 & 0 & 1 & -1 \end{pmatrix}$

Obtention de la solution : $Σ_4 = \begin{pmatrix} 3/2 & 1/2 & 1/2 & 3/8 \\ 1/2 & 1 & 1/2 & 1/4 \\ 1/2 & 1/2 & 3/2 & 7/8 \\ 3/8 & 1/4 & 7/8 & 15/8 \end{pmatrix}$

Vérification que $(Σ_4)_{14|23} = 1/10 ≠ 0$ .

Résultats expérimentaux

Application aux matrices de Toeplitz

Pour les matrices symétriques de Toeplitz $n$ -dimensionnelles : $T_n = (-|i-j|)_{i,j=1,\ldots,n}$

Le Lemme 4.1 prouve que pour des matrices $U$ et $G$ spécifiques : $f(U,G) = 2^{k+1-|\{1,n_l\}|-|\{1,n_r\}|} ≠ 0$

Vérification des résultats principaux

Proposition 4.2 (Proposition 4.5 de Boege et al. 2025) : Pour tout trek de longueur arbitraire $T: 1 ← ··· → p$ , il existe une matrice de covariance $Σ$ satisfaisant l'équation de Lyapunov continue telle que $X_1 \not\perp X_p | X_2, \ldots, X_{p-1}$ .

La preuve procède par construction d'une séquence de matrices $M^{(m)}$ telle que les solutions correspondantes satisfont les conditions du Théorème 1.2, garantissant ainsi que l'indépendance conditionnelle ne tient pas.

Travaux connexes

Fondements théoriques

Stewart (1969), Ben-Israel et Greville (2003) : Continuité de la pseudo-inverse pour les séquences de matrices de rang constant
Lauritzen (1996, 2024) : Théorie générale de la convergence des distributions conditionnelles
Bérczi et al. (2023) : Cet ouvrage généralise les résultats de leur section 7

Contexte applicatif

Dettling et al. (2023), Varando et Hansen (2020) : Modèles graphiques d'équation de Lyapunov continue
Boege et al. (2025) : Caractérisation de l'indépendance conditionnelle dans les modèles graphiques

Conclusions et discussion

Conclusions principales

Sous certaines conditions, même si la matrice de covariance limite est singulière, les distributions conditionnelles gaussiennes peuvent converger
La condition (i) assure que le dénominateur du complément de Schur ne tend pas vers zéro, tandis que la condition (ii) garantit la compatibilité des espaces images
Les résultats théoriques s'appliquent avec succès à l'analyse de l'indépendance conditionnelle dans les modèles graphiques d'équation de Lyapunov continue

Limitations

Restrictivité des conditions : Nécessité de satisfaire des conditions de structure matricielle spécifiques
Complexité computationnelle : Le calcul de la fonction $f$ implique des sommes multiples, ce qui peut être difficile pour les grandes matrices
Portée applicative : Principalement orienté vers les distributions gaussiennes, l'extensibilité à d'autres familles de distributions reste inconnue

Directions futures

Assouplissement des conditions : Recherche de conditions de convergence plus générales
Optimisation computationnelle : Développement d'algorithmes plus efficaces pour la vérification des conditions
Extension non-gaussienne : Généralisation des résultats à d'autres familles de distributions

Évaluation approfondie

Points forts

Rigueur théorique : Fourniture d'un cadre de preuve mathématique complet, allant de la généralisation du lemme du déterminant matriciel au théorème principal
Valeur pratique : Résolution de problèmes réels dans les modèles graphiques, particulièrement l'application de l'équation de Lyapunov continue
Innovation méthodologique : Combinaison ingénieuse de l'analyse matricielle, de la théorie des probabilités et de la théorie des graphes
Clarté rédactionnelle : Structure claire de l'article, exemples abondants, facilitant la compréhension

Insuffisances

Complexité des conditions : La vérification des conditions du théorème peut être difficile, particulièrement le calcul de la fonction $f$
Limitations applicatives : Principalement applicable aux structures matricielles spécifiques, la généralité reste à améliorer
Stabilité numérique : Pour les matrices proches de la singularité, les calculs numériques peuvent présenter des problèmes de stabilité

Impact potentiel

Contribution théorique : Fourniture de nouveaux outils mathématiques pour la convergence des distributions conditionnelles sous limites singulières
Perspectives applicatives : Valeur applicative potentielle dans les modèles graphiques, l'analyse des séries chronologiques et d'autres domaines
Inspiration méthodologique : Fourniture de nouvelles approches pour traiter les problèmes de limites matricielles similaires

Scénarios d'application

Analyse des modèles graphiques : Particulièrement les modèles définis par l'équation de Lyapunov continue
Séries chronologiques : Séries chronologiques multivariées avec structures de covariance spécifiques
Inférence statistique : Problèmes statistiques nécessitant l'analyse du comportement limite des distributions conditionnelles

Références

L'article cite plusieurs travaux connexes importants, notamment :

Ben-Israel et Greville (2003) : Théorie des inverses généralisées
Lauritzen (1996, 2024) : Théorie des modèles graphiques et distributions conditionnelles
Boege et al. (2025) : Application de l'indépendance conditionnelle aux processus de diffusion
Stewart (1969) : Théorie de la continuité des inverses généralisées

Cet article apporte des contributions importantes tant sur le plan théorique qu'applicatif, fournissant de nouveaux outils mathématiques pour comprendre le comportement des distributions conditionnelles sous limites singulières, et s'applique avec succès à l'analyse de l'indépendance conditionnelle dans les modèles graphiques.