2025-11-25T13:52:17.039270

On weak convergence of Gaussian conditional distributions

Lumpp, Drton
Weak convergence of joint distributions generally does not imply convergence of conditional distributions. In particular, conditional distributions need not converge when joint Gaussian distributions converge to a singular Gaussian limit. Algebraically, this is due to the fact that at singular covariance matrices, Schur complements are not continuous functions of the matrix entries. Our results lay out special conditions under which convergence of Gaussian conditional distributions nevertheless occurs, and we exemplify how this allows one to reason about conditional independence in a new class of graphical models.
academic

Sur la convergence faible des distributions conditionnelles gaussiennes

Informations fondamentales

  • ID de l'article: 2510.12412
  • Titre: Sur la convergence faible des distributions conditionnelles gaussiennes
  • Auteurs: Sarah Lumpp, Mathias Drton
  • Classification: math.ST stat.TH
  • Date de publication: 14 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.12412

Résumé

La convergence faible d'une distribution conjointe n'implique généralement pas la convergence des distributions conditionnelles. En particulier, lorsque les distributions gaussiennes conjointes convergent vers une limite gaussienne singulière, les distributions conditionnelles ne convergent pas nécessairement. D'un point de vue algébrique, cela est dû au fait que le complément de Schur n'est pas une fonction continue des éléments de la matrice au niveau des matrices de covariance singulières. Les résultats de cet article élucident les conditions spéciales sous lesquelles les distributions conditionnelles gaussiennes convergent néanmoins, et illustrent comment cela permet de raisonner sur l'indépendance conditionnelle dans une nouvelle classe de modèles graphiques.

Contexte de recherche et motivation

Problème fondamental

Le problème fondamental abordé par cette recherche est le suivant : lorsqu'une séquence de distributions gaussiennes X(m)N(0,Σ(m))X^{(m)} \sim N(0, Σ^{(m)}) converge faiblement vers une distribution gaussienne singulière XN(0,Σ)X \sim N(0, Σ), les distributions conditionnelles N(0,ΣRS(m))N(0, Σ_{R|S}^{(m)}) convergent-elles vers N(0,ΣRS)N(0, Σ_{R|S}) ?

Importance du problème

  1. Signification théorique : La convergence des distributions conditionnelles est une question fondamentale en théorie des probabilités, essentielle pour comprendre le comportement limite des distributions
  2. Valeur applicative : Dans les modèles graphiques, l'analyse de l'indépendance conditionnelle dépend des propriétés des distributions conditionnelles, particulièrement dans les nouveaux modèles graphiques définis par l'équation de Lyapunov continue

Limitations des méthodes existantes

  1. Discontinuité dans le cas général : L'opération de pseudo-inverse ()+(·)^+ n'est pas continue aux matrices singulières, ce qui peut entraîner la non-convergence de la matrice de covariance conditionnelle ΣRS=ΣR,RΣR,S(ΣS,S)+ΣS,RΣ_{R|S} = Σ_{R,R} - Σ_{R,S}(Σ_{S,S})^+Σ_{S,R}
  2. Restrictions des cas particuliers : Les résultats connus s'appliquent principalement aux séquences de matrices de rang constant, tandis que les applications pratiques rencontrent souvent des matrices de rang complet convergeant vers des matrices singulières

Motivation de la recherche

Inspirés par les travaux de Boege et al. (2025) sur l'indépendance conditionnelle, les auteurs considèrent le cas plus difficile où chaque Σ(m)Σ^{(m)} est de rang complet, tandis que la matrice de covariance limite ΣΣ est singulière.

Contributions principales

  1. Établissement des conditions de convergence : Proposition de conditions suffisantes pour la convergence des distributions conditionnelles gaussiennes, même dans le cas de limites singulières
  2. Généralisation du lemme du déterminant matriciel : Développement d'une version généralisée du lemme du déterminant matriciel pour analyser le comportement asymptotique des matrices singulières
  3. Application aux modèles graphiques : Démonstration de l'application des résultats théoriques à l'analyse de l'indépendance conditionnelle dans les modèles graphiques définis par l'équation de Lyapunov continue
  4. Cas particulier des matrices de Toeplitz : Fourniture d'une preuve alternative intuitive pour les matrices de Toeplitz spéciales

Détail des méthodes

Définition de la tâche

Étant donnée une séquence de vecteurs aléatoires gaussiens X(m)N(0,Σ(m))X^{(m)} \sim N(0, Σ^{(m)}) convergeant faiblement vers XN(0,Σ)X \sim N(0, Σ), où Σ(m)Σ^{(m)} est inversible mais ΣΣ est singulière. Pour les sous-ensembles disjoints S,R[p]S, R ⊆ [p], déterminer si les matrices de covariance conditionnelle ΣRS(m)Σ_{R|S}^{(m)} convergent vers ΣRSΣ_{R|S}.

Résultats théoriques fondamentaux

Théorème principal (Théorème 1.2)

Soit Σ(m)Σ^{(m)} une séquence de matrices symétriques p×pp×p inversibles avec une limite singulière ΣΣ, satisfaisant le développement : Σ(m)=Σ+1mΣ(1,)+o(1m)Σ^{(m)} = Σ + \frac{1}{m}Σ^{(1,∞)} + o\left(\frac{1}{m}\right)

Pour S[p]S ⊂ [p] avec k=S<pk = |S| < p, R=[p]SR = [p] \setminus S, si les matrices ΣΣ et Σ(1,)Σ^{(1,∞)} satisfont :

(i) f(U,ΣS,S(1,))0f(U, Σ_{S,S}^{(1,∞)}) ≠ 0, où UU provient de la décomposition de rang symétrique ΣS,S=UBUTΣ_{S,S} = UBU^T
(ii) im(ΣS,R)im(ΣS,S)\text{im}(Σ_{S,R}) ⊆ \text{im}(Σ_{S,S})

alors les matrices de covariance conditionnelle ΣRS(m)Σ_{R|S}^{(m)} convergent vers ΣRSΣ_{R|S}.

Définition de la fonction clé

La fonction f:Rk×r×Rk×kRf: \mathbb{R}^{k×r} × \mathbb{R}^{k×k} → \mathbb{R} est définie par : f(U,G)=(1)s([kr])α[k]α=kr(1)s(α)det(G[k],αU)det(U[k]α,[r])f(U,G) = (-1)^{s([k-r])} \sum_{\substack{α⊆[k] \\ |α|=k-r}} (-1)^{s(α)} \det\begin{pmatrix} G_{[k],α} & U \end{pmatrix} \det(U_{[k]\setminus α,[r]})

Points d'innovation technique

1. Généralisation du lemme du déterminant matriciel

Lemme 3.1 : Pour les matrices U,VRk×rU, V ∈ \mathbb{R}^{k×r}, GRk×kG ∈ \mathbb{R}^{k×k}, BRr×rB ∈ \mathbb{R}^{r×r}, où r<kr < k : det(UBVT+1mG)=1mkrdet(B)fasy(U,V,G)+o(1mkr)\det\left(UBV^T + \frac{1}{m}G\right) = \frac{1}{m^{k-r}} \cdot \det(B) \cdot f_{\text{asy}}(U, V, G) + o\left(\frac{1}{m^{k-r}}\right)

2. Application de la règle de Cramer

En exprimant chaque élément de la matrice de covariance conditionnelle comme : vmTAm1wm=det(Am[j])det(Am)v_m^T A_m^{-1} w_m = \frac{\det(A_m[j])}{\det(A_m)} et en analysant le comportement asymptotique du numérateur et du dénominateur pour prouver la convergence.

3. Gestion du bruit

Le Lemme 3.2 traite l'effet des termes de bruit supplémentaires D(m)=o(1/m)D^{(m)} = o(1/m), assurant que le terme asymptotique principal n'est pas perturbé.

Configuration expérimentale

Scénario d'application : Équation de Lyapunov continue

Considérer les distributions gaussiennes satisfaisant l'équation de Lyapunov continue : MΣ+ΣMT+2Ip=0MΣ + ΣM^T + 2I_p = 0MM est une matrice stable dont le motif zéro encode la structure graphique.

Exemples concrets

Exemple 2.1 : Trek T4:1234T_4: 1 ← 2 → 3 → 4

Construction de la matrice stable : M4=(1100010001100011)M_4 = \begin{pmatrix} -1 & 1 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 1 & -1 & 0 \\ 0 & 0 & 1 & -1 \end{pmatrix}

Obtention de la solution : Σ4=(3/21/21/23/81/211/21/41/21/23/27/83/81/47/815/8)Σ_4 = \begin{pmatrix} 3/2 & 1/2 & 1/2 & 3/8 \\ 1/2 & 1 & 1/2 & 1/4 \\ 1/2 & 1/2 & 3/2 & 7/8 \\ 3/8 & 1/4 & 7/8 & 15/8 \end{pmatrix}

Vérification que (Σ4)1423=1/100(Σ_4)_{14|23} = 1/10 ≠ 0.

Résultats expérimentaux

Application aux matrices de Toeplitz

Pour les matrices symétriques de Toeplitz nn-dimensionnelles : Tn=(ij)i,j=1,,nT_n = (-|i-j|)_{i,j=1,\ldots,n}

Le Lemme 4.1 prouve que pour des matrices UU et GG spécifiques : f(U,G)=2k+1{1,nl}{1,nr}0f(U,G) = 2^{k+1-|\{1,n_l\}|-|\{1,n_r\}|} ≠ 0

Vérification des résultats principaux

Proposition 4.2 (Proposition 4.5 de Boege et al. 2025) : Pour tout trek de longueur arbitraire T:1pT: 1 ← ··· → p, il existe une matrice de covariance ΣΣ satisfaisant l'équation de Lyapunov continue telle que X1⊥̸XpX2,,Xp1X_1 \not\perp X_p | X_2, \ldots, X_{p-1}.

La preuve procède par construction d'une séquence de matrices M(m)M^{(m)} telle que les solutions correspondantes satisfont les conditions du Théorème 1.2, garantissant ainsi que l'indépendance conditionnelle ne tient pas.

Travaux connexes

Fondements théoriques

  1. Stewart (1969), Ben-Israel et Greville (2003) : Continuité de la pseudo-inverse pour les séquences de matrices de rang constant
  2. Lauritzen (1996, 2024) : Théorie générale de la convergence des distributions conditionnelles
  3. Bérczi et al. (2023) : Cet ouvrage généralise les résultats de leur section 7

Contexte applicatif

  1. Dettling et al. (2023), Varando et Hansen (2020) : Modèles graphiques d'équation de Lyapunov continue
  2. Boege et al. (2025) : Caractérisation de l'indépendance conditionnelle dans les modèles graphiques

Conclusions et discussion

Conclusions principales

  1. Sous certaines conditions, même si la matrice de covariance limite est singulière, les distributions conditionnelles gaussiennes peuvent converger
  2. La condition (i) assure que le dénominateur du complément de Schur ne tend pas vers zéro, tandis que la condition (ii) garantit la compatibilité des espaces images
  3. Les résultats théoriques s'appliquent avec succès à l'analyse de l'indépendance conditionnelle dans les modèles graphiques d'équation de Lyapunov continue

Limitations

  1. Restrictivité des conditions : Nécessité de satisfaire des conditions de structure matricielle spécifiques
  2. Complexité computationnelle : Le calcul de la fonction ff implique des sommes multiples, ce qui peut être difficile pour les grandes matrices
  3. Portée applicative : Principalement orienté vers les distributions gaussiennes, l'extensibilité à d'autres familles de distributions reste inconnue

Directions futures

  1. Assouplissement des conditions : Recherche de conditions de convergence plus générales
  2. Optimisation computationnelle : Développement d'algorithmes plus efficaces pour la vérification des conditions
  3. Extension non-gaussienne : Généralisation des résultats à d'autres familles de distributions

Évaluation approfondie

Points forts

  1. Rigueur théorique : Fourniture d'un cadre de preuve mathématique complet, allant de la généralisation du lemme du déterminant matriciel au théorème principal
  2. Valeur pratique : Résolution de problèmes réels dans les modèles graphiques, particulièrement l'application de l'équation de Lyapunov continue
  3. Innovation méthodologique : Combinaison ingénieuse de l'analyse matricielle, de la théorie des probabilités et de la théorie des graphes
  4. Clarté rédactionnelle : Structure claire de l'article, exemples abondants, facilitant la compréhension

Insuffisances

  1. Complexité des conditions : La vérification des conditions du théorème peut être difficile, particulièrement le calcul de la fonction ff
  2. Limitations applicatives : Principalement applicable aux structures matricielles spécifiques, la généralité reste à améliorer
  3. Stabilité numérique : Pour les matrices proches de la singularité, les calculs numériques peuvent présenter des problèmes de stabilité

Impact potentiel

  1. Contribution théorique : Fourniture de nouveaux outils mathématiques pour la convergence des distributions conditionnelles sous limites singulières
  2. Perspectives applicatives : Valeur applicative potentielle dans les modèles graphiques, l'analyse des séries chronologiques et d'autres domaines
  3. Inspiration méthodologique : Fourniture de nouvelles approches pour traiter les problèmes de limites matricielles similaires

Scénarios d'application

  1. Analyse des modèles graphiques : Particulièrement les modèles définis par l'équation de Lyapunov continue
  2. Séries chronologiques : Séries chronologiques multivariées avec structures de covariance spécifiques
  3. Inférence statistique : Problèmes statistiques nécessitant l'analyse du comportement limite des distributions conditionnelles

Références

L'article cite plusieurs travaux connexes importants, notamment :

  • Ben-Israel et Greville (2003) : Théorie des inverses généralisées
  • Lauritzen (1996, 2024) : Théorie des modèles graphiques et distributions conditionnelles
  • Boege et al. (2025) : Application de l'indépendance conditionnelle aux processus de diffusion
  • Stewart (1969) : Théorie de la continuité des inverses généralisées

Cet article apporte des contributions importantes tant sur le plan théorique qu'applicatif, fournissant de nouveaux outils mathématiques pour comprendre le comportement des distributions conditionnelles sous limites singulières, et s'applique avec succès à l'analyse de l'indépendance conditionnelle dans les modèles graphiques.