2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic

Sur le principe d'invariance par permutation pour les estimands causaux

Informations fondamentales

  • ID de l'article : 2510.11863
  • Titre : On the permutation invariance principle for causal estimands
  • Auteurs : Jiaqi Tong, Fan Li (Yale University School of Public Health)
  • Classification : stat.ME (Statistique - Méthodologie)
  • Date de publication : 15 octobre 2025 (prépublication arXiv)
  • Lien de l'article : https://arxiv.org/abs/2510.11863

Résumé

Dans de nombreux problèmes d'inférence causale, plusieurs variables d'action possèdent des effets causaux identiques (tels que les variables médiatrices, les facteurs, les unités de réseau ou les génotypes), mais manquent d'un ordre naturel. Pour éviter les ambiguïtés d'interprétation, les estimands causaux doivent rester invariants sous réétiquetage, un principe implicite appelé invariance par permutation. Cet article caractérise formellement ce principe, analyse les méthodes de vérification de ses structures algébriques et combinatoires, et propose une classe d'estimateurs pondérés qui sont à la fois invariants par permutation et capables de capturer les interactions de tous les ordres. Des orientations supplémentaires sont fournies pour le choix des poids, permettant aux estimateurs sans résidu d'inclusion-exclusion de capturer l'effet maximal, et les résultats sont étendus aux mesures d'effet de ratio.

Contexte et motivation de la recherche

Formulation du problème

L'inférence causale moderne rencontre fréquemment des situations complexes où plusieurs variables possèdent le même type d'interprétation causale, notamment :

  1. Analyse de médiation causale multivariée : plusieurs variables médiatrices non ordonnées
  2. Expériences factorielles : plusieurs variables factorielles
  3. Inférence causale sous interférence de réseau : plusieurs unités de réseau
  4. Randomisation mendélienne : plusieurs génotypes (variables instrumentales)

Problème central

Lorsque ces variables ne possèdent pas d'ordre intrinsèque, une considération clé est que l'estimand causal doit être invariant par permutation, c'est-à-dire que la définition de l'estimand ne doit pas changer en fonction du réétiquetage des variables. Cependant, dans la littérature existante :

  • Le principe d'invariance par permutation n'est mentionné que de manière informelle (par exemple, les « estimateurs symétriques » dans Xia et Chan (2022))
  • Il manque une définition formelle et une étude systématique
  • Les pratiques peu rigoureuses peuvent produire des estimands dépendant des étiquettes, entraînant des ambiguïtés d'interprétation

Motivation de la recherche

Résoudre le problème de la dépendance à l'égard des étiquettes de variables multiples en inférence causale, établir les fondations théoriques de l'invariance par permutation, et fournir des principes directeurs explicites pour la pratique.

Contributions principales

  1. Contribution théorique : première caractérisation rigoureuse du principe d'invariance par permutation, comblant un vide théorique dans la littérature
  2. Méthodes de vérification : proposition de procédures simples et directes pour vérifier si un ensemble d'estimands donné satisfait l'invariance par permutation
  3. Classe d'estimateurs complète : développement d'une classe interprétable, invariante par permutation et complète d'estimateurs pondérés, applicable à divers domaines de l'inférence causale
  4. Absence de résidu : identification des choix de poids spécifiques produisant un estimateur unique sans résidu dont la somme d'inclusion-exclusion capture l'effet maximal
  5. Extension aux mesures de ratio : extension des résultats aux mesures d'effet de ratio telles que le risque relatif et l'odds ratio

Détails méthodologiques

Définition de la tâche

Étant donné K variables d'action X = {X₁, ..., Xₖ}, chacune ayant deux états Xₖ(1) et Xₖ(0), l'objectif est de définir des estimands causaux invariants par permutation qui restent inchangés sous réétiquetage des variables.

Cadre algébrique

Concepts fondamentaux

  1. Représentation par ensemble puissance : utilisation de l'ensemble puissance 2^X pour indexer les 2^K états
  2. Relation d'équivalence : définition de la relation d'équivalence ~ telle que A ~ B si et seulement si |A|=|B|
  3. Classes d'équivalence : A = {B ∈ 2^X : |B| = |A|}, pouvant être indexées de manière unique par la cardinalité q comme q
  4. Ensemble quotient : Q := {q : 0 ≤ q ≤ K}

Définition de l'invariance par permutation

Définition 1 (Matrice de permutation) : une matrice de permutation est une matrice binaire carrée ayant exactement un 1 par ligne et par colonne.

Définition 2 (Invariance par permutation) : un vecteur de contraste Δ est invariant par permutation si et seulement si pour toute matrice de permutation de colonne induite Pₒ, il existe une matrice de permutation de ligne Pᵣ telle que PᵣH = HPₒ.

Algorithme de vérification

Fondements théoriques

Théorème 1 : un vecteur de contraste Δ est invariant par permutation si et seulement si pour tout σ ∈ P, R(HPₒ) = R(H), où R(H) est le multi-ensemble de lignes de la matrice génératrice H.

Algorithme de vérification

Algorithme 1 :

  1. Calculer H' = HPₒ
  2. Pour i = 1 à d, définir σ(i) = j tel que rᵢ = r'ⱼ
  3. Produire Pᵣ correspondant à la permutation σ

Classe d'estimateurs complète

Définition des estimateurs pondérés

Définition 3 : la classe d'estimateurs complète interprétable pour K variables d'action est :

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

où w est une fonction de poids normalisée.

Deux types de poids

  1. Poids permutables : les poids se permutent conjointement avec les variables d'action
  2. Poids invariants : les poids restent inchangés sous permutation des variables d'action

Théorème 2 :

  • Pour les poids permutables : la sous-classe {ΔY : Y ∈ q} est invariante par permutation
  • Pour les poids invariants : des conditions supplémentaires sont nécessaires pour garantir l'invariance par permutation
  • La classe complète {ΔY : ∅ ≠ Y ∈ 2^X} est à la fois invariante par permutation et complète

Estimateurs sans résidu

Définition de l'absence de résidu

Définition 4 : une classe d'estimateurs Δ est sans résidu si sa somme d'inclusion-exclusion égale l'effet maximal :

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

Résultat d'unicité

Théorème 3 : pour la classe d'estimateurs avec poids invariants, le résidu est nul si et seulement si w(T,Y) = 1(T = ∅) et ΔY = Σ(Z⊆Y) (-1)^|Z| f(Z).

Configuration expérimentale

Domaines d'application

L'article valide principalement la méthode par des exemples théoriques et des preuves mathématiques, couvrant :

  1. Analyse de médiation causale : cas de K=2 et K=3 variables médiatrices multiples
  2. Expériences factorielles : plans factoriels 2^K
  3. Interférence de réseau : analyse de réseau multi-unités
  4. Randomisation mendélienne : analyse multi-génotypes

Méthodes de vérification

  • Vérification algébrique : validation de l'invariance par permutation via opérations matricielles
  • Vérification combinatoire : utilisation de méthodes de comptage multi-ensembles
  • Analyse de cas : calculs détaillés pour les cas K=2,3

Résultats expérimentaux

Vérification de l'invariance par permutation

Exemple 1 vs Exemple 2 :

  • Estimand de Lange et al. (2014) : ne satisfait pas l'invariance par permutation
  • Effet indirect de sortie de Xia et Chan (2022) : satisfait l'invariance par permutation

Effets du choix des poids

Absence de résidu :

  • Le poids ponctuel w(T,Y) = 1(T = ∅) produit un estimateur unique sans résidu
  • D'autres choix de poids produisent des effets résiduels non nuls

Extension aux mesures de ratio

Corollaires 1-2 montrent :

  • Risque relatif : ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
  • Odds ratio : structure multiplicative correspondante

Travaux connexes

Recherches existantes

  1. Analyse de médiation causale : Lange et al. (2014), Xia et Chan (2022)
  2. Expériences factorielles : Dasgupta et al. (2015), Zhao et Ding (2022)
  3. Interférence de réseau : Hudgens et Halloran (2008)
  4. Randomisation mendélienne : Hartwig et al. (2017)

Contributions de cet article

  • Première définition formelle de l'invariance par permutation
  • Unification des estimands dans différents domaines
  • Fourniture de méthodes systématiques de vérification et de construction

Conclusions et discussion

Conclusions principales

  1. L'invariance par permutation est un principe fondamental en inférence causale
  2. Elle peut être vérifiée par simple comptage multi-ensembles
  3. Il existe une classe unique d'estimateurs sans résidu
  4. La méthode s'applique à plusieurs domaines de l'inférence causale

Limitations

  1. Actuellement limité aux variables d'action à deux états
  2. Le cadre théorique nécessite une extension aux cas multi-états
  3. La complexité computationnelle en application pratique n'est pas suffisamment discutée

Directions futures

  1. Extension aux expériences factorielles multi-catégories
  2. Traitement de l'analyse multi-médiatrices avec traitements ordonnés
  3. Développement d'algorithmes plus efficaces sur le plan computationnel

Évaluation approfondie

Avantages

  1. Rigueur théorique : première caractérisation mathématique rigoureuse de l'invariance par permutation
  2. Généralité de la méthode : cadre unifié applicable à plusieurs domaines de l'inférence causale
  3. Valeur pratique : fourniture d'algorithmes de vérification explicites et de méthodes de construction
  4. Complétude : système théorique complet allant de la définition à la vérification et à la construction

Insuffisances

  1. Limitation de la portée d'application : restriction aux variables à deux états
  2. Validation empirique insuffisante : dépendance principalement sur les preuves théoriques, manque de validation sur données réelles à grande échelle
  3. Complexité computationnelle : problèmes d'efficacité computationnelle pour les grandes valeurs de K insuffisamment discutés

Impact

  1. Contribution théorique : fourniture de fondations théoriques importantes pour l'inférence causale
  2. Orientation pratique : fourniture de méthodes concrètes pour éviter la dépendance aux étiquettes
  3. Application transdisciplinaire : unification de la méthodologie dans plusieurs sous-domaines

Scénarios d'application

  1. Analyse causale avec variables médiatrices multiples
  2. Conception expérimentale avec facteurs non ordonnés
  3. Inférence causale sur données de réseau
  4. Randomisation mendélienne avec variables instrumentales multiples

Références

  1. Xia, F. et Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
  2. Zhao, A. et Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
  3. Dasgupta, T., Pillai, N. S., et Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
  4. Hudgens, M. G. et Halloran, M. E. (2008). Toward causal inference with interference. JASA.