On the permutation invariance principle for causal estimands
Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic
Sur le principe d'invariance par permutation pour les estimands causaux
Dans de nombreux problèmes d'inférence causale, plusieurs variables d'action possèdent des effets causaux identiques (tels que les variables médiatrices, les facteurs, les unités de réseau ou les génotypes), mais manquent d'un ordre naturel. Pour éviter les ambiguïtés d'interprétation, les estimands causaux doivent rester invariants sous réétiquetage, un principe implicite appelé invariance par permutation. Cet article caractérise formellement ce principe, analyse les méthodes de vérification de ses structures algébriques et combinatoires, et propose une classe d'estimateurs pondérés qui sont à la fois invariants par permutation et capables de capturer les interactions de tous les ordres. Des orientations supplémentaires sont fournies pour le choix des poids, permettant aux estimateurs sans résidu d'inclusion-exclusion de capturer l'effet maximal, et les résultats sont étendus aux mesures d'effet de ratio.
L'inférence causale moderne rencontre fréquemment des situations complexes où plusieurs variables possèdent le même type d'interprétation causale, notamment :
Analyse de médiation causale multivariée : plusieurs variables médiatrices non ordonnées
Expériences factorielles : plusieurs variables factorielles
Inférence causale sous interférence de réseau : plusieurs unités de réseau
Randomisation mendélienne : plusieurs génotypes (variables instrumentales)
Lorsque ces variables ne possèdent pas d'ordre intrinsèque, une considération clé est que l'estimand causal doit être invariant par permutation, c'est-à-dire que la définition de l'estimand ne doit pas changer en fonction du réétiquetage des variables. Cependant, dans la littérature existante :
Le principe d'invariance par permutation n'est mentionné que de manière informelle (par exemple, les « estimateurs symétriques » dans Xia et Chan (2022))
Il manque une définition formelle et une étude systématique
Les pratiques peu rigoureuses peuvent produire des estimands dépendant des étiquettes, entraînant des ambiguïtés d'interprétation
Résoudre le problème de la dépendance à l'égard des étiquettes de variables multiples en inférence causale, établir les fondations théoriques de l'invariance par permutation, et fournir des principes directeurs explicites pour la pratique.
Contribution théorique : première caractérisation rigoureuse du principe d'invariance par permutation, comblant un vide théorique dans la littérature
Méthodes de vérification : proposition de procédures simples et directes pour vérifier si un ensemble d'estimands donné satisfait l'invariance par permutation
Classe d'estimateurs complète : développement d'une classe interprétable, invariante par permutation et complète d'estimateurs pondérés, applicable à divers domaines de l'inférence causale
Absence de résidu : identification des choix de poids spécifiques produisant un estimateur unique sans résidu dont la somme d'inclusion-exclusion capture l'effet maximal
Extension aux mesures de ratio : extension des résultats aux mesures d'effet de ratio telles que le risque relatif et l'odds ratio
Étant donné K variables d'action X = {X₁, ..., Xₖ}, chacune ayant deux états Xₖ(1) et Xₖ(0), l'objectif est de définir des estimands causaux invariants par permutation qui restent inchangés sous réétiquetage des variables.
Définition 1 (Matrice de permutation) : une matrice de permutation est une matrice binaire carrée ayant exactement un 1 par ligne et par colonne.
Définition 2 (Invariance par permutation) : un vecteur de contraste Δ est invariant par permutation si et seulement si pour toute matrice de permutation de colonne induite Pₒ, il existe une matrice de permutation de ligne Pᵣ telle que PᵣH = HPₒ.
Théorème 1 : un vecteur de contraste Δ est invariant par permutation si et seulement si pour tout σ ∈ P, R(HPₒ) = R(H), où R(H) est le multi-ensemble de lignes de la matrice génératrice H.
Xia, F. et Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
Zhao, A. et Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
Dasgupta, T., Pillai, N. S., et Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
Hudgens, M. G. et Halloran, M. E. (2008). Toward causal inference with interference. JASA.