On the permutation invariance principle for causal estimands
Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic
Über das Permutationsinvarianzbrinzip für kausale Schätzgrößen
In vielen kausalen Inferenzproblemen haben mehrere Aktionsvariablen die gleiche kausale Wirkung (wie Mediatorvariablen, Faktoren, Netzwerkeinheiten oder Genotypen), aber es fehlt eine natürliche Ordnung. Um interpretative Mehrdeutigkeiten zu vermeiden, sollten kausale Schätzgrößen unter Umbenennungen invariant bleiben – ein implizites Prinzip, das als Permutationsinvarianz bezeichnet wird. Dieses Papier charakterisiert dieses Prinzip formal, analysiert Verifikationsmethoden für seine algebraischen und kombinatorischen Strukturen und schlägt eine Klasse gewichteter Schätzgrößen vor, die sowohl permutationsinvariant sind als auch Wechselwirkungen aller Ordnungen erfassen. Darüber hinaus werden Richtlinien zur Gewichtswahl bereitgestellt, sodass residuenfreie Schätzgrößen die Inklusions-Exklusions-Summe erfassen, die maximale Effekte erfasst, und die Ergebnisse werden auf Verhältniseffektmaße erweitert.
Die moderne kausale Inferenz stößt häufig auf komplexe Situationen, in denen mehrere Variablen die gleiche Art kausaler Interpretation haben, einschließlich:
Kausale Mediationsanalyse mit mehreren Mediatoren: Mehrere ungeordnete Mediatorvariablen
Faktorielle Experimente: Mehrere Faktorvariablen
Kausale Inferenz unter Netzwerkinterferenz: Mehrere Netzwerkeinheiten
Mendelsche Randomisierung: Mehrere Genotypen (Instrumentalvariablen)
Wenn diese Variablen keine inhärente Ordnung haben, ist eine Schlüsselüberlegung, dass kausale Schätzgrößen permutationsinvariant sein sollten, d. h. die Definition der Schätzgröße sollte sich nicht durch Umbenennungen von Variablen ändern. In der bestehenden Literatur jedoch:
Das Permutationsinvarianzbrinzip wird nur informell erwähnt (z. B. „symmetrische Schätzgrößen" in Xia und Chan (2022))
Es fehlt eine formale Definition und systematische Untersuchung
Unvorsichtige Praktiken können zu markierungsabhängigen Schätzgrößen führen, was zu interpretativen Mehrdeutigkeiten führt
Lösung des Problems der Markierungsabhängigkeit mehrerer Variablen in der kausalen Inferenz, Etablierung einer theoretischen Grundlage für Permutationsinvarianz und Bereitstellung klarer Richtlinienprinzipien für die Praxis.
Theoretischer Beitrag: Erstmalige strenge Charakterisierung des Permutationsinvarianzbrinzips, Schließung einer Lücke in der Literatur
Verifikationsmethoden: Vorschlag einfacher und direkter Verfahren zur Überprüfung, ob eine gegebene Schätzgrößenmenge Permutationsinvarianz erfüllt
Vollständige Schätzgrößenklasse: Entwicklung einer interpretierbaren, permutationsinvarianten und vollständigen gewichteten Schätzgrößenklasse, anwendbar auf verschiedene Bereiche der kausalen Inferenz
Residuenfreiheit: Identifikation spezifischer Gewichtswahlen, die eindeutige residuenfreie Schätzgrößen erzeugen, deren Inklusions-Exklusions-Summe maximale Effekte erfasst
Erweiterung auf Verhältnismaße: Erweiterung der Ergebnisse auf Verhältniseffektmaße wie Risikoquoten und Odds Ratios
Gegeben K Aktionsvariablen X = {X₁, ..., Xₖ}, wobei jede Variable zwei Zustände Xₖ(1) und Xₖ(0) hat, besteht das Ziel darin, permutationsinvariante kausale Schätzgrößen zu definieren, die unter Variablenumbenennungen invariant bleiben.
Definition 1 (Permutationsmatrix): Eine Permutationsmatrix ist eine quadratische Binärmatrix, in der jede Zeile und jede Spalte genau eine 1 enthält.
Definition 2 (Permutationsinvarianz): Ein Kontrastvektor Δ ist permutationsinvariant, wenn und nur wenn für jede induzierte Spaltenvertauschungsmatrix Pₒ eine Zeilenvertauschungsmatrix Pᵣ existiert, sodass PᵣH = HPₒ.
Satz 1: Ein Kontrastvektor Δ ist permutationsinvariant genau dann, wenn für alle σ ∈ P, R(HPₒ) = R(H), wobei R(H) die Zeilenmultimenge der Generatormatrix H ist.
Xia, F. und Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
Zhao, A. und Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
Dasgupta, T., Pillai, N. S. und Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
Hudgens, M. G. und Halloran, M. E. (2008). Toward causal inference with interference. JASA.