2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li

In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.

academic

Über das Permutationsinvarianzbrinzip für kausale Schätzgrößen

Grundinformationen

Papier-ID: 2510.11863
Titel: On the permutation invariance principle for causal estimands
Autoren: Jiaqi Tong, Fan Li (Yale University School of Public Health)
Klassifizierung: stat.ME (Statistik - Methodik)
Veröffentlichungsdatum: 15. Oktober 2025 (arXiv-Preprint)
Papierlink: https://arxiv.org/abs/2510.11863

Zusammenfassung

In vielen kausalen Inferenzproblemen haben mehrere Aktionsvariablen die gleiche kausale Wirkung (wie Mediatorvariablen, Faktoren, Netzwerkeinheiten oder Genotypen), aber es fehlt eine natürliche Ordnung. Um interpretative Mehrdeutigkeiten zu vermeiden, sollten kausale Schätzgrößen unter Umbenennungen invariant bleiben – ein implizites Prinzip, das als Permutationsinvarianz bezeichnet wird. Dieses Papier charakterisiert dieses Prinzip formal, analysiert Verifikationsmethoden für seine algebraischen und kombinatorischen Strukturen und schlägt eine Klasse gewichteter Schätzgrößen vor, die sowohl permutationsinvariant sind als auch Wechselwirkungen aller Ordnungen erfassen. Darüber hinaus werden Richtlinien zur Gewichtswahl bereitgestellt, sodass residuenfreie Schätzgrößen die Inklusions-Exklusions-Summe erfassen, die maximale Effekte erfasst, und die Ergebnisse werden auf Verhältniseffektmaße erweitert.

Forschungshintergrund und Motivation

Problemstellung

Die moderne kausale Inferenz stößt häufig auf komplexe Situationen, in denen mehrere Variablen die gleiche Art kausaler Interpretation haben, einschließlich:

Kausale Mediationsanalyse mit mehreren Mediatoren: Mehrere ungeordnete Mediatorvariablen
Faktorielle Experimente: Mehrere Faktorvariablen
Kausale Inferenz unter Netzwerkinterferenz: Mehrere Netzwerkeinheiten
Mendelsche Randomisierung: Mehrere Genotypen (Instrumentalvariablen)

Kernproblem

Wenn diese Variablen keine inhärente Ordnung haben, ist eine Schlüsselüberlegung, dass kausale Schätzgrößen permutationsinvariant sein sollten, d. h. die Definition der Schätzgröße sollte sich nicht durch Umbenennungen von Variablen ändern. In der bestehenden Literatur jedoch:

Das Permutationsinvarianzbrinzip wird nur informell erwähnt (z. B. „symmetrische Schätzgrößen" in Xia und Chan (2022))
Es fehlt eine formale Definition und systematische Untersuchung
Unvorsichtige Praktiken können zu markierungsabhängigen Schätzgrößen führen, was zu interpretativen Mehrdeutigkeiten führt

Forschungsmotivation

Lösung des Problems der Markierungsabhängigkeit mehrerer Variablen in der kausalen Inferenz, Etablierung einer theoretischen Grundlage für Permutationsinvarianz und Bereitstellung klarer Richtlinienprinzipien für die Praxis.

Kernbeiträge

Theoretischer Beitrag: Erstmalige strenge Charakterisierung des Permutationsinvarianzbrinzips, Schließung einer Lücke in der Literatur
Verifikationsmethoden: Vorschlag einfacher und direkter Verfahren zur Überprüfung, ob eine gegebene Schätzgrößenmenge Permutationsinvarianz erfüllt
Vollständige Schätzgrößenklasse: Entwicklung einer interpretierbaren, permutationsinvarianten und vollständigen gewichteten Schätzgrößenklasse, anwendbar auf verschiedene Bereiche der kausalen Inferenz
Residuenfreiheit: Identifikation spezifischer Gewichtswahlen, die eindeutige residuenfreie Schätzgrößen erzeugen, deren Inklusions-Exklusions-Summe maximale Effekte erfasst
Erweiterung auf Verhältnismaße: Erweiterung der Ergebnisse auf Verhältniseffektmaße wie Risikoquoten und Odds Ratios

Methodische Details

Aufgabendefinition

Gegeben K Aktionsvariablen X = {X₁, ..., Xₖ}, wobei jede Variable zwei Zustände Xₖ(1) und Xₖ(0) hat, besteht das Ziel darin, permutationsinvariante kausale Schätzgrößen zu definieren, die unter Variablenumbenennungen invariant bleiben.

Algebraischer Rahmen

Grundkonzepte

Potenzmengen-Darstellung: Verwendung der Potenzmenge 2^X zur Indizierung aller 2^K Zustände
Äquivalenzrelation: Definition einer Äquivalenzrelation ~, sodass A ~ B genau dann, wenn |A| = |B|
Äquivalenzklassen: A = {B ∈ 2^X : |B| = |A|}, eindeutig indizierbar durch Kardinalität q als q
Quotientenmenge: Q := {q : 0 ≤ q ≤ K}

Definition der Permutationsinvarianz

Definition 1 (Permutationsmatrix): Eine Permutationsmatrix ist eine quadratische Binärmatrix, in der jede Zeile und jede Spalte genau eine 1 enthält.

Definition 2 (Permutationsinvarianz): Ein Kontrastvektor Δ ist permutationsinvariant, wenn und nur wenn für jede induzierte Spaltenvertauschungsmatrix Pₒ eine Zeilenvertauschungsmatrix Pᵣ existiert, sodass PᵣH = HPₒ.

Verifikationsalgorithmus

Theoretische Grundlagen

Satz 1: Ein Kontrastvektor Δ ist permutationsinvariant genau dann, wenn für alle σ ∈ P, R(HPₒ) = R(H), wobei R(H) die Zeilenmultimenge der Generatormatrix H ist.

Verifikationsalgorithmus

Algorithmus 1:

Berechne H' = HPₒ
Für i = 1 bis d, setze σ(i) = j sodass rᵢ = r'ⱼ
Gebe Pᵣ aus, das der Permutation σ entspricht

Vollständige Schätzgrößenklasse

Definition gewichteter Schätzgrößen

Definition 3: Die interpretierbare vollständige Schätzgrößenklasse für K Aktionsvariablen ist:

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

wobei w eine normalisierte Gewichtsfunktion ist.

Zwei Gewichtstypen

Permutierbare Gewichte: Gewichte, die mit Aktionsvariablenvertauschungen konsistent sind
Invariante Gewichte: Gewichte, die unter Aktionsvariablenvertauschungen invariant bleiben

Satz 2:

Für permutierbare Gewichte: Die Unterklasse {ΔY : Y ∈ q} ist permutationsinvariant
Für invariante Gewichte: Zusätzliche Bedingungen sind erforderlich, um Permutationsinvarianz zu gewährleisten
Die vollständige Klasse {ΔY : ∅ ≠ Y ∈ 2^X} ist sowohl permutationsinvariant als auch vollständig

Residuenfreie Schätzgrößen

Definition der Residuenfreiheit

Definition 4: Eine Schätzgrößenklasse Δ ist residuenfrei, wenn ihre Inklusions-Exklusions-Summe dem maximalen Effekt entspricht:

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

Kausale Mediationsanalyse: Mehrere Mediatorvariablen für K=2 und K=3
Faktorielle Experimente: 2^K faktorielle Designs
Netzwerkinterferenz: Mehreinheiten-Netzwerkanalyse
Mendelsche Randomisierung: Mehrgenotyp-Analyse

Validierungsmethoden

Algebraische Validierung: Verifikation der Permutationsinvarianz durch Matrixoperationen
Kombinatorische Validierung: Verwendung von Multimengen-Zählmethoden
Fallanalysen: Detaillierte Berechnungen für K=2,3 Fälle

Experimentelle Ergebnisse

Verifikation der Permutationsinvarianz

Beispiel 1 vs. Beispiel 2:

Schätzgröße von Lange et al. (2014): Erfüllt nicht die Permutationsinvarianz
Austrittsindirekte Effekte von Xia und Chan (2022): Erfüllt die Permutationsinvarianz

Auswirkungen der Gewichtswahl

Residuenfreiheit:

Punktmasse-Gewichte w(T,Y) = 1(T = ∅) erzeugen eindeutige residuenfreie Schätzgrößen
Andere Gewichtswahlen erzeugen Nicht-Null-Residueneffekte

Erweiterung auf Verhältnismaße

Korollare 1-2 zeigen:

Risikoquote: ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
Odds Ratio: Entsprechende multiplikative Struktur

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Permutationsinvarianz ist ein grundlegendes Prinzip in der kausalen Inferenz
Kann durch einfaches Multimengen-Zählen verifiziert werden
Es existiert eine eindeutige residuenfreie Schätzgrößenklasse
Die Methode ist auf mehrere Bereiche der kausalen Inferenz anwendbar

Einschränkungen

Derzeit nur für binäre Aktionsvariablen berücksichtigt
Theoretischer Rahmen muss auf Mehrstaaten-Fälle erweitert werden
Rechenkomplexität in praktischen Anwendungen nicht ausreichend diskutiert

Zukünftige Richtungen

Erweiterung auf mehrklassige Faktorexperimente
Behandlung geordneter Behandlungen in der Mehrmediatoren-Analyse
Entwicklung rechnerisch effizienterer Algorithmen

Tiefgreifende Bewertung

Stärken

Theoretische Strenge: Erstmalige strenge mathematische Charakterisierung der Permutationsinvarianz
Methodische Allgemeingültigkeit: Einheitlicher Rahmen anwendbar auf mehrere Bereiche der kausalen Inferenz
Praktischer Wert: Bereitstellung expliziter Verifikationsalgorithmen und Konstruktionsmethoden
Vollständigkeit: Vollständiges theoretisches System von Definition bis Verifikation bis Konstruktion

Mängel

Begrenzte Anwendungsbereiche: Nur auf binäre Variablen beschränkt
Unzureichende empirische Validierung: Hauptsächlich auf theoretische Beweise gestützt, mangelnde Validierung mit großen realen Datensätzen
Rechenkomplexität: Rechnerische Effizienzfragen für große K-Werte nicht ausreichend diskutiert

Einfluss

Theoretischer Beitrag: Bietet wichtige theoretische Grundlagen für die kausale Inferenz
Praktische Anleitung: Bereitstellung konkreter Methoden zur Vermeidung von Markierungsabhängigkeit
Bereichsübergreifende Anwendung: Vereinheitlichung der Methodik über mehrere Unterbereiche

Anwendungsszenarien

Kausale Analyse mit mehreren Mediatorvariablen
Experimentelles Design mit ungeordneten Faktoren
Kausale Inferenz mit Netzwerkdaten
Mendelsche Randomisierung mit mehreren Instrumentalvariablen

Literaturverzeichnis

Xia, F. und Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
Zhao, A. und Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
Dasgupta, T., Pillai, N. S. und Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
Hudgens, M. G. und Halloran, M. E. (2008). Toward causal inference with interference. JASA.