2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic

Über das Permutationsinvarianzbrinzip für kausale Schätzgrößen

Grundinformationen

  • Papier-ID: 2510.11863
  • Titel: On the permutation invariance principle for causal estimands
  • Autoren: Jiaqi Tong, Fan Li (Yale University School of Public Health)
  • Klassifizierung: stat.ME (Statistik - Methodik)
  • Veröffentlichungsdatum: 15. Oktober 2025 (arXiv-Preprint)
  • Papierlink: https://arxiv.org/abs/2510.11863

Zusammenfassung

In vielen kausalen Inferenzproblemen haben mehrere Aktionsvariablen die gleiche kausale Wirkung (wie Mediatorvariablen, Faktoren, Netzwerkeinheiten oder Genotypen), aber es fehlt eine natürliche Ordnung. Um interpretative Mehrdeutigkeiten zu vermeiden, sollten kausale Schätzgrößen unter Umbenennungen invariant bleiben – ein implizites Prinzip, das als Permutationsinvarianz bezeichnet wird. Dieses Papier charakterisiert dieses Prinzip formal, analysiert Verifikationsmethoden für seine algebraischen und kombinatorischen Strukturen und schlägt eine Klasse gewichteter Schätzgrößen vor, die sowohl permutationsinvariant sind als auch Wechselwirkungen aller Ordnungen erfassen. Darüber hinaus werden Richtlinien zur Gewichtswahl bereitgestellt, sodass residuenfreie Schätzgrößen die Inklusions-Exklusions-Summe erfassen, die maximale Effekte erfasst, und die Ergebnisse werden auf Verhältniseffektmaße erweitert.

Forschungshintergrund und Motivation

Problemstellung

Die moderne kausale Inferenz stößt häufig auf komplexe Situationen, in denen mehrere Variablen die gleiche Art kausaler Interpretation haben, einschließlich:

  1. Kausale Mediationsanalyse mit mehreren Mediatoren: Mehrere ungeordnete Mediatorvariablen
  2. Faktorielle Experimente: Mehrere Faktorvariablen
  3. Kausale Inferenz unter Netzwerkinterferenz: Mehrere Netzwerkeinheiten
  4. Mendelsche Randomisierung: Mehrere Genotypen (Instrumentalvariablen)

Kernproblem

Wenn diese Variablen keine inhärente Ordnung haben, ist eine Schlüsselüberlegung, dass kausale Schätzgrößen permutationsinvariant sein sollten, d. h. die Definition der Schätzgröße sollte sich nicht durch Umbenennungen von Variablen ändern. In der bestehenden Literatur jedoch:

  • Das Permutationsinvarianzbrinzip wird nur informell erwähnt (z. B. „symmetrische Schätzgrößen" in Xia und Chan (2022))
  • Es fehlt eine formale Definition und systematische Untersuchung
  • Unvorsichtige Praktiken können zu markierungsabhängigen Schätzgrößen führen, was zu interpretativen Mehrdeutigkeiten führt

Forschungsmotivation

Lösung des Problems der Markierungsabhängigkeit mehrerer Variablen in der kausalen Inferenz, Etablierung einer theoretischen Grundlage für Permutationsinvarianz und Bereitstellung klarer Richtlinienprinzipien für die Praxis.

Kernbeiträge

  1. Theoretischer Beitrag: Erstmalige strenge Charakterisierung des Permutationsinvarianzbrinzips, Schließung einer Lücke in der Literatur
  2. Verifikationsmethoden: Vorschlag einfacher und direkter Verfahren zur Überprüfung, ob eine gegebene Schätzgrößenmenge Permutationsinvarianz erfüllt
  3. Vollständige Schätzgrößenklasse: Entwicklung einer interpretierbaren, permutationsinvarianten und vollständigen gewichteten Schätzgrößenklasse, anwendbar auf verschiedene Bereiche der kausalen Inferenz
  4. Residuenfreiheit: Identifikation spezifischer Gewichtswahlen, die eindeutige residuenfreie Schätzgrößen erzeugen, deren Inklusions-Exklusions-Summe maximale Effekte erfasst
  5. Erweiterung auf Verhältnismaße: Erweiterung der Ergebnisse auf Verhältniseffektmaße wie Risikoquoten und Odds Ratios

Methodische Details

Aufgabendefinition

Gegeben K Aktionsvariablen X = {X₁, ..., Xₖ}, wobei jede Variable zwei Zustände Xₖ(1) und Xₖ(0) hat, besteht das Ziel darin, permutationsinvariante kausale Schätzgrößen zu definieren, die unter Variablenumbenennungen invariant bleiben.

Algebraischer Rahmen

Grundkonzepte

  1. Potenzmengen-Darstellung: Verwendung der Potenzmenge 2^X zur Indizierung aller 2^K Zustände
  2. Äquivalenzrelation: Definition einer Äquivalenzrelation ~, sodass A ~ B genau dann, wenn |A| = |B|
  3. Äquivalenzklassen: A = {B ∈ 2^X : |B| = |A|}, eindeutig indizierbar durch Kardinalität q als q
  4. Quotientenmenge: Q := {q : 0 ≤ q ≤ K}

Definition der Permutationsinvarianz

Definition 1 (Permutationsmatrix): Eine Permutationsmatrix ist eine quadratische Binärmatrix, in der jede Zeile und jede Spalte genau eine 1 enthält.

Definition 2 (Permutationsinvarianz): Ein Kontrastvektor Δ ist permutationsinvariant, wenn und nur wenn für jede induzierte Spaltenvertauschungsmatrix Pₒ eine Zeilenvertauschungsmatrix Pᵣ existiert, sodass PᵣH = HPₒ.

Verifikationsalgorithmus

Theoretische Grundlagen

Satz 1: Ein Kontrastvektor Δ ist permutationsinvariant genau dann, wenn für alle σ ∈ P, R(HPₒ) = R(H), wobei R(H) die Zeilenmultimenge der Generatormatrix H ist.

Verifikationsalgorithmus

Algorithmus 1:

  1. Berechne H' = HPₒ
  2. Für i = 1 bis d, setze σ(i) = j sodass rᵢ = r'ⱼ
  3. Gebe Pᵣ aus, das der Permutation σ entspricht

Vollständige Schätzgrößenklasse

Definition gewichteter Schätzgrößen

Definition 3: Die interpretierbare vollständige Schätzgrößenklasse für K Aktionsvariablen ist:

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

wobei w eine normalisierte Gewichtsfunktion ist.

Zwei Gewichtstypen

  1. Permutierbare Gewichte: Gewichte, die mit Aktionsvariablenvertauschungen konsistent sind
  2. Invariante Gewichte: Gewichte, die unter Aktionsvariablenvertauschungen invariant bleiben

Satz 2:

  • Für permutierbare Gewichte: Die Unterklasse {ΔY : Y ∈ q} ist permutationsinvariant
  • Für invariante Gewichte: Zusätzliche Bedingungen sind erforderlich, um Permutationsinvarianz zu gewährleisten
  • Die vollständige Klasse {ΔY : ∅ ≠ Y ∈ 2^X} ist sowohl permutationsinvariant als auch vollständig

Residuenfreie Schätzgrößen

Definition der Residuenfreiheit

Definition 4: Eine Schätzgrößenklasse Δ ist residuenfrei, wenn ihre Inklusions-Exklusions-Summe dem maximalen Effekt entspricht:

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

Eindeutigkeitsergebnis

Satz 3: Für die Schätzgrößenklasse mit invarianten Gewichten ist das Residuum genau dann null, wenn w(T,Y) = 1(T = ∅) und ΔY = Σ(Z⊆Y) (-1)^|Z| f(Z).

Experimentelle Einrichtung

Anwendungsbereiche

Das Papier validiert die Methode hauptsächlich durch theoretische Beispiele und mathematische Beweise und behandelt:

  1. Kausale Mediationsanalyse: Mehrere Mediatorvariablen für K=2 und K=3
  2. Faktorielle Experimente: 2^K faktorielle Designs
  3. Netzwerkinterferenz: Mehreinheiten-Netzwerkanalyse
  4. Mendelsche Randomisierung: Mehrgenotyp-Analyse

Validierungsmethoden

  • Algebraische Validierung: Verifikation der Permutationsinvarianz durch Matrixoperationen
  • Kombinatorische Validierung: Verwendung von Multimengen-Zählmethoden
  • Fallanalysen: Detaillierte Berechnungen für K=2,3 Fälle

Experimentelle Ergebnisse

Verifikation der Permutationsinvarianz

Beispiel 1 vs. Beispiel 2:

  • Schätzgröße von Lange et al. (2014): Erfüllt nicht die Permutationsinvarianz
  • Austrittsindirekte Effekte von Xia und Chan (2022): Erfüllt die Permutationsinvarianz

Auswirkungen der Gewichtswahl

Residuenfreiheit:

  • Punktmasse-Gewichte w(T,Y) = 1(T = ∅) erzeugen eindeutige residuenfreie Schätzgrößen
  • Andere Gewichtswahlen erzeugen Nicht-Null-Residueneffekte

Erweiterung auf Verhältnismaße

Korollare 1-2 zeigen:

  • Risikoquote: ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
  • Odds Ratio: Entsprechende multiplikative Struktur

Verwandte Arbeiten

Bestehende Forschung

  1. Kausale Mediationsanalyse: Lange et al. (2014), Xia und Chan (2022)
  2. Faktorielle Experimente: Dasgupta et al. (2015), Zhao und Ding (2022)
  3. Netzwerkinterferenz: Hudgens und Halloran (2008)
  4. Mendelsche Randomisierung: Hartwig et al. (2017)

Beitrag dieses Papiers

  • Erstmalige formale Definition der Permutationsinvarianz
  • Vereinheitlichung von Schätzgrößen aus verschiedenen Bereichen
  • Bereitstellung systematischer Verifikations- und Konstruktionsmethoden

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Permutationsinvarianz ist ein grundlegendes Prinzip in der kausalen Inferenz
  2. Kann durch einfaches Multimengen-Zählen verifiziert werden
  3. Es existiert eine eindeutige residuenfreie Schätzgrößenklasse
  4. Die Methode ist auf mehrere Bereiche der kausalen Inferenz anwendbar

Einschränkungen

  1. Derzeit nur für binäre Aktionsvariablen berücksichtigt
  2. Theoretischer Rahmen muss auf Mehrstaaten-Fälle erweitert werden
  3. Rechenkomplexität in praktischen Anwendungen nicht ausreichend diskutiert

Zukünftige Richtungen

  1. Erweiterung auf mehrklassige Faktorexperimente
  2. Behandlung geordneter Behandlungen in der Mehrmediatoren-Analyse
  3. Entwicklung rechnerisch effizienterer Algorithmen

Tiefgreifende Bewertung

Stärken

  1. Theoretische Strenge: Erstmalige strenge mathematische Charakterisierung der Permutationsinvarianz
  2. Methodische Allgemeingültigkeit: Einheitlicher Rahmen anwendbar auf mehrere Bereiche der kausalen Inferenz
  3. Praktischer Wert: Bereitstellung expliziter Verifikationsalgorithmen und Konstruktionsmethoden
  4. Vollständigkeit: Vollständiges theoretisches System von Definition bis Verifikation bis Konstruktion

Mängel

  1. Begrenzte Anwendungsbereiche: Nur auf binäre Variablen beschränkt
  2. Unzureichende empirische Validierung: Hauptsächlich auf theoretische Beweise gestützt, mangelnde Validierung mit großen realen Datensätzen
  3. Rechenkomplexität: Rechnerische Effizienzfragen für große K-Werte nicht ausreichend diskutiert

Einfluss

  1. Theoretischer Beitrag: Bietet wichtige theoretische Grundlagen für die kausale Inferenz
  2. Praktische Anleitung: Bereitstellung konkreter Methoden zur Vermeidung von Markierungsabhängigkeit
  3. Bereichsübergreifende Anwendung: Vereinheitlichung der Methodik über mehrere Unterbereiche

Anwendungsszenarien

  1. Kausale Analyse mit mehreren Mediatorvariablen
  2. Experimentelles Design mit ungeordneten Faktoren
  3. Kausale Inferenz mit Netzwerkdaten
  4. Mendelsche Randomisierung mit mehreren Instrumentalvariablen

Literaturverzeichnis

  1. Xia, F. und Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
  2. Zhao, A. und Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
  3. Dasgupta, T., Pillai, N. S. und Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
  4. Hudgens, M. G. und Halloran, M. E. (2008). Toward causal inference with interference. JASA.