2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li

In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.

academic

Sobre el principio de invariancia permutacional para estimandos causales

Información Básica

ID del Artículo: 2510.11863
Título: On the permutation invariance principle for causal estimands
Autores: Jiaqi Tong, Fan Li (Yale University School of Public Health)
Clasificación: stat.ME (Estadística - Metodología)
Fecha de Publicación: 15 de octubre de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.11863

Resumen

En muchos problemas de inferencia causal, múltiples variables de acción poseen el mismo efecto causal (como variables mediadoras, factores, unidades de red o genotipos), pero carecen de un ordenamiento natural. Para evitar ambigüedad interpretativa, los estimandos causales deben permanecer invariantes bajo reetiquetado, un principio implícito denominado invariancia permutacional. Este artículo caracteriza formalmente este principio, analiza métodos de verificación de su estructura algebraica y combinatoria, y propone una clase de estimadores ponderados que son tanto invariantes permutacionales como capaces de capturar interacciones de todos los órdenes. Además, proporciona orientación para la selección de pesos de modo que la suma de inclusión-exclusión de estimadores libres de residuos capture el efecto máximo, y extiende los resultados a medidas de efectos de razón.

Contexto de Investigación y Motivación

Planteamiento del Problema

La inferencia causal moderna frecuentemente encuentra situaciones complejas donde múltiples variables poseen el mismo tipo de interpretación causal, incluyendo:

Análisis de mediación causal con múltiples mediadores: múltiples variables mediadoras sin ordenamiento
Experimentos factoriales: múltiples variables de factor
Inferencia causal bajo interferencia de red: múltiples unidades de red
Aleatorización mendeliana: múltiples genotipos (variables instrumentales)

Problema Central

Cuando estas variables carecen de ordenamiento intrínseco, una consideración clave es que los estimandos causales deben ser invariantes permutacionales, es decir, la definición del estimador no debe cambiar debido al reetiquetado de variables. Sin embargo, en la literatura existente:

El principio de invariancia permutacional se menciona únicamente de manera informal (como "estimadores simétricos" en Xia y Chan (2022))
Falta una definición formal y un estudio sistemático
Las prácticas descuidadas pueden producir estimadores dependientes de etiquetas, generando ambigüedad interpretativa

Motivación de la Investigación

Abordar el problema de la dependencia del etiquetado de múltiples variables en la inferencia causal, establecer fundamentos teóricos para la invariancia permutacional, y proporcionar principios de orientación explícitos para la práctica.

Contribuciones Principales

Contribución Teórica: Primera caracterización rigurosa del principio de invariancia permutacional, cerrando un vacío teórico en la literatura
Métodos de Verificación: Propone procedimientos simples y directos para verificar si un conjunto de estimadores dado satisface la invariancia permutacional
Clase Completa de Estimadores: Desarrolla una clase interpretable, invariante permutacional y completa de estimadores ponderados, aplicable a diversos campos de la inferencia causal
Libertad de Residuos: Identifica selecciones de pesos específicas que producen estimadores únicos libres de residuos, cuya suma de inclusión-exclusión captura el efecto máximo
Extensión a Medidas de Razón: Extiende los resultados a medidas de efectos de razón como riesgo relativo y razón de momios

Detalles Metodológicos

Definición de la Tarea

Dadas K variables de acción X = {X₁, ..., Xₖ}, cada una con dos estados Xₖ(1) y Xₖ(0), el objetivo es definir estimandos causales invariantes permutacionales que permanezcan invariantes bajo reetiquetado de variables.

Marco Algebraico

Conceptos Fundamentales

Representación de Conjunto Potencia: Utiliza el conjunto potencia 2^X para indexar los 2^K estados
Relación de Equivalencia: Define la relación de equivalencia ~, tal que A ~ B si y solo si |A| = |B|
Clases de Equivalencia: A = {B ∈ 2^X : |B| = |A|}, indexable únicamente por cardinalidad q como q
Conjunto Cociente: Q := {q : 0 ≤ q ≤ K}

Definición de Invariancia Permutacional

Definición 1 (Matriz de Permutación): Una matriz de permutación es una matriz binaria cuadrada con exactamente un 1 en cada fila y columna.

Definición 2 (Invariancia Permutacional): Un vector de contraste Δ es invariante permutacional si y solo si para toda matriz de permutación de columnas inducida Pₒ, existe una matriz de permutación de filas Pᵣ tal que PᵣH = HPₒ.

Algoritmo de Verificación

Fundamentos Teóricos

Teorema 1: Un vector de contraste Δ es invariante permutacional si y solo si para todo σ ∈ P, R(HPₒ) = R(H), donde R(H) es el multiconjunto de filas de la matriz generadora H.

Algoritmo de Verificación

Algoritmo 1:

Calcular H' = HPₒ
Para i = 1 hasta d, establecer σ(i) = j tal que rᵢ = r'ⱼ
Generar Pᵣ correspondiente a la permutación σ

Clase Completa de Estimadores

Definición de Estimadores Ponderados

Definición 3: La clase de estimadores completa interpretable para K variables de acción es:

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

donde w es una función de pesos normalizada.

Dos Tipos de Pesos

Pesos Permutables: Los pesos se transforman consistentemente con permutaciones de variables de acción
Pesos Invariantes: Los pesos permanecen invariantes bajo permutaciones de variables de acción

Teorema 2:

Para pesos permutables: la subclase {ΔY : Y ∈ q} es invariante permutacional
Para pesos invariantes: se requieren condiciones adicionales para garantizar invariancia permutacional
La clase completa {ΔY : ∅ ≠ Y ∈ 2^X} es tanto invariante permutacional como completa

Estimadores Libres de Residuos

Definición de Libertad de Residuos

Definición 4: Una clase de estimadores Δ es libre de residuos si su suma de inclusión-exclusión es igual al efecto máximo:

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

Análisis de Mediación Causal: Casos con K=2 y K=3 mediadores múltiples
Experimentos Factoriales: Diseños factoriales 2^K
Interferencia de Red: Análisis de redes multiunitarias
Aleatorización Mendeliana: Análisis de múltiples genotipos

Métodos de Verificación

Verificación algebraica: mediante operaciones matriciales
Verificación combinatoria: utilizando métodos de conteo de multiconjuntos
Análisis de casos: cálculos detallados para K=2,3

Resultados Experimentales

Verificación de Invariancia Permutacional

Ejemplo 1 vs Ejemplo 2:

Estimador de Lange et al. (2014): no satisface invariancia permutacional
Efecto indirecto de salida de Xia y Chan (2022): satisface invariancia permutacional

Efectos de Selección de Pesos

Libertad de Residuos:

Peso de masa puntual w(T,Y) = 1(T = ∅) produce el estimador único libre de residuos
Otras selecciones de pesos producen efectos residuales no nulos

Extensión a Medidas de Razón

Corolarios 1-2 demuestran:

Riesgo relativo: ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
Razón de momios: estructura multiplicativa correspondiente

Trabajo Relacionado

Investigación Existente

Análisis de Mediación Causal: Lange et al. (2014), Xia y Chan (2022)
Experimentos Factoriales: Dasgupta et al. (2015), Zhao y Ding (2022)
Interferencia de Red: Hudgens y Halloran (2008)
Aleatorización Mendeliana: Hartwig et al. (2017)

Contribuciones del Artículo

Primera definición formal de invariancia permutacional
Unificación de estimadores en diferentes campos
Métodos sistemáticos de verificación y construcción

Conclusiones y Discusión

Conclusiones Principales

La invariancia permutacional es un principio fundamental en la inferencia causal
Puede verificarse mediante conteo simple de multiconjuntos
Existe una clase única de estimadores libres de residuos
El método es aplicable a múltiples campos de la inferencia causal

Limitaciones

Actualmente solo considera variables de acción con dos estados
El marco teórico requiere extensión a casos multiestado
La complejidad computacional en aplicaciones prácticas no se ha discutido suficientemente

Direcciones Futuras

Extensión a experimentos factoriales multiclasificados
Tratamiento de análisis de múltiples mediadores con tratamientos ordenados
Desarrollo de algoritmos computacionalmente más eficientes

Evaluación Profunda

Fortalezas

Rigor Teórico: Primera caracterización matemática rigurosa de la invariancia permutacional
Generalidad del Método: Marco unificado aplicable a múltiples campos de la inferencia causal
Valor Práctico: Proporciona algoritmos de verificación explícitos y métodos de construcción
Completitud: Sistema teórico completo desde definición hasta verificación y construcción

Debilidades

Limitaciones de Alcance: Restringido a variables con dos estados
Validación Empírica Insuficiente: Depende principalmente de pruebas teóricas, carece de validación en datos reales a gran escala
Complejidad Computacional: Los problemas de eficiencia computacional para valores grandes de K no se han discutido suficientemente

Impacto

Contribución Teórica: Proporciona fundamentos teóricos importantes para la inferencia causal
Orientación Práctica: Proporciona métodos concretos para evitar dependencia del etiquetado
Aplicación Interdisciplinaria: Unifica metodología en múltiples subcampos

Escenarios Aplicables

Análisis causal con múltiples variables mediadoras
Diseño experimental con factores sin ordenamiento
Inferencia causal en datos de red
Aleatorización mendeliana con múltiples variables instrumentales

Referencias

Xia, F. y Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
Zhao, A. y Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
Dasgupta, T., Pillai, N. S., y Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
Hudgens, M. G. y Halloran, M. E. (2008). Toward causal inference with interference. JASA.