2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic

Sobre el principio de invariancia permutacional para estimandos causales

Información Básica

  • ID del Artículo: 2510.11863
  • Título: On the permutation invariance principle for causal estimands
  • Autores: Jiaqi Tong, Fan Li (Yale University School of Public Health)
  • Clasificación: stat.ME (Estadística - Metodología)
  • Fecha de Publicación: 15 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.11863

Resumen

En muchos problemas de inferencia causal, múltiples variables de acción poseen el mismo efecto causal (como variables mediadoras, factores, unidades de red o genotipos), pero carecen de un ordenamiento natural. Para evitar ambigüedad interpretativa, los estimandos causales deben permanecer invariantes bajo reetiquetado, un principio implícito denominado invariancia permutacional. Este artículo caracteriza formalmente este principio, analiza métodos de verificación de su estructura algebraica y combinatoria, y propone una clase de estimadores ponderados que son tanto invariantes permutacionales como capaces de capturar interacciones de todos los órdenes. Además, proporciona orientación para la selección de pesos de modo que la suma de inclusión-exclusión de estimadores libres de residuos capture el efecto máximo, y extiende los resultados a medidas de efectos de razón.

Contexto de Investigación y Motivación

Planteamiento del Problema

La inferencia causal moderna frecuentemente encuentra situaciones complejas donde múltiples variables poseen el mismo tipo de interpretación causal, incluyendo:

  1. Análisis de mediación causal con múltiples mediadores: múltiples variables mediadoras sin ordenamiento
  2. Experimentos factoriales: múltiples variables de factor
  3. Inferencia causal bajo interferencia de red: múltiples unidades de red
  4. Aleatorización mendeliana: múltiples genotipos (variables instrumentales)

Problema Central

Cuando estas variables carecen de ordenamiento intrínseco, una consideración clave es que los estimandos causales deben ser invariantes permutacionales, es decir, la definición del estimador no debe cambiar debido al reetiquetado de variables. Sin embargo, en la literatura existente:

  • El principio de invariancia permutacional se menciona únicamente de manera informal (como "estimadores simétricos" en Xia y Chan (2022))
  • Falta una definición formal y un estudio sistemático
  • Las prácticas descuidadas pueden producir estimadores dependientes de etiquetas, generando ambigüedad interpretativa

Motivación de la Investigación

Abordar el problema de la dependencia del etiquetado de múltiples variables en la inferencia causal, establecer fundamentos teóricos para la invariancia permutacional, y proporcionar principios de orientación explícitos para la práctica.

Contribuciones Principales

  1. Contribución Teórica: Primera caracterización rigurosa del principio de invariancia permutacional, cerrando un vacío teórico en la literatura
  2. Métodos de Verificación: Propone procedimientos simples y directos para verificar si un conjunto de estimadores dado satisface la invariancia permutacional
  3. Clase Completa de Estimadores: Desarrolla una clase interpretable, invariante permutacional y completa de estimadores ponderados, aplicable a diversos campos de la inferencia causal
  4. Libertad de Residuos: Identifica selecciones de pesos específicas que producen estimadores únicos libres de residuos, cuya suma de inclusión-exclusión captura el efecto máximo
  5. Extensión a Medidas de Razón: Extiende los resultados a medidas de efectos de razón como riesgo relativo y razón de momios

Detalles Metodológicos

Definición de la Tarea

Dadas K variables de acción X = {X₁, ..., Xₖ}, cada una con dos estados Xₖ(1) y Xₖ(0), el objetivo es definir estimandos causales invariantes permutacionales que permanezcan invariantes bajo reetiquetado de variables.

Marco Algebraico

Conceptos Fundamentales

  1. Representación de Conjunto Potencia: Utiliza el conjunto potencia 2^X para indexar los 2^K estados
  2. Relación de Equivalencia: Define la relación de equivalencia ~, tal que A ~ B si y solo si |A| = |B|
  3. Clases de Equivalencia: A = {B ∈ 2^X : |B| = |A|}, indexable únicamente por cardinalidad q como q
  4. Conjunto Cociente: Q := {q : 0 ≤ q ≤ K}

Definición de Invariancia Permutacional

Definición 1 (Matriz de Permutación): Una matriz de permutación es una matriz binaria cuadrada con exactamente un 1 en cada fila y columna.

Definición 2 (Invariancia Permutacional): Un vector de contraste Δ es invariante permutacional si y solo si para toda matriz de permutación de columnas inducida Pₒ, existe una matriz de permutación de filas Pᵣ tal que PᵣH = HPₒ.

Algoritmo de Verificación

Fundamentos Teóricos

Teorema 1: Un vector de contraste Δ es invariante permutacional si y solo si para todo σ ∈ P, R(HPₒ) = R(H), donde R(H) es el multiconjunto de filas de la matriz generadora H.

Algoritmo de Verificación

Algoritmo 1:

  1. Calcular H' = HPₒ
  2. Para i = 1 hasta d, establecer σ(i) = j tal que rᵢ = r'ⱼ
  3. Generar Pᵣ correspondiente a la permutación σ

Clase Completa de Estimadores

Definición de Estimadores Ponderados

Definición 3: La clase de estimadores completa interpretable para K variables de acción es:

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

donde w es una función de pesos normalizada.

Dos Tipos de Pesos

  1. Pesos Permutables: Los pesos se transforman consistentemente con permutaciones de variables de acción
  2. Pesos Invariantes: Los pesos permanecen invariantes bajo permutaciones de variables de acción

Teorema 2:

  • Para pesos permutables: la subclase {ΔY : Y ∈ q} es invariante permutacional
  • Para pesos invariantes: se requieren condiciones adicionales para garantizar invariancia permutacional
  • La clase completa {ΔY : ∅ ≠ Y ∈ 2^X} es tanto invariante permutacional como completa

Estimadores Libres de Residuos

Definición de Libertad de Residuos

Definición 4: Una clase de estimadores Δ es libre de residuos si su suma de inclusión-exclusión es igual al efecto máximo:

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

Resultado de Unicidad

Teorema 3: Para la clase de estimadores con pesos invariantes, el residuo es cero si y solo si w(T,Y) = 1(T = ∅) y ΔY = Σ(Z⊆Y) (-1)^|Z| f(Z).

Configuración Experimental

Campos de Aplicación

El artículo valida principalmente mediante ejemplos teóricos y pruebas matemáticas, involucrando:

  1. Análisis de Mediación Causal: Casos con K=2 y K=3 mediadores múltiples
  2. Experimentos Factoriales: Diseños factoriales 2^K
  3. Interferencia de Red: Análisis de redes multiunitarias
  4. Aleatorización Mendeliana: Análisis de múltiples genotipos

Métodos de Verificación

  • Verificación algebraica: mediante operaciones matriciales
  • Verificación combinatoria: utilizando métodos de conteo de multiconjuntos
  • Análisis de casos: cálculos detallados para K=2,3

Resultados Experimentales

Verificación de Invariancia Permutacional

Ejemplo 1 vs Ejemplo 2:

  • Estimador de Lange et al. (2014): no satisface invariancia permutacional
  • Efecto indirecto de salida de Xia y Chan (2022): satisface invariancia permutacional

Efectos de Selección de Pesos

Libertad de Residuos:

  • Peso de masa puntual w(T,Y) = 1(T = ∅) produce el estimador único libre de residuos
  • Otras selecciones de pesos producen efectos residuales no nulos

Extensión a Medidas de Razón

Corolarios 1-2 demuestran:

  • Riesgo relativo: ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
  • Razón de momios: estructura multiplicativa correspondiente

Trabajo Relacionado

Investigación Existente

  1. Análisis de Mediación Causal: Lange et al. (2014), Xia y Chan (2022)
  2. Experimentos Factoriales: Dasgupta et al. (2015), Zhao y Ding (2022)
  3. Interferencia de Red: Hudgens y Halloran (2008)
  4. Aleatorización Mendeliana: Hartwig et al. (2017)

Contribuciones del Artículo

  • Primera definición formal de invariancia permutacional
  • Unificación de estimadores en diferentes campos
  • Métodos sistemáticos de verificación y construcción

Conclusiones y Discusión

Conclusiones Principales

  1. La invariancia permutacional es un principio fundamental en la inferencia causal
  2. Puede verificarse mediante conteo simple de multiconjuntos
  3. Existe una clase única de estimadores libres de residuos
  4. El método es aplicable a múltiples campos de la inferencia causal

Limitaciones

  1. Actualmente solo considera variables de acción con dos estados
  2. El marco teórico requiere extensión a casos multiestado
  3. La complejidad computacional en aplicaciones prácticas no se ha discutido suficientemente

Direcciones Futuras

  1. Extensión a experimentos factoriales multiclasificados
  2. Tratamiento de análisis de múltiples mediadores con tratamientos ordenados
  3. Desarrollo de algoritmos computacionalmente más eficientes

Evaluación Profunda

Fortalezas

  1. Rigor Teórico: Primera caracterización matemática rigurosa de la invariancia permutacional
  2. Generalidad del Método: Marco unificado aplicable a múltiples campos de la inferencia causal
  3. Valor Práctico: Proporciona algoritmos de verificación explícitos y métodos de construcción
  4. Completitud: Sistema teórico completo desde definición hasta verificación y construcción

Debilidades

  1. Limitaciones de Alcance: Restringido a variables con dos estados
  2. Validación Empírica Insuficiente: Depende principalmente de pruebas teóricas, carece de validación en datos reales a gran escala
  3. Complejidad Computacional: Los problemas de eficiencia computacional para valores grandes de K no se han discutido suficientemente

Impacto

  1. Contribución Teórica: Proporciona fundamentos teóricos importantes para la inferencia causal
  2. Orientación Práctica: Proporciona métodos concretos para evitar dependencia del etiquetado
  3. Aplicación Interdisciplinaria: Unifica metodología en múltiples subcampos

Escenarios Aplicables

  1. Análisis causal con múltiples variables mediadoras
  2. Diseño experimental con factores sin ordenamiento
  3. Inferencia causal en datos de red
  4. Aleatorización mendeliana con múltiples variables instrumentales

Referencias

  1. Xia, F. y Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
  2. Zhao, A. y Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
  3. Dasgupta, T., Pillai, N. S., y Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
  4. Hudgens, M. G. y Halloran, M. E. (2008). Toward causal inference with interference. JASA.