2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li

In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.

academic

On the permutation invariance principle for causal estimands

基本信息

论文ID: 2510.11863
标题: On the permutation invariance principle for causal estimands
作者: Jiaqi Tong, Fan Li (Yale University School of Public Health)
分类: stat.ME (Statistics - Methodology)
发表时间: October 15, 2025 (arXiv预印本)
论文链接: https://arxiv.org/abs/2510.11863

多中介变量的因果中介分析：多个无序中介变量
因子实验：多个因子变量
网络干扰下的因果推断：多个网络单元
孟德尔随机化：多个基因型（工具变量）

核心问题

当这些变量没有内在排序时，一个关键考虑是因果估计量应该是置换不变的，即估计量的定义不应因变量重新标记而改变。然而，现有文献中：

置换不变性原则仅被非正式地提及（如Xia and Chan (2022)中的"对称估计量"）
缺乏正式定义和系统性研究
不谨慎的实践可能产生依赖于标签的估计量，导致解释上的歧义

研究动机

解决因果推断中多变量标记依赖性问题，建立置换不变性的理论基础，为实践提供明确的指导原则。

核心贡献

理论贡献：首次对置换不变性原则进行严格刻画，填补了文献中的理论空白
验证方法：提出了简单直接的程序来验证给定估计量集合是否满足置换不变性
完整估计量类：开发了可解释的、置换不变的、完整的加权估计量类，适用于各种因果推断领域
残差自由性：识别了产生唯一残差自由估计量的特定权重选择，其包含-排斥和捕获最大效应
比率测量扩展：将结果扩展到风险比和优势比等比率效应测量

幂集表示：使用幂集2^X索引所有2^K个状态
等价关系：定义等价关系～，使得A～B当且仅当|A|=|B|
等价类：A = {B ∈ 2^X : |B| = |A|}，可用基数q唯一索引为q
商集：Q := {q : 0 ≤ q ≤ K}

计算H' = HPₒ
对i = 1到d，设σ(i) = j使得rᵢ = r'ⱼ
输出对应于置换σ的Pᵣ

完整估计量类

加权估计量定义

定义3：K个行动变量的可解释完整估计量类为：

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

其中w是归一化权重函数。

两种权重类型

可置换权重：权重与行动变量一致置换
不变权重：权重在行动变量置换下保持不变

定理2：

对可置换权重：子类{ΔY : Y ∈ q}是置换不变的
对不变权重：需要额外条件才能保证置换不变性
完整类{ΔY : ∅ ≠ Y ∈ 2^X}既是置换不变的又是完整的

残差自由估计量

残差自由性定义

定义4：估计量类Δ是残差自由的，如果其包含-排斥和等于最大效应：

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

因果中介分析：K=2和K=3的多中介变量情况
因子实验：2^K因子设计
网络干扰：多单元网络分析
孟德尔随机化：多基因型分析

验证方法

代数验证：通过矩阵运算验证置换不变性
组合验证：使用多重集计数方法
案例分析：具体K=2,3情况的详细计算

实验结果

置换不变性验证

例1 vs 例2：

Lange等(2014)的估计量：不满足置换不变性
Xia和Chan(2022)的退出间接效应：满足置换不变性

权重选择效果

残差自由性：

点质量权重w(T,Y) = 1(T = ∅)产生唯一的残差自由估计量
其他权重选择会产生非零残差效应

比率测量扩展

推论1-2展示了：

风险比：ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
优势比：相应的乘性结构

结论与讨论

主要结论

置换不变性是因果推断中的基本原则
可通过简单的多重集计数验证
存在唯一的残差自由估计量类
方法适用于多个因果推断领域

局限性

目前仅考虑二状态行动变量
理论框架需要扩展到多状态情况
实际应用中的计算复杂性未充分讨论

未来方向

扩展到多分类因子实验
处理有序处理的多中介分析
开发计算效率更高的算法

深度评价

优点

理论严谨性：首次对置换不变性进行严格数学刻画
方法通用性：统一框架适用于多个因果推断领域
实用价值：提供了明确的验证算法和构造方法
完整性：从定义到验证到构造的完整理论体系

不足

应用范围限制：仅限于二状态变量
实证验证不足：主要依赖理论证明，缺乏大规模实际数据验证
计算复杂性：对于大K值的计算效率问题未充分讨论

影响力

理论贡献：为因果推断提供了重要的理论基础
实践指导：为避免标记依赖性提供了具体方法
跨领域应用：统一了多个子领域的方法论

适用场景

多中介变量的因果分析
无序因子的实验设计
网络数据的因果推断
多工具变量的孟德尔随机化

参考文献

Xia, F. and Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
Zhao, A. and Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
Dasgupta, T., Pillai, N. S., and Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
Hudgens, M. G. and Halloran, M. E. (2008). Toward causal inference with interference. JASA.