On the permutation invariance principle for causal estimands
Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic
О принципе инвариантности перестановок для причинных оценок
Во многих задачах причинного вывода несколько переменных действия оказывают одинаковое причинное воздействие (например, переменные-посредники, факторы, сетевые единицы или генотипы), но не имеют естественного упорядочения. Чтобы избежать интерпретационной неоднозначности, причинные оценки должны оставаться инвариантными при переобозначении, что является неявным принципом, называемым инвариантностью перестановок. В данной статье формально характеризуется этот принцип, анализируются методы проверки его алгебраической и комбинаторной структуры, и предлагается класс взвешенных оценок, которые одновременно являются инвариантными относительно перестановок и захватывают все порядки взаимодействий. Кроме того, предоставляются рекомендации по выбору весов, позволяющие включение-исключение остаточно-свободных оценок захватывать максимальный эффект, и результаты расширяются на относительные измерения эффекта.
Современный причинный вывод часто сталкивается со сложными ситуациями, когда несколько переменных имеют одинаковый тип причинной интерпретации, включая:
Причинный анализ медиации с несколькими посредниками: несколько неупорядоченных переменных-посредников
Факторные эксперименты: несколько факторных переменных
Причинный вывод при сетевых помехах: несколько сетевых единиц
Менделевская рандомизация: несколько генотипов (инструментальные переменные)
Когда эти переменные не имеют внутреннего упорядочения, ключевым соображением является то, что причинные оценки должны быть инвариантными относительно перестановок, то есть определение оценки не должно изменяться при переобозначении переменных. Однако в существующей литературе:
Принцип инвариантности перестановок упоминается только неформально (например, "симметричные оценки" в Xia and Chan (2022))
Отсутствует формальное определение и систематическое исследование
Неосторожная практика может привести к оценкам, зависящим от метки, что вызывает интерпретационную неоднозначность
Решить проблему зависимости от разметки многопеременных величин в причинном выводе, установить теоретическую основу инвариантности перестановок и предоставить четкие руководящие принципы для практики.
Теоретический вклад: первая строгая характеристика принципа инвариантности перестановок, заполняющая теоретический пробел в литературе
Методы проверки: предложены простые и прямые процедуры для проверки того, удовлетворяет ли данный набор оценок инвариантности перестановок
Полный класс оценок: разработан интерпретируемый, инвариантный относительно перестановок, полный класс взвешенных оценок, применимый к различным областям причинного вывода
Остаточная свобода: выявлены специфические выборы весов, производящие уникальные остаточно-свободные оценки, чьё включение-исключение захватывает максимальный эффект
Расширение на относительные измерения: результаты расширены на относительные измерения эффекта, такие как отношение рисков и отношение шансов
Дано K переменных действия X = {X₁, ..., Xₖ}, каждая с двумя состояниями Xₖ(1) и Xₖ(0), целью является определение инвариантных относительно перестановок причинных оценок, которые остаются неизменными при переобозначении переменных.
Определение 1 (Матрица перестановок): Матрица перестановок — это квадратная бинарная матрица, в каждой строке и каждом столбце которой ровно одна единица.
Определение 2 (Инвариантность перестановок): Вектор контраста Δ является инвариантным относительно перестановок тогда и только тогда, когда для любой индуцированной матрицы перестановок столбцов Pₒ существует матрица перестановок строк Pᵣ такая, что PᵣH = HPₒ.
Теорема 1: Вектор контраста Δ является инвариантным относительно перестановок тогда и только тогда, когда для всех σ ∈ P, R(HPₒ) = R(H), где R(H) — это мультимножество строк порождающей матрицы H.
Xia, F. and Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
Zhao, A. and Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
Dasgupta, T., Pillai, N. S., and Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
Hudgens, M. G. and Halloran, M. E. (2008). Toward causal inference with interference. JASA.