2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic

О принципе инвариантности перестановок для причинных оценок

Основная информация

  • ID статьи: 2510.11863
  • Название: О принципе инвариантности перестановок для причинных оценок
  • Авторы: Цзяци Тун, Фань Ли (Школа общественного здравоохранения Йельского университета)
  • Классификация: stat.ME (Статистика - Методология)
  • Дата публикации: 15 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.11863

Аннотация

Во многих задачах причинного вывода несколько переменных действия оказывают одинаковое причинное воздействие (например, переменные-посредники, факторы, сетевые единицы или генотипы), но не имеют естественного упорядочения. Чтобы избежать интерпретационной неоднозначности, причинные оценки должны оставаться инвариантными при переобозначении, что является неявным принципом, называемым инвариантностью перестановок. В данной статье формально характеризуется этот принцип, анализируются методы проверки его алгебраической и комбинаторной структуры, и предлагается класс взвешенных оценок, которые одновременно являются инвариантными относительно перестановок и захватывают все порядки взаимодействий. Кроме того, предоставляются рекомендации по выбору весов, позволяющие включение-исключение остаточно-свободных оценок захватывать максимальный эффект, и результаты расширяются на относительные измерения эффекта.

Исследовательский контекст и мотивация

Постановка проблемы

Современный причинный вывод часто сталкивается со сложными ситуациями, когда несколько переменных имеют одинаковый тип причинной интерпретации, включая:

  1. Причинный анализ медиации с несколькими посредниками: несколько неупорядоченных переменных-посредников
  2. Факторные эксперименты: несколько факторных переменных
  3. Причинный вывод при сетевых помехах: несколько сетевых единиц
  4. Менделевская рандомизация: несколько генотипов (инструментальные переменные)

Центральная проблема

Когда эти переменные не имеют внутреннего упорядочения, ключевым соображением является то, что причинные оценки должны быть инвариантными относительно перестановок, то есть определение оценки не должно изменяться при переобозначении переменных. Однако в существующей литературе:

  • Принцип инвариантности перестановок упоминается только неформально (например, "симметричные оценки" в Xia and Chan (2022))
  • Отсутствует формальное определение и систематическое исследование
  • Неосторожная практика может привести к оценкам, зависящим от метки, что вызывает интерпретационную неоднозначность

Исследовательская мотивация

Решить проблему зависимости от разметки многопеременных величин в причинном выводе, установить теоретическую основу инвариантности перестановок и предоставить четкие руководящие принципы для практики.

Основные вклады

  1. Теоретический вклад: первая строгая характеристика принципа инвариантности перестановок, заполняющая теоретический пробел в литературе
  2. Методы проверки: предложены простые и прямые процедуры для проверки того, удовлетворяет ли данный набор оценок инвариантности перестановок
  3. Полный класс оценок: разработан интерпретируемый, инвариантный относительно перестановок, полный класс взвешенных оценок, применимый к различным областям причинного вывода
  4. Остаточная свобода: выявлены специфические выборы весов, производящие уникальные остаточно-свободные оценки, чьё включение-исключение захватывает максимальный эффект
  5. Расширение на относительные измерения: результаты расширены на относительные измерения эффекта, такие как отношение рисков и отношение шансов

Детальное описание методов

Определение задачи

Дано K переменных действия X = {X₁, ..., Xₖ}, каждая с двумя состояниями Xₖ(1) и Xₖ(0), целью является определение инвариантных относительно перестановок причинных оценок, которые остаются неизменными при переобозначении переменных.

Алгебраическая структура

Основные концепции

  1. Представление степенного множества: использование степенного множества 2^X для индексирования всех 2^K состояний
  2. Отношение эквивалентности: определение отношения эквивалентности ~, такого что A~B тогда и только тогда, когда |A|=|B|
  3. Классы эквивалентности: A = {B ∈ 2^X : |B| = |A|}, уникально индексируемые кардинальностью q как q
  4. Фактор-множество: Q := {q : 0 ≤ q ≤ K}

Определение инвариантности перестановок

Определение 1 (Матрица перестановок): Матрица перестановок — это квадратная бинарная матрица, в каждой строке и каждом столбце которой ровно одна единица.

Определение 2 (Инвариантность перестановок): Вектор контраста Δ является инвариантным относительно перестановок тогда и только тогда, когда для любой индуцированной матрицы перестановок столбцов Pₒ существует матрица перестановок строк Pᵣ такая, что PᵣH = HPₒ.

Алгоритм проверки

Теоретическая основа

Теорема 1: Вектор контраста Δ является инвариантным относительно перестановок тогда и только тогда, когда для всех σ ∈ P, R(HPₒ) = R(H), где R(H) — это мультимножество строк порождающей матрицы H.

Алгоритм проверки

Алгоритм 1:

  1. Вычислить H' = HPₒ
  2. Для i = 1 до d установить σ(i) = j такой что rᵢ = r'ⱼ
  3. Вывести Pᵣ, соответствующую перестановке σ

Полный класс оценок

Определение взвешенных оценок

Определение 3: Интерпретируемый полный класс оценок для K переменных действия определяется как:

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

где w — нормализованная функция весов.

Два типа весов

  1. Переставляемые веса: веса согласованно переставляются с переменными действия
  2. Инвариантные веса: веса остаются неизменными при перестановке переменных действия

Теорема 2:

  • Для переставляемых весов: подкласс {ΔY : Y ∈ q} является инвариантным относительно перестановок
  • Для инвариантных весов: требуются дополнительные условия для обеспечения инвариантности перестановок
  • Полный класс {ΔY : ∅ ≠ Y ∈ 2^X} одновременно является инвариантным относительно перестановок и полным

Остаточно-свободные оценки

Определение остаточной свободы

Определение 4: Класс оценок Δ является остаточно-свободным, если его включение-исключение равно максимальному эффекту:

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

Результат уникальности

Теорема 3: Для класса оценок с инвариантными весами остаток равен нулю тогда и только тогда, когда w(T,Y) = 1(T = ∅) и ΔY = Σ(Z⊆Y) (-1)^|Z| f(Z).

Экспериментальная установка

Области применения

Статья в основном проверяет методы через теоретические примеры и математические доказательства, охватывая:

  1. Причинный анализ медиации: случаи с K=2 и K=3 несколькими посредниками
  2. Факторные эксперименты: факторные планы 2^K
  3. Сетевые помехи: анализ многоединичных сетей
  4. Менделевская рандомизация: анализ нескольких генотипов

Методы проверки

  • Алгебраическая проверка: проверка инвариантности перестановок через матричные операции
  • Комбинаторная проверка: использование методов подсчета мультимножеств
  • Анализ случаев: детальные вычисления для конкретных случаев K=2,3

Результаты экспериментов

Проверка инвариантности перестановок

Пример 1 vs Пример 2:

  • Оценка Lange et al. (2014): не удовлетворяет инвариантности перестановок
  • Косвенный эффект выхода Xia и Chan (2022): удовлетворяет инвариантности перестановок

Эффект выбора весов

Остаточная свобода:

  • Точечные веса w(T,Y) = 1(T = ∅) производят уникальную остаточно-свободную оценку
  • Другие выборы весов производят ненулевые остаточные эффекты

Расширение на относительные измерения

Следствия 1-2 показывают:

  • Отношение рисков: ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
  • Отношение шансов: соответствующая мультипликативная структура

Связанные работы

Существующие исследования

  1. Причинный анализ медиации: Lange et al. (2014), Xia and Chan (2022)
  2. Факторные эксперименты: Dasgupta et al. (2015), Zhao and Ding (2022)
  3. Сетевые помехи: Hudgens and Halloran (2008)
  4. Менделевская рандомизация: Hartwig et al. (2017)

Вклад данной работы

  • Первое формальное определение инвариантности перестановок
  • Унификация оценок из различных областей
  • Предоставление систематических методов проверки и конструирования

Заключение и обсуждение

Основные выводы

  1. Инвариантность перестановок является фундаментальным принципом в причинном выводе
  2. Может быть проверена посредством простого подсчета мультимножеств
  3. Существует уникальный класс остаточно-свободных оценок
  4. Методология применима к нескольким областям причинного вывода

Ограничения

  1. В настоящее время рассматриваются только двусостояние переменные действия
  2. Теоретическая структура требует расширения на многосостояние случаи
  3. Вычислительная сложность при практическом применении недостаточно обсуждена

Направления будущих исследований

  1. Расширение на многокатегориальные факторные эксперименты
  2. Обработка анализа медиации с упорядоченными обработками
  3. Разработка алгоритмов с повышенной вычислительной эффективностью

Глубокая оценка

Преимущества

  1. Теоретическая строгость: первая строгая математическая характеристика инвариантности перестановок
  2. Универсальность методов: унифицированная структура применима к нескольким областям причинного вывода
  3. Практическая ценность: предоставляет четкие алгоритмы проверки и конструирования
  4. Полнота: полная теоретическая система от определения к проверке к конструированию

Недостатки

  1. Ограниченная область применения: ограничена двусостояние переменными
  2. Недостаточная эмпирическая проверка: в основном опирается на теоретические доказательства, отсутствует проверка на крупномасштабных реальных данных
  3. Вычислительная сложность: проблемы вычислительной эффективности для больших значений K недостаточно обсуждены

Влияние

  1. Теоретический вклад: предоставляет важную теоретическую основу для причинного вывода
  2. Практическое руководство: предоставляет конкретные методы для избежания зависимости от разметки
  3. Кросс-дисциплинарное применение: унифицирует методологию нескольких подобластей

Сценарии применения

  1. Причинный анализ с несколькими переменными-посредниками
  2. Экспериментальный дизайн с неупорядоченными факторами
  3. Причинный вывод для сетевых данных
  4. Менделевская рандомизация с несколькими инструментальными переменными

Библиография

  1. Xia, F. and Chan, K. C. G. (2022). Decomposition, identification and multiply robust estimation of natural mediation effects with multiple mediators. Biometrika.
  2. Zhao, A. and Ding, P. (2022). Regression-based causal inference with factorial experiments. Biometrika.
  3. Dasgupta, T., Pillai, N. S., and Rubin, D. B. (2015). Causal inference from 2^k factorial designs by using potential outcomes. JRSS-B.
  4. Hudgens, M. G. and Halloran, M. E. (2008). Toward causal inference with interference. JASA.