2025-11-19T04:40:13.454898

On the permutation invariance principle for causal estimands

Tong, Li
In many causal inference problems, multiple action variables share the same causal role, such as mediators, factors, network units, or genotypes, yet lack a natural ordering. To avoid ambiguity in interpretation, causal estimands should remain unchanged under relabeling, an implicit principle we refer to as permutation invariance. We formally characterize this principle, analyze its algebraic and combinatorial structure for verification, and present a class of weighted estimands that are permutation-invariant while capturing interactions of all orders. We further provide guidance on selecting weights that yield residual-free estimands, whose inclusion-exclusion sums capture the maximal effect, and extend our results to ratio effect measures.
academic

कारणात्मक अनुमानकों के लिए क्रमचय अपरिवर्तनीयता सिद्धांत पर

मूल जानकारी

  • पेपर ID: 2510.11863
  • शीर्षक: कारणात्मक अनुमानकों के लिए क्रमचय अपरिवर्तनीयता सिद्धांत पर
  • लेखक: जिआकी टोंग, फैन ली (येल विश्वविद्यालय स्कूल ऑफ पब्लिक हेल्थ)
  • वर्गीकरण: stat.ME (सांख्यिकी - पद्धति)
  • प्रकाशन समय: 15 अक्टूबर, 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.11863

सारांश

कई कारणात्मक अनुमान समस्याओं में, कई क्रिया चर समान कारणात्मक प्रभाव रखते हैं (जैसे मध्यस्थ चर, कारक, नेटवर्क इकाइयां या जीनोटाइप), लेकिन प्राकृतिक क्रमबद्धता की कमी होती है। व्याख्यात्मक अस्पष्टता से बचने के लिए, कारणात्मक अनुमानक पुनः-लेबलिंग के तहत अपरिवर्तित रहना चाहिए, यह निहित सिद्धांत क्रमचय अपरिवर्तनीयता कहलाता है। यह पेपर इस सिद्धांत को औपचारिक रूप से चिन्हित करता है, इसके बीजगणितीय और संयोजनात्मक संरचना के सत्यापन विधियों का विश्लेषण करता है, और भारित अनुमानकों का एक वर्ग प्रस्तावित करता है जो क्रमचय अपरिवर्तनीय हैं और सभी क्रमों की अंतःक्रियाओं को पकड़ते हैं। आगे भार चयन के लिए मार्गदर्शन प्रदान करता है ताकि अवशेष-मुक्त अनुमानकों का समावेश-बहिष्करण योग अधिकतम प्रभाव को पकड़ सके, और परिणामों को अनुपात प्रभाव माप तक विस्तारित करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या का प्रस्तुतिकरण

आधुनिक कारणात्मक अनुमान में अक्सर ऐसी जटिल परिस्थितियां आती हैं जहां कई चर समान कारणात्मक व्याख्या प्रकार रखते हैं, जिनमें शामिल हैं:

  1. बहु-मध्यस्थ कारणात्मक मध्यस्थता विश्लेषण: कई अक्रमित मध्यस्थ चर
  2. कारक प्रयोग: कई कारक चर
  3. नेटवर्क हस्तक्षेप के तहत कारणात्मक अनुमान: कई नेटवर्क इकाइयां
  4. मेंडेलियन यादृच्छिकीकरण: कई जीनोटाइप (साधन चर)

मूल समस्या

जब इन चरों में कोई आंतरिक क्रमबद्धता नहीं होती है, तो एक महत्वपूर्ण विचार यह है कि कारणात्मक अनुमानक क्रमचय अपरिवर्तनीय होना चाहिए, अर्थात् अनुमानक की परिभाषा चर पुनः-लेबलिंग के कारण नहीं बदलनी चाहिए। हालांकि, मौजूदा साहित्य में:

  • क्रमचय अपरिवर्तनीयता सिद्धांत केवल अनौपचारिक रूप से उल्लिखित है (जैसे Xia और Chan (2022) में "सममित अनुमानक")
  • औपचारिक परिभाषा और व्यवस्थित अनुसंधान की कमी है
  • असावधान अभ्यास लेबल-निर्भर अनुमानक उत्पन्न कर सकता है, जिससे व्याख्यात्मक अस्पष्टता होती है

अनुसंधान प्रेरणा

कारणात्मक अनुमान में बहु-चर लेबलिंग निर्भरता समस्या को हल करना, क्रमचय अपरिवर्तनीयता की सैद्धांतिक नींव स्थापित करना, और व्यावहारिक अनुप्रयोग के लिए स्पष्ट मार्गदर्शक सिद्धांत प्रदान करना।

मूल योगदान

  1. सैद्धांतिक योगदान: पहली बार क्रमचय अपरिवर्तनीयता सिद्धांत को कठोरता से चिन्हित करना, साहित्य में सैद्धांतिक खाली स्थान को भरना
  2. सत्यापन विधि: दिए गए अनुमानक समूह क्रमचय अपरिवर्तनीयता को संतुष्ट करते हैं या नहीं, यह सत्यापित करने के लिए सरल और सीधी प्रक्रिया प्रस्तावित करना
  3. पूर्ण अनुमानक वर्ग: व्याख्यात्मक, क्रमचय अपरिवर्तनीय, पूर्ण भारित अनुमानकों का वर्ग विकसित करना, जो विभिन्न कारणात्मक अनुमान क्षेत्रों के लिए उपयुक्त है
  4. अवशेष-मुक्तता: विशिष्ट भार चयन की पहचान करना जो अद्वितीय अवशेष-मुक्त अनुमानक उत्पन्न करते हैं, जिनका समावेश-बहिष्करण योग अधिकतम प्रभाव को पकड़ता है
  5. अनुपात माप विस्तार: परिणामों को जोखिम अनुपात और बाधा अनुपात जैसे अनुपात प्रभाव मापों तक विस्तारित करना

विधि विवरण

कार्य परिभाषा

K क्रिया चर X = {X₁, ..., Xₖ} दिए गए हैं, प्रत्येक चर के दो अवस्थाएं Xₖ(1) और Xₖ(0) हैं, लक्ष्य क्रमचय अपरिवर्तनीय कारणात्मक अनुमानक परिभाषित करना है, ताकि वे चर पुनः-लेबलिंग के तहत अपरिवर्तित रहें।

बीजगणितीय ढांचा

मूल अवधारणाएं

  1. शक्ति समुच्चय प्रतिनिधित्व: सभी 2^K अवस्थाओं को अनुक्रमित करने के लिए शक्ति समुच्चय 2^X का उपयोग करना
  2. तुल्यता संबंध: तुल्यता संबंध ~ परिभाषित करना, जहां A ~ B यदि और केवल यदि |A| = |B|
  3. तुल्यता वर्ग: A = {B ∈ 2^X : |B| = |A|}, जिसे मुख्यता q द्वारा अद्वितीय रूप से q के रूप में अनुक्रमित किया जा सकता है
  4. भागफल समुच्चय: Q := {q : 0 ≤ q ≤ K}

क्रमचय अपरिवर्तनीयता परिभाषा

परिभाषा 1 (क्रमचय मैट्रिक्स): क्रमचय मैट्रिक्स एक वर्ग द्विआधारी मैट्रिक्स है, जहां प्रत्येक पंक्ति और स्तंभ में बिल्कुल एक 1 होता है।

परिभाषा 2 (क्रमचय अपरिवर्तनीयता): विपरीत वेक्टर Δ क्रमचय अपरिवर्तनीय है, यदि और केवल यदि किसी भी प्रेरित स्तंभ क्रमचय मैट्रिक्स Pₒ के लिए, एक पंक्ति क्रमचय मैट्रिक्स Pᵣ मौजूद है जैसे कि PᵣH = HPₒ।

सत्यापन एल्गोरिदम

सैद्धांतिक आधार

प्रमेय 1: विपरीत वेक्टर Δ क्रमचय अपरिवर्तनीय है यदि और केवल यदि सभी σ ∈ P के लिए, R(HPₒ) = R(H), जहां R(H) जनन मैट्रिक्स H की पंक्ति बहु-समुच्चय है।

सत्यापन एल्गोरिदम

एल्गोरिदम 1:

  1. H' = HPₒ की गणना करें
  2. i = 1 से d के लिए, σ(i) = j सेट करें जहां rᵢ = r'ⱼ
  3. क्रमचय σ के अनुरूप Pᵣ को आउटपुट करें

पूर्ण अनुमानक वर्ग

भारित अनुमानक परिभाषा

परिभाषा 3: K क्रिया चरों का व्याख्यात्मक पूर्ण अनुमानक वर्ग है:

ΔY = Σ(T⊆Yᶜ) w(T,Y)[Σ(Z⊆Y) (-1)^|Z| f(Z∪T)]

जहां w एक सामान्यीकृत भार फलन है।

दो भार प्रकार

  1. क्रमचय योग्य भार: भार क्रिया चरों के साथ क्रमचय होते हैं
  2. अपरिवर्तनीय भार: भार क्रिया चर क्रमचय के तहत अपरिवर्तित रहते हैं

प्रमेय 2:

  • क्रमचय योग्य भार के लिए: उप-वर्ग {ΔY : Y ∈ q} क्रमचय अपरिवर्तनीय है
  • अपरिवर्तनीय भार के लिए: क्रमचय अपरिवर्तनीयता सुनिश्चित करने के लिए अतिरिक्त शर्तें आवश्यक हैं
  • पूर्ण वर्ग {ΔY : ∅ ≠ Y ∈ 2^X} क्रमचय अपरिवर्तनीय और पूर्ण दोनों है

अवशेष-मुक्त अनुमानक

अवशेष-मुक्तता परिभाषा

परिभाषा 4: अनुमानक वर्ग Δ अवशेष-मुक्त है, यदि इसका समावेश-बहिष्करण योग अधिकतम प्रभाव के बराबर है:

Σ(∅≠Y⊆X) (-1)^(|Y|+1) ΔY = f(∅) - f(X)

अद्वितीयता परिणाम

प्रमेय 3: अपरिवर्तनीय भार के अनुमानक वर्ग के लिए, अवशेष शून्य है यदि और केवल यदि w(T,Y) = 1(T = ∅) और ΔY = Σ(Z⊆Y) (-1)^|Z| f(Z)।

प्रायोगिक सेटअप

अनुप्रयोग क्षेत्र

पेपर मुख्य रूप से सैद्धांतिक उदाहरणों और गणितीय प्रमाणों के माध्यम से विधि को सत्यापित करता है, जिसमें शामिल हैं:

  1. कारणात्मक मध्यस्थता विश्लेषण: K=2 और K=3 के बहु-मध्यस्थ परिस्थितियां
  2. कारक प्रयोग: 2^K कारक डिजाइन
  3. नेटवर्क हस्तक्षेप: बहु-इकाई नेटवर्क विश्लेषण
  4. मेंडेलियन यादृच्छिकीकरण: बहु-जीनोटाइप विश्लेषण

सत्यापन विधि

  • बीजगणितीय सत्यापन: मैट्रिक्स संचालन के माध्यम से क्रमचय अपरिवर्तनीयता सत्यापित करना
  • संयोजनात्मक सत्यापन: बहु-समुच्चय गणना विधि का उपयोग करना
  • केस विश्लेषण: K=2,3 परिस्थितियों का विस्तृत गणना

प्रायोगिक परिणाम

क्रमचय अपरिवर्तनीयता सत्यापन

उदाहरण 1 बनाम उदाहरण 2:

  • Lange आदि (2014) का अनुमानक: क्रमचय अपरिवर्तनीयता को संतुष्ट नहीं करता
  • Xia और Chan (2022) का निकास अप्रत्यक्ष प्रभाव: क्रमचय अपरिवर्तनीयता को संतुष्ट करता है

भार चयन प्रभाव

अवशेष-मुक्तता:

  • बिंदु द्रव्यमान भार w(T,Y) = 1(T = ∅) अद्वितीय अवशेष-मुक्त अनुमानक उत्पन्न करता है
  • अन्य भार चयन गैर-शून्य अवशेष प्रभाव उत्पन्न करते हैं

अनुपात माप विस्तार

अनुमान 1-2 दर्शाते हैं:

  • जोखिम अनुपात: ΔY = Π(Z⊆Y) f(Z)^((-1)^|Z|)
  • बाधा अनुपात: संबंधित गुणक संरचना

संबंधित कार्य

मौजूदा अनुसंधान

  1. कारणात्मक मध्यस्थता विश्लेषण: Lange et al. (2014), Xia और Chan (2022)
  2. कारक प्रयोग: Dasgupta et al. (2015), Zhao और Ding (2022)
  3. नेटवर्क हस्तक्षेप: Hudgens और Halloran (2008)
  4. मेंडेलियन यादृच्छिकीकरण: Hartwig et al. (2017)

इस पेपर का योगदान

  • पहली बार क्रमचय अपरिवर्तनीयता को औपचारिक रूप से परिभाषित करना
  • विभिन्न क्षेत्रों के अनुमानकों को एकीकृत करना
  • सत्यापन और निर्माण के लिए व्यवस्थित विधि प्रदान करना

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. क्रमचय अपरिवर्तनीयता कारणात्मक अनुमान में एक मौलिक सिद्धांत है
  2. इसे सरल बहु-समुच्चय गणना के माध्यम से सत्यापित किया जा सकता है
  3. अद्वितीय अवशेष-मुक्त अनुमानक वर्ग मौजूद है
  4. विधि कई कारणात्मक अनुमान क्षेत्रों के लिए लागू है

सीमाएं

  1. वर्तमान में केवल द्विआधारी अवस्था क्रिया चरों पर विचार करता है
  2. सैद्धांतिक ढांचे को बहु-अवस्था परिस्थितियों तक विस्तारित करने की आवश्यकता है
  3. व्यावहारिक अनुप्रयोग में कम्प्यूटेशनल जटिलता पर्याप्त रूप से चर्चित नहीं है

भविष्य की दिशाएं

  1. बहु-वर्गीकृत कारक प्रयोगों तक विस्तार
  2. क्रमबद्ध उपचार के साथ बहु-मध्यस्थ विश्लेषण को संभालना
  3. अधिक कम्प्यूटेशनल दक्षता वाले एल्गोरिदम विकसित करना

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक कठोरता: पहली बार क्रमचय अपरिवर्तनीयता का कठोर गणितीय चिन्हन
  2. विधि सामान्यता: एकीकृत ढांचा कई कारणात्मक अनुमान क्षेत्रों के लिए लागू है
  3. व्यावहारिक मूल्य: स्पष्ट सत्यापन एल्गोरिदम और निर्माण विधि प्रदान करता है
  4. पूर्णता: परिभाषा से सत्यापन से निर्माण तक पूर्ण सैद्धांतिक प्रणाली

कमियां

  1. अनुप्रयोग सीमा: केवल द्विआधारी अवस्था चरों तक सीमित
  2. अनुभवजन्य सत्यापन अपर्याप्त: मुख्य रूप से सैद्धांतिक प्रमाण पर निर्भर, बड़े पैमाने पर वास्तविक डेटा सत्यापन की कमी
  3. कम्प्यूटेशनल जटिलता: बड़े K मानों के लिए कम्प्यूटेशनल दक्षता समस्या पर्याप्त रूप से चर्चित नहीं है

प्रभाव

  1. सैद्धांतिक योगदान: कारणात्मक अनुमान के लिए महत्वपूर्ण सैद्धांतिक आधार प्रदान करता है
  2. व्यावहारिक मार्गदर्शन: लेबल निर्भरता से बचने के लिए ठोस विधि प्रदान करता है
  3. अंतः-क्षेत्रीय अनुप्रयोग: कई उप-क्षेत्रों की पद्धति को एकीकृत करता है

लागू परिस्थितियां

  1. बहु-मध्यस्थ चर का कारणात्मक विश्लेषण
  2. अक्रमित कारकों का प्रायोगिक डिजाइन
  3. नेटवर्क डेटा का कारणात्मक अनुमान
  4. बहु-साधन चर का मेंडेलियन यादृच्छिकीकरण

संदर्भ

  1. Xia, F. और Chan, K. C. G. (2022). बहु-मध्यस्थों के साथ प्राकृतिक मध्यस्थता प्रभाव का अपघटन, पहचान और गुणा-मजबूत अनुमान। Biometrika.
  2. Zhao, A. और Ding, P. (2022). कारक प्रयोगों द्वारा प्रतिगमन-आधारित कारणात्मक अनुमान। Biometrika.
  3. Dasgupta, T., Pillai, N. S., और Rubin, D. B. (2015). संभावित परिणामों का उपयोग करके 2^k कारक डिजाइन से कारणात्मक अनुमान। JRSS-B.
  4. Hudgens, M. G. और Halloran, M. E. (2008). हस्तक्षेप के साथ कारणात्मक अनुमान की ओर। JASA.