Local Causal Discovery for Statistically Efficient Causal Inference
Schubert, Claassen, Magliacane
Causal discovery methods can identify valid adjustment sets for causal effect estimation for a pair of target variables, even when the underlying causal graph is unknown. Global causal discovery methods focus on learning the whole causal graph and therefore enable the recovery of optimal adjustment sets, i.e., sets with the lowest asymptotic variance, but they quickly become computationally prohibitive as the number of variables grows. Local causal discovery methods offer a more scalable alternative by focusing on the local neighborhood of the target variables, but are restricted to statistically suboptimal adjustment sets. In this work, we propose Local Optimal Adjustments Discovery (LOAD), a sound and complete causal discovery approach that combines the computational efficiency of local methods with the statistical optimality of global methods. First, LOAD identifies the causal relation between the targets and tests if the causal effect is identifiable by using only local information. If it is identifiable, it then finds the optimal adjustment set by leveraging local causal discovery to infer the mediators and their parents. Otherwise, it returns the locally valid parent adjustment sets based on the learned local structure. In our experiments on synthetic and realistic data LOAD outperforms global methods in scalability, while providing more accurate effect estimation than local methods.
academic
الاكتشاف السببي المحلي للاستدلال السببي الفعال إحصائياً
تستطيع طرق الاكتشاف السببي تحديد مجموعات التعديل الفعالة لتقدير التأثير السببي بين زوج من المتغيرات المستهدفة، حتى عندما تكون الرسم البياني السببي الأساسي غير معروف. تركز طرق الاكتشاف السببي العام على تعلم الرسم البياني السببي الكامل، وبالتالي يمكنها استرجاع مجموعات التعديل المثلى (أي تلك التي تتمتع بأقل تباين مقارب)، لكنها تصبح حسابياً غير قابلة للتطبيق بسرعة مع نمو عدد المتغيرات. توفر طرق الاكتشاف السببي المحلي بديلاً أكثر قابلية للتوسع من خلال التركيز على الحي المحلي للمتغيرات المستهدفة، لكنها تقتصر على مجموعات تعديل دون المستوى الأمثل إحصائياً. في هذا العمل، يقترح المؤلفون اكتشاف التعديل الأمثل المحلي (LOAD)، وهي طريقة اكتشاف سببي موثوقة وكاملة تجمع بين الكفاءة الحسابية للطرق المحلية والأمثلية الإحصائية للطرق العامة.
في الاستدلال السببي، يعتبر تقدير التأثير السببي بين متغيرين مهمة أساسية. عندما يكون الرسم البياني السببي الأساسي غير معروف، يلزم استخدام طرق الاكتشاف السببي لتحديد مجموعات التعديل الفعالة لتقدير التأثير السببي. تواجه الطرق الموجودة مقايضة أساسية:
معضلة الطرق العامة: طرق الاكتشاف السببي العام (مثل خوارزمية PC) قادرة على تعلم الرسم البياني السببي الكامل واسترجاع مجموعات التعديل المثلى، لكن التعقيد الحسابي ينمو بشكل أسي مع عدد المتغيرات، مما يجعلها غير قابلة للتطبيق في المشاكل الكبيرة.
قيود الطرق المحلية: طرق الاكتشاف السببي المحلية (مثل MB-by-MB و LDECC) تتمتع بكفاءة حسابية عالية، لكنها تستطيع فقط استرجاع مجموعات تعديل دون المستوى الأمثل، مما يؤدي إلى تباين مقارب أعلى في تقدير التأثير السببي.
تطوير طريقة لتحديد قابلية تحديد التأثير السببي بناءً على المعلومات المحلية: اقتراح شروط ضرورية وكافية لتحديد ما إذا كان التأثير السببي قابلاً للتحديد باستخدام المعلومات المحلية فقط.
اقتراح خوارزمية LOAD: طريقة موثوقة وكاملة لتحديد مجموعات التعديل المثلى باستخدام المعلومات المحلية حول المتغيرات فقط.
تقييم تجريبي شامل: تقييم LOAD على البيانات الاصطناعية والحقيقية، مما يثبت أنها تستطيع استرجاع مجموعات تعديل عالية الجودة بتكلفة حسابية منخفضة.
ضمانات نظرية: إثبات الموثوقية والاكتمال لخوارزمية LOAD في تحديد قابلية تحديد التأثير السببي والعثور على مجموعات التعديل المثلى.
اختبار التكيف المحلي: أول اقتراح لشروط ضرورية وكافية لاختبار التكيف باستخدام المعلومات المحلية فقط، مما يتجنب الحاجة إلى فحص جميع المسارات الموجهة المحتملة.
آلية التخزين المؤقت: خوارزمية MB-by-MB المحسّنة تستخدم التخزين المؤقت لإعادة استخدام الحبال الماركوفية والبنى المحلية المحددة في التشغيلات السابقة، مما يحسن بشكل كبير من الكفاءة الحسابية.
الاكتمال النظري: إثبات أن LOAD موثوقة وكاملة في تحديد العلاقات السببية وقابلية التحديد ومجموعات التعديل المثلى.
تستشهد الورقة بالأدبيات المهمة في مجال الاستدلال السببي، بما في ذلك:
Pearl (2009): Causality - الكتاب المدرسي الكلاسيكي للاستدلال السببي
Spirtes et al. (2000): العمل الأساسي للاكتشاف السببي القائم على القيود
Henckel et al. (2022): المعايير الرسومية لمجموعات التعديل المثلى
Perković et al. (2015): تعريف وخصائص التكيف
التقييم الشامل: هذه ورقة عالية الجودة في مجال الاستدلال السببي، بمساهمات مهمة على المستويات النظرية والعملية. تحل خوارزمية LOAD بذكاء مشكلة المقايضة بين الكفاءة الحسابية والأمثلية الإحصائية في الاكتشاف السببي، وتتمتع بقيمة أكاديمية وآفاق تطبيقية مهمة.