2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel

Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $Î´\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $Î´$-sufficient reasons ($Î´$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $Î´$-SRs unlikely. We propose the notion of $(Î´, Îµ)$-SR, a simple relaxation of $Î´$-SRs, and show that this kind of explanation can be computed efficiently over linear models.

academic

شروح احتمالية للنماذج الخطية

المعلومات الأساسية

معرّف الورقة: 2501.00154
العنوان: Probabilistic Explanations for Linear Models
المؤلفون: برناردو سوبيركاسيو (جامعة كارنيجي ميلون)، مارسيلو أرينا (جامعة بابلوفيا الكاثوليكية بتشيلي، IMFD تشيلي، RelationalAI)، كولديب إس. ميل (معهد جورجيا للتكنولوجيا، جامعة تورنتو)
التصنيف: cs.AI (الذكاء الاصطناعي)، cs.CC (التعقيد الحسابي)
تاريخ النشر: 3 يناير 2025
رابط الورقة: https://arxiv.org/abs/2501.00154

الملخص

تبحث هذه الورقة مشكلة حساب "الأسباب الكافية" في الذكاء الاصطناعي القابل للتفسير الرسمي (Formal XAI). بالنظر إلى نموذج M وعينة إدخال x، فإن السبب الكافي هو مجموعة فرعية S من الميزات بحيث أن أي عينة z متطابقة مع x على S لديها M(x)=M(z). لتقليل حجم الأسباب الكافية، يأخذ المؤلفون في الاعتبار تخفيفاً احتمالياً: يتطلب أن تكون احتمالية M(x)=M(z) عندما تتطابق عينة عشوائية z مع x على مجموعة الميزات على الأقل δ∈(0,1]. حساب الأسباب الكافية δ-الصغيرة (δ-SRs) صعب نظرياً، حتى بالنسبة للنماذج "القابلة للتفسير" مثل أشجار القرار. تقدم الورقة مفهوم (δ,ε)-SR، وهو تخفيف بسيط لـ δ-SRs، وتثبت أن هذه الشروح يمكن حسابها بكفاءة على النماذج الخطية.

الخلفية البحثية والدافع

المشكلة الأساسية: كيفية توفير شروح صغيرة الحجم بضمانات رياضية لقرارات نماذج التعلم الآلي. تتطلب الأسباب الكافية التقليدية 100% من اليقين، لكن هذا غالباً ما يؤدي إلى شروح كبيرة جداً وغير مناسبة للفهم البشري.
أهمية المشكلة:
- أشار ميلر (1956) إلى أن الشروح التي تتجاوز 9 ميزات قد تكون كبيرة جداً على البشر
- تشير الدراسات التجريبية إلى أن الشروح يجب أن تكون موجزة (Narayanan et al., 2018; Lage et al., 2019)
- في التطبيقات العملية، يهتم المستخدمون بحجم الشرح أكثر من الاختلافات الطفيفة في الضمانات الاحتمالية
قيود الطرق الموجودة:
- حساب الحد الأدنى من δ-SRs هو NP-hard حتى بالنسبة لأشجار القرار
- بالنسبة للنماذج الخطية، الحساب الدقيق للاحتمالية هو #P-hard
- توجد نتائج قوية لعدم القابلية للتقريب: لا يمكن الحصول على نسب تقريب جيدة في الوقت متعدد الحدود
الدافع البحثي:
- حساسية المستخدمين لحجم الشرح أعلى من حساسيتهم للتغييرات الطفيفة في الضمانات الاحتمالية
- الحاجة إلى إيجاد توازن بين القابلية النظرية للمعالجة والعملية
- قد تسمح البنية الخاصة للنماذج الخطية بخوارزميات فعالة

المساهمات الأساسية

تقديم مفهوم (δ,ε)-الحد الأدنى من الأسباب الكافية: نسخة مخففة تسمح بتغيير الضمانات الاحتمالية ضمن النطاق δ-ε, δ+ε
إثبات القابلية للمعالجة على النماذج الخطية: توفير خوارزمية زمن متعدد الحدود لحساب (δ,ε)-min-SR بوقت تشغيل Õ(n/ε²δ²)
إنشاء نتائج فصل نظرية: إثبات أن هذه المشكلة تبقى صعبة على أشجار القرار، مما يبرز الخصوصية للنماذج الخطية
إثبات التكافؤ الأمثل المحلي: بالنسبة للنماذج الخطية، كل δ-SR محلي أمثل هو δ-SR أمثل بالنسبة للمجموعة الفرعية
تحليل فجوة التقريب: إثبات أن التغييرات الصغيرة في المعاملات الاحتمالية قد تؤدي إلى اختلافات أسية في حجم الشرح

شرح الطريقة

تعريف المهمة

الإدخال:

نموذج خطي $\mathcal{L} = (\mathbf{w}, \theta)$ ، حيث $\mathbf{w} \in \mathbb{Q}^n$ ، $\theta \in \mathbb{Q}$
عينة $\mathbf{x} \in \{0,1\}^n$
عتبة احتمالية $\delta \in (0,1)$ وتسامح خطأ $\varepsilon \in (0,1)$

الإخراج:

قيمة $\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]$
الحد الأدنى من $\delta^*$ -السبب الكافي $\mathbf{y}$

القيود:

$\mathcal{L}(\mathbf{x}) = 1$ إذا وفقط إذا $\mathbf{x} \cdot \mathbf{w} \geq \theta$
عينة جزئية $\mathbf{y} \sqsubseteq \mathbf{x}$ تستخدم $\star$ للإشارة إلى القيم غير المعروفة

معمارية النموذج

1. آلية تقييم الميزات

بالنسبة للنموذج الخطي $\mathcal{L} = (\mathbf{w}, \theta)$ والعينة $\mathbf{x}$ ، يُعرّف تقييم الميزة $i$ على النحو التالي:

$s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)$

تشير إشارة التقييم إلى ما إذا كانت الميزة "تساعد" (+1) أم "تضر" (-1) التصنيف، والحجم يتناسب مع وزن الميزة.

2. اختيار الميزات الجشع

اللمة الأساسية: بالنسبة للنماذج الخطية، تحت التوزيع المنتظم، اختيار الميزات بترتيب تقييم تنازلي هو الأمثل.

بشكل محدد، إذا كانت $\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)}$ عينات جزئية محددة بواسطة أفضل k ميزة بأعلى تقييم، إذاً:

$\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]$

3. تقدير مونت كارلو

استخدام عدم المساواة Hoeffding لتقدير الاحتمالية:

بالنسبة لـ $m = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta}$ عينة، لدينا:

$\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n$

نقاط الابتكار التقني

عتبة احتمالية عشوائية: تختار الخوارزمية عشوائياً $\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon])$ ، مما يتجنب الحالات الصعبة
استراتيجية البحث الثنائي: الاستفادة من رتابة الاحتمالية للبحث الفعال
تخفيف الضمانات النظرية: الحصول على تعقيد زمن متعدد الحدود مع الحفاظ على العملية

إعداد التجارب

وصف الخوارزمية

الخوارزمية 1: LinearMonteCarloExplainer

الإدخال: نموذج خطي L، عينة x، معاملات δ، ε، β
1. δ* ← عينة موحدة من [δ-ε, δ+ε]
2. حساب جميع تقييمات الميزات s_i
3. بناء سلسلة عينات جزئية y^(0), ..., y^(n)
4. تعيين عدد العينات m = (log 2n)/(2ε²δ²) log(2log n/β)
5. استخدام البحث الثنائي للعثور على الحد الأدنى k بحيث الاحتمالية المقدرة ≥ δ*
6. إرجاع (δ*, y^(k*))

التحليل النظري

النظرية الرئيسية: بالنظر إلى نموذج خطي $\mathcal{L}$ وإدخال $\mathbf{x}$ ، يمكن حساب $(δ,\varepsilon)$ -min-SR بنجاح بوقت $\tilde{O}(\frac{n}{\varepsilon^2\delta^2})$ بواحتمالية $1-\beta$ .

تحليل التعقيد

التعقيد الزمني: $O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})$
التعقيد المكاني: $O(n)$
احتمالية النجاح: $1-\beta$

نتائج التجارب

النتائج الرئيسية

مقارنة القابلية للمعالجة:
- النماذج الخطية: قابلة للحل في زمن متعدد الحدود
- أشجار القرار: نتائج قوية لعدم القابلية للتقريب (ما لم يكن SAT قابلاً للحل في زمن شبه متعدد الحدود)
- الشبكات العصبية: NPPP-hard
التحقق من الأمثلة المحددة:
- المثال 2 يوضح أن 0.999999-SR يمكن أن يكون أصغر 251 مرة من الحد الأدنى 1-SR
- المثال 3 يتحقق من صحة استراتيجية الاختيار الجشع

النتائج النظرية

نتائج الفصل: إثبات الميزة الأساسية للنماذج الخطية مقارنة بأشجار القرار
الأمثل المحلي مقابل العام: بالنسبة للنماذج الخطية، δ-SR المحلي الأمثل هو δ-SR الأمثل بالنسبة للمجموعة الفرعية
فجوة التقريب: إثبات أن التغييرات الصغيرة في المعاملات الاحتمالية قد تؤدي إلى اختلافات $\Omega(n^{1/2-\epsilon})$ في حجم الشرح

تحليل الحالات

تحليل تفصيلي للمثال 3:

العينة: $\mathbf{x} = (1,0,0,1,1)$
الأوزان: $\mathbf{w} = (5,1,-3,2,-1)$ ، العتبة: $\theta = 5$
تقييمات الميزات: $(5,-1,3,2,-1)$
أفضل شرح بميزتين: $\{1,3\}$ ، الاحتمالية 7/8

الأعمال ذات الصلة

حساب الأسباب الكافية

Darwiche و Hirth (2020): أول من صاغ مفهوم الأسباب الكافية رسمياً
Barceló وآخرون (2020): إنشاء تسلسل هرمي للتعقيد عبر فئات النماذج المختلفة
Arenas وآخرون (2022): إثبات صعوبة δ-SRs على أشجار القرار

الشروح الاحتمالية

Wäldchen وآخرون (2021): تقديم مفهوم δ-الأسباب الكافية
Izza وآخرون (2023): دراسة حساب الشروح الاحتمالية البطنية
Kozachinskiy (2023): إنشاء نتائج عدم القابلية للتقريب لأشجار القرار

شرح النماذج الخطية

Marques-Silva وآخرون (2020): دراسة مصنفات خطية مثل Naive Bayes
Blanc وآخرون (2021): شروح صغيرة بالنسبة لتعقيد الشهادة

الخلاصة والنقاش

الاستنتاجات الرئيسية

اختراق نظري: أول إثبات لقابلية الحساب في زمن متعدد الحدود للشروح الاحتمالية على النماذج الخطية
القيمة العملية: مفهوم $(δ,\varepsilon)$ -SR يحسن العملية مع الحفاظ على الضمانات النظرية
فصل النموذج: إنشاء فرق أساسي بين النماذج الخطية وأشجار القرار في تعقيد حساب الشروح

القيود

الكفاءة العملية: بالنسبة للبيانات عالية الأبعاد (مثل n=500)، الحساب لا يزال مكلفاً عندما ε=0.1، δ=0.01
افتراضات التوزيع: تفترض الخوارزمية توزيعاً منتظماً، التوسع إلى التوزيعات المنتجة يتطلب تقنيات جديدة
أنواع الميزات: تأخذ في الاعتبار فقط الميزات الثنائية، التطبيقات العملية تتطلب التعامل مع الميزات المستمرة والفئوية

الاتجاهات المستقبلية

تحسين الخوارزمية: تقليل الاعتماد على 1/ε و 1/δ
توسيع التوزيع: التعامل مع التوزيعات المنتجة والتوزيعات الميزة الأكثر عمومية
أنواع الميزات: التوسع إلى "المصنفات الخطية الممتدة" بأنواع ميزات مختلطة
لغات الاستعلام: تصميم لغة استعلام شروح احتمالية إعلانية

التقييم المتعمق

المزايا

مساهمة نظرية كبيرة:
- أول إثبات لقابلية المعالجة للشروح الاحتمالية على النماذج الخطية
- توفير تحليل تعقيد شامل وتصميم خوارزمية
- إثبات نتائج فصل مهمة
ابتكار الطريقة:
- مفهوم $(δ,\varepsilon)$ -SR يوازن بذكاء بين النظرية والعملية
- تقنية العشوائية تتجنب بفعالية الحالات الصعبة
- إثبات استراتيجية الجشع أنيق وعميق
تحليل متعمق:
- توفير إثباتات رياضية مفصلة
- النظر في مقاييس تعقيد متعددة
- إنشاء روابط واضحة مع الأعمال ذات الصلة

أوجه القصور

قيود العملية:
- الخوارزمية حساسة للمعاملات، الكفاءة سيئة في الحالات عالية الأبعاد
- تنطبق فقط على النماذج الخطية بميزات ثنائية
- افتراض التوزيع المنتظم قوي جداً في الممارسة
التحقق التجريبي غير كافٍ:
- نقص التحقق التجريبي على مجموعات بيانات كبيرة
- لا توجد مقارنة مع الطرق الاستكشافية الموجودة
- النتائج النظرية تحتاج إلى دعم تجريبي أكثر
مشاكل التوسع:
- التحديات التقنية كبيرة للتوسع إلى إعدادات أكثر عمومية
- وضوح التطبيق على خط أنابيب ML العملي غير واضح

التأثير

التأثير النظري: توفير نتيجة إيجابية مهمة لمجال الذكاء الاصطناعي القابل للتفسير الرسمي، كسر التركيز على الصعوبة في المجال
الإلهام الطريقة: تقنيات العشوائية والتخفيف قد تلهم حل المشاكل الصعبة الأخرى
القيمة العملية: توفير أساس نظري لقابلية التفسير للنماذج الخطية

السيناريوهات المعمول بها

التحكم المالي: شرح نماذج التقييم الخطية لقرارات القروض
التشخيص الطبي: شرح تقييم المخاطر بناءً على الانحدار الخطي
أنظمة التوصية: تحليل أهمية الميزات لنماذج التوصية الخطية
الامتثال القانوني: شروح القرارات الآلية بضمانات رياضية

المراجع

Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

تقدم هذه الورقة مساهمة نظرية مهمة في مجال الذكاء الاصطناعي القابل للتفسير الرسمي، حيث تثبت للمرة الأولى قابلية معالجة الشروح الاحتمالية على النماذج الخطية، مما يوفر نتيجة إيجابية نادرة لهذا المجال. على الرغم من وجود مجال للتحسين من حيث العملية، فإن قيمتها النظرية والابتكار الطريقة تجعلها عملاً مهماً في هذا المجال.