2025-11-23T22:52:23.771043

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

Filter, Möller, Özçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic

قيمة شابلي القائمة على النسبة للتعلم الآلي التعاوني - النسخة الموسعة

المعلومات الأساسية

  • معرّف الورقة: 2510.13261
  • العنوان: A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
  • المؤلفون: بيورن فيلتر، رالف مولر، أوزغور لوتفو أوزتشيب (جامعة هامبورغ، ألمانيا)
  • التصنيف: cs.GT (نظرية الألعاب)، cs.AI (الذكاء الاصطناعي)
  • تاريخ النشر: 15 أكتوبر 2025
  • رابط الورقة: https://arxiv.org/abs/2510.13261v1

الملخص

يمكّن التعلم الآلي التعاوني عدة مالكي بيانات من تدريب نموذج مشترك لتحسين الأداء التنبؤية. ومع ذلك، يظل ضمان التوافق الحافزي والتوزيع العادل للمكافآت على أساس المساهمة تحديًا حاسمًا. قدم العمل السابق لسيم وآخرين توزيع مكافآت النموذج (غير نقدية وقابلة للنسخ بحرية) بناءً على قيمة شابلي المستندة إلى مساهمة البيانات لكل طرف، حيث تُقاس هذه المساهمة من خلال الكسب المعلوماتي. تقدم هذه الورقة قيمة شابلي قائمة على النسبة، تحل محل الصيغة الجمعية القياسية بمقياس المساهمة النسبية. بينما يظل إطار المكافآت الشامل (بما في ذلك تعريفات الحوافز وإعدادات مكافآت النموذج) متسقًا مع سيم وآخرين، فإن دالة القيمة الأساسية مختلفة جوهريًا. يؤدي هذا التقييم البديل إلى توزيع مكافآت نموذج مختلف ويوفر منظورًا جديدًا لتحليل خصائص الحوافز.

الخلفية البحثية والدافع

تعريف المشكلة

المشكلة الأساسية في التعلم الآلي التعاوني هي كيفية توزيع مكافآت النموذج بعدالة بين عدة مالكي بيانات، مع ضمان:

  1. التوافق الحافزي: للمشاركين حافز للمساهمة بالبيانات
  2. العدالة: تتناسب المكافآت مع المساهمة الفعلية
  3. الجدوى: يمكن تحقيق توزيع المكافآت تقنيًا

أهمية المشكلة

مع اعتماد أنظمة الذكاء الاصطناعي بشكل متزايد على التعاون متعدد الوكلاء، يعتبر ضمان آليات تعاون عادلة وحافزة متوافقة أمرًا حاسمًا لكل من الموثوقية التقنية والجدوى الأخلاقية. يتعلق هذا بتحديات معقدة في سلامة الذكاء الاصطناعي مثل محاذاة الذكاء الاصطناعي والذكاء الاصطناعي التعاوني.

قيود الأساليب الموجودة

تفترض نظرية الألعاب التعاونية التقليدية أن المكافآت غير قابلة للتقسيم وغير قابلة للنسخ، لكن في التعلم التعاوني:

  • المكافآت هي نماذج مدربة أو مجموعات بيانات قابلة للنسخ بلا حدود
  • قد لا تعكس المساهمة الهامشية الجمعية الأهمية السياقية لبيانات المشاركين
  • على سبيل المثال: تحسين دقة النموذج الضعيف من 10% إلى 20% قد يكون أكثر أهمية من تحسين النموذج القوي من 90% إلى 92%، لكن الطريقة الجمعية ستكافئ الأخيرة أكثر

الدافع البحثي

تقترح هذه الورقة استبدال المساهمة الجمعية (الكسب الجمعي) بمساهمة ضربية (قائمة على النسبة)، لالتقاط التأثير النسبي لكل مشارك على أداء النموذج، وهو مناسب بشكل خاص لـ:

  • السيناريوهات ذات جودة البيانات غير المتجانسة
  • الحالات التي توجد فيها مساهمات زائدة
  • بناء النموذج في المراحل المبكرة

المساهمات الأساسية

  1. اقتراح قيمة شابلي قائمة على النسبة: استبدال المساهمة الهامشية المطلقة بمقياس التحسن النسبي
  2. الحفاظ على الضمانات النظرية: إثبات أن الطريقة الجديدة تفي بنفس بديهيات الحوافز والعدالة مثل قيمة شابلي الجمعية
  3. توفير الأساس الرياضي: توفير بديل منهجي لإطار شابلي الجمعي
  4. الكشف عن عدم التفرد: إظهار أن الإطار البديهي الحالي لا يحدد قيمة شابلي بشكل فريد، مما يسمح بوجود آليات متعددة متوافقة

شرح الطريقة

تعريف المهمة

ضع في الاعتبار إعداد التعلم التعاوني لـ N مشارك، حيث يمتلك كل مشارك i ∈ N مجموعة بيانات خاصة، ويجب أن يقرر ما إذا كان سيساهم بها في تحالف مشترك لتدريب النموذج. يتم نمذجة ذلك كلعبة تعاونية في شكل خصائص:

  • مجموعة المشاركين: N
  • دالة القيمة: v : 2^N → R≥0، حيث v(∅) = 0
  • الرتابة: ∀C' ⊆ C ⊆ N, v(C') ≤ v(C)

الابتكارات التقنية الأساسية

1. تعريف المساهمة الهامشية النسبية

بالنسبة للمشارك i ∈ N والتحالف C ⊆ N \ {i}، تُعرّف المساهمة الهامشية النسبية كما يلي:

Δ^rel_{i,C} := {
    v_{C∪{i}}/v_C - 1, if v_C ≠ 0
    0, else
}

2. قيمة شابلي القائمة على النسبة

قيمة شابلي القائمة على النسبة للمشارك i هي:

φ^rel_i := (1/n!) ∑_{π∈Π_N} Δ^rel_{i,S_{π,i}}

حيث Π_N هي مجموعة جميع تبديلات N، و S_{π,i} هي تحالف المشاركين قبل i في التبديل π.

3. آلية المكافآت ذات التحجيم ρ

لتحقيق الكفاءة الضعيفة (R3)، يتم تطبيق التحجيم ρ:

r_i = (φ^rel_i/φ*_C)^ρ × v_C

حيث φ*C = max{i∈C} φ^rel_i يضمن التطبيع، و ρ ∈ 0,1 يتحكم في حجم المكافآت، مما يحقق توازنًا بين العدالة وتعظيم الرفاهية الاجتماعية.

الضمانات النظرية

بديهيات الحوافز (R1-R5)

  • R1 عدم السلبية: يحصل كل مشارك على مكافأة غير سالبة
  • R2 الجدوى: لا تتجاوز المكافآت قيمة التحالف
  • R3 الكفاءة الضعيفة: يحصل مشارك واحد على الأقل على القيمة الكاملة للتحالف
  • R4 العقلانية الفردية: المكافأة لا تقل عن قيمة العمل المستقل
  • R5 العدالة: تفي ببديهيات العدالة F1-F4

بديهيات العدالة (F1-F4)

  • F1 عدم الفائدة: يحصل المساهمون غير المفيدين على مكافأة صفرية
  • F2 التماثل: يحصل المساهمون المتطابقون على مكافآت متساوية
  • F3 الاستجابة الصارمة: يحصل المساهمون الأكبر على مكافآت أكبر
  • F4 الرتابة الصارمة: تزداد المكافآت عند زيادة المساهمة

إعداد التجارب

تصميم التجارب الاصطناعية

إنشاء 7 وكلاء {1,...,7}، مع الإعدادات:

  • القيمة الفردية: v_i = √i
  • قيمة التحالف: v_C = √(∑_{i∈C} i)

طرق المقارنة

مقارنة المكافآت القائمة على النسبة R_i مع مكافآت شابلي الجمعية لسيم وآخرين A_i:

R_i = (φ^rel_i/φ^{rel,*})^ρ × v_C
A_i = (φ^add_i/φ^{add,*})^ρ × v_C

نتائج التجارب

النتائج الرئيسية

  1. اختلاف توزيع المكافآت: بينما تتقارب الطريقتان في الحالات القصوى (ρ=0 أو ρ=1)، تختلف منحنيات المكافآت بشكل كبير في المنطقة الوسطى
  2. عدالة أكبر تجاه المشاركين ذوي الترتيب المنخفض: تقدم الطريقة القائمة على النسبة انخفاضًا أبطأ في المكافآت للمشاركين ذوي الترتيب المنخفض (الخطوط الزرقاء والبرتقالية)، لأنهم يوفرون قيمة نسبية عالية بشكل غير متناسب في التحالفات الأضعف
  3. تعديل المساهمين الكبار: بينما يحصل المساهمون الكبار على مكافآت أكبر بشكل ملحوظ، فإن مكافآتهم أصغر قليلاً في الطريقة القائمة على النسبة، لأن المساهمة النسبية ليست بنفس أهمية المساهمة المطلقة

السيناريوهات المفيدة

  1. جودة البيانات غير المتجانسة: كمية صغيرة من البيانات عالية الجودة يمكن أن تحسن النموذج الضعيف بشكل كبير
  2. المساهمات الزائدة: حالات حيث ينخفض الكسب الهامشي الجمعي بسبب المعلومات المتداخلة
  3. بناء النموذج في المراحل المبكرة: سيناريوهات حيث يكون الكسب المطلق صغيرًا لكن التحسن النسبي كبير

الأعمال ذات الصلة

أساسيات نظرية الألعاب التعاونية

  • قيمة شابلي 7: الطريقة الكلاسيكية المستندة إلى المساهمة الهامشية الجمعية المتوقعة
  • الافتراضات التقليدية بأن المكافآت غير قابلة للتقسيم وغير قابلة للنسخ 11,10

التعلم الآلي التعاوني

  • سيم وآخرون 9: أول تطبيق لقيمة شابلي على مكافآت النموذج القابلة للنسخ
  • تقدير البيانات في التعلم الموحد 11
  • أطر تقدير البيانات القوية مثل Banzhaf 10

الميزة النسبية لهذه الورقة

توفر بديلاً منهجيًا في سيناريوهات العدالة النسبية والمساهمة السياقية الأكثر أهمية، مع الحفاظ على نفس الضمانات النظرية.

الاستنتاجات والمناقشة

الاستنتاجات الرئيسية

  1. التكافؤ النظري: تفي قيمة شابلي القائمة على النسبة بجميع بديهيات الحوافز والعدالة نفسها مثل النسخة الجمعية
  2. الاختلاف العملي: تنتج سلوكًا مختلفًا بشكل كبير في توزيع المكافآت، خاصة في التركيز على المساهمة النسبية
  3. اكتشاف عدم التفرد: الإطار البديهي الحالي لا يحدد قيمة شابلي بشكل فريد، مما يسمح بوجود آليات متعددة متوافقة

القيود

  1. التعقيد الحسابي: تواجه نفس التحديات الحسابية الأسية مثل قيمة شابلي الأصلية
  2. حساسية المعاملات: يؤثر اختيار معامل ρ على العقلانية الفردية والاستقرار
  3. تقييد السيناريوهات: أكثر ملاءمة للسيناريوهات حيث يكون التحسن النسبي أكثر أهمية من الكسب المطلق
  4. حالات التطبيق: تحتاج إلى مزيد من دراسات الحالات في مجالات التطبيق المحددة

التأثير

  1. المساهمة النظرية: تكشف عن مساحة أكبر لتصميم آليات المكافآت في التعلم التعاوني
  2. التوجيه العملي: توفر أساسًا لاختيار الطريقة لسيناريوهات تطبيق مختلفة
  3. الإلهام البحثي: تفتح أسئلة مهمة حول اكتمال وتفرد بديهيات العدالة

السيناريوهات المناسبة

  1. التعاون في الذكاء الاصطناعي الطبي: تختلف جودة البيانات بشكل كبير بين المؤسسات
  2. التعلم الموحد: تنوع قدرات الأجهزة والتوزيع غير المتجانس للبيانات
  3. رقمنة المستندات: تقييم الأهمية النسبية للمستندات التاريخية
  4. شبكات المستشعرات: بيئات توجد فيها الزيادة والتكامل في البيانات

المراجع

تشمل المراجع الرئيسية:

  • Shapley, L.S. (1953): A value for n-person games - التعريف الأصلي لقيمة شابلي
  • Sim, R.H.L. وآخرون (2020): Collaborative machine learning with incentive-aware model rewards - العمل الأساسي الذي تمدده هذه الورقة
  • Chalkiadakis, G. وآخرون (2011): Computational aspects of cooperative game theory - الجوانب الحسابية لنظرية الألعاب التعاونية
  • أدبيات أخرى ذات صلة في سلامة الذكاء الاصطناعي والذكاء الاصطناعي التعاوني وتقدير البيانات

الملخص: توفر هذه الورقة بديلاً صارمًا رياضيًا لقيمة شابلي، مناسب بشكل خاص لسيناريوهات التعلم الآلي التعاوني التي تركز على المساهمة النسبية بدلاً من الفروقات المطلقة. بينما تكون المساهمة النظرية كبيرة، يلزم المزيد من التحقق التجريبي وحالات التطبيق الفعلية لإثبات قيمتها العملية بشكل كامل.