A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Filter, Möller, Ãzçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic
قيمة شابلي القائمة على النسبة للتعلم الآلي التعاوني - النسخة الموسعة
يمكّن التعلم الآلي التعاوني عدة مالكي بيانات من تدريب نموذج مشترك لتحسين الأداء التنبؤية. ومع ذلك، يظل ضمان التوافق الحافزي والتوزيع العادل للمكافآت على أساس المساهمة تحديًا حاسمًا. قدم العمل السابق لسيم وآخرين توزيع مكافآت النموذج (غير نقدية وقابلة للنسخ بحرية) بناءً على قيمة شابلي المستندة إلى مساهمة البيانات لكل طرف، حيث تُقاس هذه المساهمة من خلال الكسب المعلوماتي. تقدم هذه الورقة قيمة شابلي قائمة على النسبة، تحل محل الصيغة الجمعية القياسية بمقياس المساهمة النسبية. بينما يظل إطار المكافآت الشامل (بما في ذلك تعريفات الحوافز وإعدادات مكافآت النموذج) متسقًا مع سيم وآخرين، فإن دالة القيمة الأساسية مختلفة جوهريًا. يؤدي هذا التقييم البديل إلى توزيع مكافآت نموذج مختلف ويوفر منظورًا جديدًا لتحليل خصائص الحوافز.
مع اعتماد أنظمة الذكاء الاصطناعي بشكل متزايد على التعاون متعدد الوكلاء، يعتبر ضمان آليات تعاون عادلة وحافزة متوافقة أمرًا حاسمًا لكل من الموثوقية التقنية والجدوى الأخلاقية. يتعلق هذا بتحديات معقدة في سلامة الذكاء الاصطناعي مثل محاذاة الذكاء الاصطناعي والذكاء الاصطناعي التعاوني.
تفترض نظرية الألعاب التعاونية التقليدية أن المكافآت غير قابلة للتقسيم وغير قابلة للنسخ، لكن في التعلم التعاوني:
المكافآت هي نماذج مدربة أو مجموعات بيانات قابلة للنسخ بلا حدود
قد لا تعكس المساهمة الهامشية الجمعية الأهمية السياقية لبيانات المشاركين
على سبيل المثال: تحسين دقة النموذج الضعيف من 10% إلى 20% قد يكون أكثر أهمية من تحسين النموذج القوي من 90% إلى 92%، لكن الطريقة الجمعية ستكافئ الأخيرة أكثر
تقترح هذه الورقة استبدال المساهمة الجمعية (الكسب الجمعي) بمساهمة ضربية (قائمة على النسبة)، لالتقاط التأثير النسبي لكل مشارك على أداء النموذج، وهو مناسب بشكل خاص لـ:
ضع في الاعتبار إعداد التعلم التعاوني لـ N مشارك، حيث يمتلك كل مشارك i ∈ N مجموعة بيانات خاصة، ويجب أن يقرر ما إذا كان سيساهم بها في تحالف مشترك لتدريب النموذج. يتم نمذجة ذلك كلعبة تعاونية في شكل خصائص:
اختلاف توزيع المكافآت: بينما تتقارب الطريقتان في الحالات القصوى (ρ=0 أو ρ=1)، تختلف منحنيات المكافآت بشكل كبير في المنطقة الوسطى
عدالة أكبر تجاه المشاركين ذوي الترتيب المنخفض: تقدم الطريقة القائمة على النسبة انخفاضًا أبطأ في المكافآت للمشاركين ذوي الترتيب المنخفض (الخطوط الزرقاء والبرتقالية)، لأنهم يوفرون قيمة نسبية عالية بشكل غير متناسب في التحالفات الأضعف
تعديل المساهمين الكبار: بينما يحصل المساهمون الكبار على مكافآت أكبر بشكل ملحوظ، فإن مكافآتهم أصغر قليلاً في الطريقة القائمة على النسبة، لأن المساهمة النسبية ليست بنفس أهمية المساهمة المطلقة
Shapley, L.S. (1953): A value for n-person games - التعريف الأصلي لقيمة شابلي
Sim, R.H.L. وآخرون (2020): Collaborative machine learning with incentive-aware model rewards - العمل الأساسي الذي تمدده هذه الورقة
Chalkiadakis, G. وآخرون (2011): Computational aspects of cooperative game theory - الجوانب الحسابية لنظرية الألعاب التعاونية
أدبيات أخرى ذات صلة في سلامة الذكاء الاصطناعي والذكاء الاصطناعي التعاوني وتقدير البيانات
الملخص: توفر هذه الورقة بديلاً صارمًا رياضيًا لقيمة شابلي، مناسب بشكل خاص لسيناريوهات التعلم الآلي التعاوني التي تركز على المساهمة النسبية بدلاً من الفروقات المطلقة. بينما تكون المساهمة النظرية كبيرة، يلزم المزيد من التحقق التجريبي وحالات التطبيق الفعلية لإثبات قيمتها العملية بشكل كامل.