A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Filter, Möller, Ãzçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic
सहयोगी मशीन लर्निंग के लिए अनुपात-आधारित शैपली मान - विस्तारित संस्करण
सहयोगी मशीन लर्निंग कई डेटा मालिकों को पूर्वानुमान प्रदर्शन में सुधार के लिए संयुक्त रूप से मॉडल प्रशिक्षित करने में सक्षम बनाती है। हालांकि, प्रोत्साहन संगतता सुनिश्चित करना और योगदान-आधारित न्यायसंगत पुरस्कार वितरण एक महत्वपूर्ण चुनौती बनी हुई है। सिम आदि के पूर्व कार्य ने प्रत्येक पक्ष के डेटा योगदान के आधार पर शैपली मान के माध्यम से मॉडल पुरस्कार (गैर-मौद्रिक और स्वतंत्र रूप से प्रतिलिपि योग्य) वितरित किए, जिसे सूचना लाभ द्वारा मापा जाता है। यह पेपर एक अनुपात-आधारित शैपली मान प्रस्तुत करता है, जो मानक योगात्मक सूत्र को सापेक्ष योगदान माप से बदल देता है। हालांकि समग्र पुरस्कार ढांचा (प्रोत्साहन परिभाषा और मॉडल पुरस्कार सेटिंग सहित) सिम आदि के साथ सुसंगत रहता है, अंतर्निहित मूल्य फ़ंक्शन मौलिक रूप से भिन्न है। यह वैकल्पिक मूल्यांकन विभिन्न मॉडल पुरस्कार वितरण की ओर ले जाता है और प्रोत्साहन गुणों का विश्लेषण करने के लिए एक नया दृष्टिकोण प्रदान करता है।
जैसे-जैसे AI सिस्टम बहु-एजेंट सहयोग पर अधिक निर्भर होते जा रहे हैं, न्यायसंगत और प्रोत्साहन-संगत सहयोग तंत्र सुनिश्चित करना तकनीकी विश्वसनीयता और नैतिक व्यावहारिकता दोनों के लिए महत्वपूर्ण है। यह AI सुरक्षा में AI संरेखण और सहयोगी AI जैसी जटिल चुनौतियों को शामिल करता है।
पारंपरिक सहयोगी गेम थ्योरी मानती है कि पुरस्कार अविभाज्य और गैर-प्रतिलिपि योग्य हैं, लेकिन सहयोगी सीखने में:
पुरस्कार प्रशिक्षित मॉडल या डेटासेट हैं, जो असीमित रूप से प्रतिलिपि योग्य हैं
योगात्मक सीमांत योगदान प्रतिभागियों के डेटा के संदर्भ महत्व को प्रतिबिंबित नहीं कर सकते
उदाहरण: कमजोर मॉडल सटीकता को 10% से 20% तक बढ़ाना मजबूत मॉडल को 90% से 92% तक बढ़ाने से अधिक महत्वपूर्ण हो सकता है, लेकिन योगात्मक विधि बाद वाले को अधिक पुरस्कृत करेगी
यह पेपर योगात्मक लाभ को गुणात्मक (अनुपात-आधारित) योगदान से बदलने का प्रस्ताव देता है, जो प्रत्येक प्रतिभागी के मॉडल प्रदर्शन पर सापेक्ष प्रभाव को पकड़ता है, विशेष रूप से उपयुक्त:
N प्रतिभागियों की सहयोगी सीखने की सेटिंग पर विचार करें, जहां प्रत्येक प्रतिभागी i ∈ N के पास निजी डेटासेट है, और यह तय करने की आवश्यकता है कि क्या इसे संयुक्त गठबंधन में मॉडल प्रशिक्षण के लिए योगदान देना है। विशेषता रूप में सहयोगी गेम के रूप में मॉडल किया गया:
कमजोर दक्षता (R3) को संतुष्ट करने के लिए, ρ-स्केलिंग लागू करें:
r_i = (φ^rel_i/φ*_C)^ρ × v_C
जहां φ*C = max{i∈C} φ^rel_i मानकीकरण सुनिश्चित करता है, ρ ∈ 0,1 पुरस्कार आकार को नियंत्रित करता है, न्यायसंगतता और सामाजिक कल्याण अधिकतमकरण के बीच संतुलन बनाता है।
पुरस्कार वितरण अंतर: हालांकि दोनों विधियां चरम मामलों में (ρ=0 या ρ=1) लगभग अभिसरण करती हैं, मध्य क्षेत्र में पुरस्कार वक्र महत्वपूर्ण रूप से भिन्न होते हैं
निम्न रैंक प्रतिभागियों के लिए अधिक न्यायसंगत: अनुपात-आधारित विधि निम्न रैंक प्रतिभागियों (नीली और नारंगी लाइनें) के लिए पुरस्कार में अधिक धीमी गिरावट प्रदान करती है, क्योंकि वे कमजोर गठबंधन में असमान रूप से उच्च सापेक्ष मूल्य प्रदान करते हैं
उच्च योगदानकर्ताओं का समायोजन: हालांकि उच्च योगदानकर्ता अभी भी महत्वपूर्ण रूप से बड़े पुरस्कार प्राप्त करते हैं, अनुपात-आधारित विधि में उनके पुरस्कार थोड़े छोटे होते हैं, क्योंकि सापेक्ष योगदान पूर्ण योगदान जितना महत्वपूर्ण नहीं है
अनुपातिक न्यायसंगतता और संदर्भ योगदान अधिक महत्वपूर्ण होने वाले परिदृश्यों में एक सिद्धांतवादी विकल्प प्रदान करता है, जबकि समान सैद्धांतिक गारंटियां बनाए रखता है।
Shapley, L.S. (1953): A value for n-person games - शैपली मान की मूल परिभाषा
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - इस पेपर के विस्तार का आधार कार्य
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - सहयोगी गेम थ्योरी के कम्प्यूटेशनल पहलू
अन्य संबंधित AI सुरक्षा, सहयोगी AI और डेटा मूल्यांकन साहित्य
सारांश: यह पेपर एक गणितीय रूप से कठोर शैपली मान विकल्प प्रदान करता है, विशेष रूप से सापेक्ष योगदान को पूर्ण अंतर के बजाय महत्व देने वाली सहयोगी मशीन लर्निंग परिदृश्यों के लिए उपयुक्त। हालांकि सैद्धांतिक योगदान महत्वपूर्ण है, इसके व्यावहारिक मूल्य को पूरी तरह से साबित करने के लिए अधिक अनुभवजन्य सत्यापन और वास्तविक अनुप्रयोग केस की आवश्यकता है।