A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Filter, Möller, Ãzçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic
Ein verhältnisbasierter Shapley-Wert für kollaboratives maschinelles Lernen - Erweiterte Version
Kollaboratives maschinelles Lernen ermöglicht es mehreren Dateneigentümern, Modelle gemeinsam zu trainieren, um die Vorhersageleistung zu verbessern. Die Sicherstellung von Anreizkompatibilität und beitragsbasierter fairer Belohnungsverteilung bleibt jedoch eine Schlüsselherausforderung. Frühere Arbeiten von Sim et al. verteilten Modellbelohnungen (nicht-monetär und frei replizierbar) basierend auf dem Shapley-Wert jeder Partei, wobei der Beitrag durch Informationsgewinn gemessen wurde. Dieses Papier führt einen verhältnisbasierten Shapley-Wert ein, der die standardmäßige additive Formel durch relative Beitragsmessungen ersetzt. Obwohl das Gesamtbelohnungsrahmenwerk (einschließlich Anreiz-Definitionen und Modellbelohnungseinstellungen) mit Sim et al. konsistent bleibt, unterscheidet sich die zugrunde liegende Wertfunktion grundlegend. Diese alternative Bewertung führt zu unterschiedlichen Modellbelohnungsverteilungen und bietet neue Perspektiven zur Analyse von Anreizeigenschaften.
Das Kernproblem beim kollaborativen maschinellen Lernen ist die faire Verteilung von Modellbelohnungen zwischen mehreren Dateneigentümern unter Gewährleistung von:
Anreizkompatibilität: Teilnehmer haben einen Anreiz, Daten beizutragen
Fairness: Belohnungen sind proportional zu tatsächlichen Beiträgen
Machbarkeit: Belohnungsverteilung ist technisch umsetzbar
Mit zunehmender Abhängigkeit von KI-Systemen von Multi-Agent-Zusammenarbeit ist die Sicherstellung fairer und anreizgerechter Kooperationsmechanismen sowohl für technische Zuverlässigkeit als auch ethische Machbarkeit entscheidend. Dies betrifft komplexe Herausforderungen in der KI-Sicherheit wie KI-Ausrichtung und kooperative KI.
Traditionelle kooperative Spieltheorie geht davon aus, dass Belohnungen unteilbar und nicht replizierbar sind, aber beim kollaborativen Lernen:
Belohnungen sind trainierte Modelle oder Datensätze, die unbegrenzt replizierbar sind
Additive Grenzleistungen können die kontextuelle Bedeutung der Daten eines Teilnehmers möglicherweise nicht widerspiegeln
Beispiel: Die Verbesserung der Modellgenauigkeit von 10% auf 20% könnte bedeutungsvoller sein als die Verbesserung von 90% auf 92%, aber additive Methoden würden letztere stärker belohnen
Dieses Papier schlägt vor, additive Gewinne durch multiplikative (verhältnisbasierte) Beiträge zu ersetzen, um die relative Auswirkung jedes Teilnehmers auf die Modellleistung zu erfassen, besonders geeignet für:
Einführung eines verhältnisbasierten Shapley-Werts: Ersetzt absolute Grenzleistungen durch relative Verbesserungsmessungen
Beibehaltung theoretischer Garantien: Beweist, dass die neue Methode dieselben Anreiz- und Fairness-Axiome wie der additive Shapley-Wert erfüllt
Mathematische Grundlagen: Bietet einen prinzipiengestützten Alternativvorschlag zum additiven Shapley-Rahmenwerk
Offenlegung von Nicht-Eindeutigkeit: Zeigt, dass das aktuelle Axiom-Rahmenwerk den Shapley-Wert nicht eindeutig bestimmt, sondern mehrere kompatible Mechanismen zulässt
Betrachten Sie eine kollaborative Lerneinstellung mit N Teilnehmern, wobei jeder Teilnehmer i ∈ N einen privaten Datensatz besitzt und entscheiden muss, ob dieser zur gemeinsamen Koalition für das Modelltraining beigetragen wird. Modelliert als kooperatives Spiel in charakteristischer Form:
Um schwache Effizienz (R3) zu erfüllen, wird ρ-Skalierung angewendet:
r_i = (φ^rel_i/φ*_C)^ρ × v_C
wobei φ*C = max{i∈C} φ^rel_i Normalisierung sichert und ρ ∈ 0,1 die Belohnungsgröße kontrolliert und zwischen Fairness und Maximierung des sozialen Wohlstands abwägt.
Unterschiede in der Belohnungsverteilung: Obwohl beide Methoden in Extremfällen (ρ=0 oder ρ=1) annähernd konvergieren, unterscheiden sich die Belohnungskurven im mittleren Bereich erheblich
Fairere Behandlung von niedrig bewerteten Teilnehmern: Die verhältnisbasierte Methode zeigt einen langsameren Rückgang der Belohnungen für niedrig bewertete Teilnehmer (blaue und orangefarbene Linien), da sie in schwächeren Koalitionen einen überproportional hohen relativen Wert bieten
Moderation für Hochleistungsbeitragsteller: Obwohl Hochleistungsbeitragsteller weiterhin erheblich höhere Belohnungen erhalten, sind ihre Belohnungen in der verhältnisbasierten Methode etwas geringer, da relative Beiträge nicht so signifikant sind wie absolute Beiträge
Bietet einen prinzipiengestützten Alternativvorschlag für Szenarien mit proportionaler Fairness und kontextueller Bedeutung von Beiträgen, während die gleichen theoretischen Garantien beibehalten werden.
Vollständige Charakterisierung: Formalisierte Darstellungssätze sind erforderlich, die alle Funktionen beschreiben, die anreizgestützte Axiome erfüllen
Axiom-Erweiterung: Möglicherweise sind neue Axiome erforderlich, um zwischen additiver und proportionaler Fairness zu unterscheiden
Hybridansätze: Erkundung von Mischbelohnungsschemata, die zwischen additiven und verhältnisbasierten Werten interpolieren
Empirische Bewertung: Untersuchung des empirischen Verhaltens auf echten kollaborativen Lern-Datensätzen
Shapley, L.S. (1953): A value for n-person games - Ursprüngliche Definition des Shapley-Werts
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - Grundlage dieser Arbeit
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - Rechnerische Aspekte der kooperativen Spieltheorie
Weitere verwandte Literatur zu KI-Sicherheit, kooperativer KI und Datenbewertung
Zusammenfassung: Dieses Papier bietet einen mathematisch strengen Alternativvorschlag zum Shapley-Wert, besonders geeignet für kollaborative Lernszenarien, die relative statt absolute Unterschiede betonen. Obwohl der theoretische Beitrag erheblich ist, sind mehr empirische Validierungen und praktische Anwendungsfälle erforderlich, um seinen praktischen Wert vollständig nachzuweisen.