A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Filter, Möller, Ãzçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic
Une Valeur de Shapley Basée sur le Ratio pour l'Apprentissage Automatique Collaboratif - Version Étendue
L'apprentissage automatique collaboratif permet à plusieurs propriétaires de données de former conjointement des modèles pour améliorer les performances prédictives. Cependant, assurer la compatibilité incitative et une distribution équitable des récompenses basée sur la contribution reste un défi clé. Les travaux antérieurs de Sim et al. distribuent les récompenses du modèle (non monétaires et librement reproductibles) en fonction de la valeur de Shapley basée sur la contribution de données de chaque partie, mesurée par le gain d'information. Cet article introduit une valeur de Shapley basée sur le ratio, remplaçant la formule additive standard par une mesure de contribution relative. Bien que le cadre global des récompenses (y compris les définitions incitatives et la configuration des récompenses du modèle) reste cohérent avec Sim et al., la fonction de valeur sous-jacente est fondamentalement différente. Cette évaluation alternative conduit à une distribution différente des récompenses du modèle et fournit une nouvelle perspective pour analyser les propriétés incitatives.
Le problème central de l'apprentissage automatique collaboratif est de savoir comment distribuer équitablement les récompenses du modèle entre plusieurs propriétaires de données, en garantissant:
Compatibilité incitative: Les participants sont motivés à contribuer des données
Équité: Les récompenses sont proportionnelles aux contributions réelles
Faisabilité: La distribution des récompenses est techniquement réalisable
Avec les systèmes d'IA dépendant de plus en plus de la collaboration multi-agents, assurer des mécanismes de coopération équitables et compatibles avec les incitations est crucial pour la fiabilité technique et la viabilité éthique. Cela implique des défis complexes tels que l'alignement de l'IA et l'IA collaborative en matière de sécurité de l'IA.
La théorie classique des jeux coopératifs suppose que les récompenses sont indivisibles et non reproductibles, mais dans l'apprentissage collaboratif:
Les récompenses sont des modèles entraînés ou des ensembles de données, reproductibles à l'infini
Les contributions marginales additives peuvent ne pas refléter l'importance contextuelle des données des participants
Par exemple: améliorer la précision d'un modèle faible de 10% à 20% peut être plus significatif que d'améliorer un modèle fort de 90% à 92%, mais les méthodes additives récompensent davantage cette dernière
Cet article propose de remplacer les gains additifs par des contributions multiplicatives (basées sur le ratio), capturant l'impact relatif de chaque participant sur les performances du modèle, particulièrement adapté à:
Proposition d'une valeur de Shapley basée sur le ratio: Remplaçant les contributions marginales absolues par des mesures d'amélioration relative
Maintien des garanties théoriques: Preuve que la nouvelle méthode satisfait les mêmes axiomes incitatifs et d'équité que la valeur de Shapley additive
Fourniture de fondations mathématiques: Fournit une alternative principielle au cadre de Shapley additif
Révélation de la non-unicité: Montre que le cadre axiomatique actuel n'établit pas de manière unique la valeur de Shapley, permettant l'existence de multiples mécanismes compatibles
Considérez un paramètre d'apprentissage collaboratif avec N participants, où chaque participant i ∈ N possède un ensemble de données privé et doit décider de le contribuer à une coalition conjointe pour l'entraînement du modèle. Modélisé comme un jeu coopératif sous forme caractéristique:
Pour satisfaire l'efficacité faible (R3), appliquez l'échelonnage ρ:
r_i = (φ^rel_i/φ*_C)^ρ × v_C
où φ*C = max{i∈C} φ^rel_i assure la normalisation, et ρ ∈ 0,1 contrôle l'ampleur des récompenses, établissant un équilibre entre l'équité et la maximisation du bien-être social.
Différences de distribution des récompenses: Bien que les deux méthodes convergent approximativement dans les cas extrêmes (ρ=0 ou ρ=1), les courbes de récompense diffèrent considérablement dans la région intermédiaire
Plus équitable pour les participants de faible rang: La méthode basée sur le ratio montre une diminution plus lente des récompenses pour les participants de faible rang (lignes bleues et orange), car ils fournissent une valeur relative disproportionnément élevée dans les coalitions plus faibles
Modération pour les contributeurs élevés: Bien que les contributeurs élevés reçoivent toujours des récompenses considérablement plus importantes, la méthode basée sur le ratio leur attribue des récompenses légèrement inférieures, car les contributions relatives ne sont pas aussi significatives que les contributions absolues
Fournit une alternative principielle dans les scénarios d'équité proportionnelle et où les contributions contextuelles sont plus importantes, tout en maintenant les mêmes garanties théoriques.
Équivalence théorique: La valeur de Shapley basée sur le ratio satisfait tous les mêmes axiomes incitatifs et d'équité que la version additive
Différence pratique: Produit un comportement significativement différent dans la distribution des récompenses, en particulier en mettant l'accent sur les contributions relatives
Découverte de non-unicité: Le cadre axiomatique actuel n'établit pas de manière unique la valeur de Shapley, permettant l'existence de multiples mécanismes compatibles
Shapley, L.S. (1953): A value for n-person games - Définition originale de la valeur de Shapley
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - Travail fondamental étendu par cet article
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - Aspects computationnels de la théorie des jeux coopératifs
Autres littératures connexes sur la sécurité de l'IA, l'IA collaborative et l'évaluation des données
Résumé: Cet article fournit une alternative à la valeur de Shapley mathématiquement rigoureuse, particulièrement adaptée aux scénarios d'apprentissage automatique collaboratif valorisant les contributions relatives plutôt que les différences absolues. Bien que la contribution théorique soit significative, une validation empirique plus approfondie et des cas d'application réels sont nécessaires pour démontrer pleinement sa valeur pratique.