2025-11-23T22:52:23.771043

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

Filter, MÃ¶ller, ÃzÃ§ep

Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.

academic

Une Valeur de Shapley Basée sur le Ratio pour l'Apprentissage Automatique Collaboratif - Version Étendue

Informations Fondamentales

ID de l'article: 2510.13261
Titre: A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Auteurs: Björn Filter, Ralf Möller, Özgür Lütfü Özçep (Université de Hambourg, Allemagne)
Classification: cs.GT (Théorie des Jeux), cs.AI (Intelligence Artificielle)
Date de publication: 15 octobre 2025
Lien de l'article: https://arxiv.org/abs/2510.13261v1

Résumé

L'apprentissage automatique collaboratif permet à plusieurs propriétaires de données de former conjointement des modèles pour améliorer les performances prédictives. Cependant, assurer la compatibilité incitative et une distribution équitable des récompenses basée sur la contribution reste un défi clé. Les travaux antérieurs de Sim et al. distribuent les récompenses du modèle (non monétaires et librement reproductibles) en fonction de la valeur de Shapley basée sur la contribution de données de chaque partie, mesurée par le gain d'information. Cet article introduit une valeur de Shapley basée sur le ratio, remplaçant la formule additive standard par une mesure de contribution relative. Bien que le cadre global des récompenses (y compris les définitions incitatives et la configuration des récompenses du modèle) reste cohérent avec Sim et al., la fonction de valeur sous-jacente est fondamentalement différente. Cette évaluation alternative conduit à une distribution différente des récompenses du modèle et fournit une nouvelle perspective pour analyser les propriétés incitatives.

Contexte de Recherche et Motivation

Définition du Problème

Le problème central de l'apprentissage automatique collaboratif est de savoir comment distribuer équitablement les récompenses du modèle entre plusieurs propriétaires de données, en garantissant:

Compatibilité incitative: Les participants sont motivés à contribuer des données
Équité: Les récompenses sont proportionnelles aux contributions réelles
Faisabilité: La distribution des récompenses est techniquement réalisable

Importance du Problème

Avec les systèmes d'IA dépendant de plus en plus de la collaboration multi-agents, assurer des mécanismes de coopération équitables et compatibles avec les incitations est crucial pour la fiabilité technique et la viabilité éthique. Cela implique des défis complexes tels que l'alignement de l'IA et l'IA collaborative en matière de sécurité de l'IA.

Limitations des Approches Existantes

La théorie classique des jeux coopératifs suppose que les récompenses sont indivisibles et non reproductibles, mais dans l'apprentissage collaboratif:

Les récompenses sont des modèles entraînés ou des ensembles de données, reproductibles à l'infini
Les contributions marginales additives peuvent ne pas refléter l'importance contextuelle des données des participants
Par exemple: améliorer la précision d'un modèle faible de 10% à 20% peut être plus significatif que d'améliorer un modèle fort de 90% à 92%, mais les méthodes additives récompensent davantage cette dernière

Motivation de la Recherche

Cet article propose de remplacer les gains additifs par des contributions multiplicatives (basées sur le ratio), capturant l'impact relatif de chaque participant sur les performances du modèle, particulièrement adapté à:

Les scénarios avec qualité de données hétérogène
Les situations avec contributions redondantes
La construction de modèles en phase précoce

Contributions Principales

Proposition d'une valeur de Shapley basée sur le ratio: Remplaçant les contributions marginales absolues par des mesures d'amélioration relative
Maintien des garanties théoriques: Preuve que la nouvelle méthode satisfait les mêmes axiomes incitatifs et d'équité que la valeur de Shapley additive
Fourniture de fondations mathématiques: Fournit une alternative principielle au cadre de Shapley additif
Révélation de la non-unicité: Montre que le cadre axiomatique actuel n'établit pas de manière unique la valeur de Shapley, permettant l'existence de multiples mécanismes compatibles

Détails de la Méthode

Définition de la Tâche

Considérez un paramètre d'apprentissage collaboratif avec N participants, où chaque participant i ∈ N possède un ensemble de données privé et doit décider de le contribuer à une coalition conjointe pour l'entraînement du modèle. Modélisé comme un jeu coopératif sous forme caractéristique:

Ensemble de participants: N
Fonction de valeur: v : 2^N → R≥0, où v(∅) = 0
Monotonie: ∀C' ⊆ C ⊆ N, v(C') ≤ v(C)

Innovations Techniques Principales

1. Définition de la Contribution Marginale Relative

Pour un participant i ∈ N et une coalition C ⊆ N \ {i}, la contribution marginale relative est définie comme:

Δ^rel_{i,C} := {
    v_{C∪{i}}/v_C - 1, si v_C ≠ 0
    0, sinon
}

2. Valeur de Shapley Basée sur le Ratio

La valeur de Shapley basée sur le ratio pour le participant i est:

φ^rel_i := (1/n!) ∑_{π∈Π_N} Δ^rel_{i,S_{π,i}}

où Π_N est l'ensemble de toutes les permutations de N, et S_{π,i} est la coalition des participants précédant i dans la permutation π.

3. Mécanisme de Récompense Échelonné par ρ

Pour satisfaire l'efficacité faible (R3), appliquez l'échelonnage ρ:

r_i = (φ^rel_i/φ*_C)^ρ × v_C

où φ*C = max{i∈C} φ^rel_i assure la normalisation, et ρ ∈ 0,1 contrôle l'ampleur des récompenses, établissant un équilibre entre l'équité et la maximisation du bien-être social.

Garanties Théoriques

Axiomes Incitatifs (R1-R5)

R1 Non-négativité: Chaque participant reçoit une récompense non-négative
R2 Faisabilité: Les récompenses ne dépassent pas la valeur de la coalition
R3 Efficacité faible: Au moins un participant reçoit la valeur complète de la coalition
R4 Rationalité individuelle: Les récompenses sont au moins égales à la valeur de l'action solitaire
R5 Équité: Satisfait les axiomes d'équité F1-F4

Axiomes d'Équité (F1-F4)

F1 Inutilité: Les contributeurs nuls reçoivent une récompense nulle
F2 Symétrie: Les contributeurs identiques reçoivent des récompenses égales
F3 Expectativité stricte: Les contributeurs plus importants reçoivent plus de récompenses
F4 Monotonie stricte: Les récompenses augmentent lorsque les contributions augmentent

Configuration Expérimentale

Conception d'Expériences Synthétiques

Création de 7 agents {1,...,7}, avec configuration:

Valeur individuelle: v_i = √i
Valeur de coalition: v_C = √(∑_{i∈C} i)

Méthodes Comparatives

Comparaison des récompenses basées sur le ratio R_i avec les récompenses de Shapley additives A_i de Sim et al.:

R_i = (φ^rel_i/φ^{rel,*})^ρ × v_C
A_i = (φ^add_i/φ^{add,*})^ρ × v_C

Résultats Expérimentaux

Découvertes Principales

Différences de distribution des récompenses: Bien que les deux méthodes convergent approximativement dans les cas extrêmes (ρ=0 ou ρ=1), les courbes de récompense diffèrent considérablement dans la région intermédiaire
Plus équitable pour les participants de faible rang: La méthode basée sur le ratio montre une diminution plus lente des récompenses pour les participants de faible rang (lignes bleues et orange), car ils fournissent une valeur relative disproportionnément élevée dans les coalitions plus faibles
Modération pour les contributeurs élevés: Bien que les contributeurs élevés reçoivent toujours des récompenses considérablement plus importantes, la méthode basée sur le ratio leur attribue des récompenses légèrement inférieures, car les contributions relatives ne sont pas aussi significatives que les contributions absolues

Scénarios d'Avantage

Qualité de données hétérogène: Une petite quantité de données de haute qualité peut améliorer considérablement un modèle faible
Contributions redondantes: Situations où les gains marginaux additifs diminuent en raison d'informations chevauchantes
Modélisation en phase précoce: Scénarios où les gains absolus sont petits mais les améliorations relatives sont importantes

Travaux Connexes

Fondations de la Théorie des Jeux Coopératifs

Valeur de Shapley 7: Approche classique basée sur les contributions marginales additives attendues
Hypothèses traditionnelles que les récompenses sont indivisibles et non reproductibles 11,10

Apprentissage Automatique Collaboratif

Sim et al. 9: Première application de la valeur de Shapley aux récompenses de modèles reproductibles
Évaluation des données dans l'apprentissage fédéré 11
Cadres d'évaluation de données robustes comme Banzhaf 10

Avantages Relatifs de Cet Article

Fournit une alternative principielle dans les scénarios d'équité proportionnelle et où les contributions contextuelles sont plus importantes, tout en maintenant les mêmes garanties théoriques.

Conclusions et Discussion

Conclusions Principales

Équivalence théorique: La valeur de Shapley basée sur le ratio satisfait tous les mêmes axiomes incitatifs et d'équité que la version additive
Différence pratique: Produit un comportement significativement différent dans la distribution des récompenses, en particulier en mettant l'accent sur les contributions relatives
Découverte de non-unicité: Le cadre axiomatique actuel n'établit pas de manière unique la valeur de Shapley, permettant l'existence de multiples mécanismes compatibles

Limitations

Complexité computationnelle: Fait face aux mêmes défis de calcul exponentiel que la valeur de Shapley originale
Sensibilité aux paramètres: Le choix du paramètre ρ affecte la rationalité individuelle et la stabilité
Restriction des scénarios d'application: Plus adapté aux scénarios où l'amélioration relative est plus importante que les gains absolus

Directions Futures

Caractérisation complète: Nécessité de théorèmes de représentation formels décrivant toutes les fonctions satisfaisant les axiomes incitatifs
Extension des axiomes: Possibilité de nouveaux axiomes pour distinguer l'équité additive et proportionnelle
Schémas hybrides: Exploration de schémas de récompense hybrides interpolant entre les valeurs additives et basées sur le ratio
Évaluation empirique: Étude du comportement empirique sur des ensembles de données d'apprentissage collaboratif réels

Évaluation Approfondie

Points Forts

Rigueur théorique: Fournit des preuves mathématiques complètes assurant que toutes les propriétés clés sont satisfaites
Innovativité conceptuelle: Le passage du raisonnement additif au raisonnement multiplicatif offre une nouvelle perspective sur l'équité
Valeur pratique: Particulièrement adapté aux scénarios d'apprentissage collaboratif avec données hétérogènes ou redondantes
Compatibilité du cadre: Entièrement compatible avec le mécanisme d'échelonnage ρ existant et les outils d'analyse

Insuffisances

Limitation expérimentale: Fournit uniquement des expériences synthétiques, manque de validation sur des ensembles de données réels
Efficacité computationnelle: Ne discute pas des optimisations de calcul ou des algorithmes d'approximation
Orientation des paramètres: Manque de guidance pratique pour le choix du paramètre ρ
Études de cas d'application: Nécessite plus d'études de cas dans des domaines d'application spécifiques

Impact

Contribution théorique: Révèle un espace plus large pour la conception de mécanismes de récompense en apprentissage collaboratif
Guidance pratique: Fournit une base pour le choix des méthodes selon différents scénarios d'application
Inspiration pour la recherche: Ouvre des questions importantes sur l'exhaustivité et l'unicité des axiomes d'équité

Scénarios d'Application

IA Médicale Collaborative: Différences significatives de qualité de données entre institutions
Apprentissage Fédéré: Hétérogénéité des capacités des appareils et distribution des données
Numérisation de Documents: Évaluation de l'importance relative de la valeur des documents historiques
Réseaux de Capteurs: Environnements où la redondance et la complémentarité des données coexistent

Références

Les références principales incluent:

Shapley, L.S. (1953): A value for n-person games - Définition originale de la valeur de Shapley
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - Travail fondamental étendu par cet article
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - Aspects computationnels de la théorie des jeux coopératifs
Autres littératures connexes sur la sécurité de l'IA, l'IA collaborative et l'évaluation des données

Résumé: Cet article fournit une alternative à la valeur de Shapley mathématiquement rigoureuse, particulièrement adaptée aux scénarios d'apprentissage automatique collaboratif valorisant les contributions relatives plutôt que les différences absolues. Bien que la contribution théorique soit significative, une validation empirique plus approfondie et des cas d'application réels sont nécessaires pour démontrer pleinement sa valeur pratique.