A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Filter, Möller, Ãzçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic
Un Valor de Shapley Basado en Ratios para Aprendizaje Automático Colaborativo - Versión Extendida
El aprendizaje automático colaborativo permite que múltiples propietarios de datos entrenen conjuntamente modelos para mejorar el rendimiento predictivo. Sin embargo, garantizar la compatibilidad de incentivos y la distribución equitativa de recompensas basada en contribuciones sigue siendo un desafío crítico. Trabajos previos de Sim et al. asignan recompensas de modelos (no monetarias y libremente replicables) basadas en el valor de Shapley de la contribución de datos de cada participante, medida mediante ganancia de información. Este artículo introduce un valor de Shapley basado en ratios, reemplazando la fórmula aditiva estándar con una métrica de contribución relativa. Aunque el marco general de recompensas (incluyendo definiciones de incentivos y configuración de recompensas de modelos) se mantiene consistente con Sim et al., la función de valor subyacente es fundamentalmente diferente. Esta valuación alternativa resulta en distribuciones de recompensas de modelos distintas y proporciona nuevas perspectivas para analizar propiedades de incentivos.
El problema central en el aprendizaje automático colaborativo es cómo distribuir equitativamente las recompensas de modelos entre múltiples propietarios de datos, asegurando:
Compatibilidad de Incentivos: Los participantes tienen motivación para contribuir datos
Equidad: Las recompensas son proporcionales a las contribuciones reales
Viabilidad: La distribución de recompensas es técnicamente implementable
Con sistemas de IA cada vez más dependientes de la colaboración multiagente, garantizar mecanismos de cooperación equitativos y compatibles con incentivos es crítico tanto para la confiabilidad técnica como para la viabilidad ética. Esto implica desafíos complejos como alineación de IA y IA colaborativa en seguridad de IA.
La teoría de juegos cooperativos tradicional asume que las recompensas son indivisibles e irreplicables, pero en aprendizaje colaborativo:
Las recompensas son modelos entrenados o conjuntos de datos, infinitamente replicables
Las contribuciones marginales aditivas pueden no reflejar la importancia contextual de los datos de los participantes
Por ejemplo: mejorar la precisión de un modelo débil del 10% al 20% puede ser más significativo que mejorar un modelo fuerte del 90% al 92%, pero los métodos aditivos recompensarían más al segundo
Este artículo propone reemplazar contribuciones aditivas con contribuciones multiplicativas (basadas en ratios), capturando el impacto relativo de cada participante en el rendimiento del modelo, particularmente adecuado para:
Considere un entorno de aprendizaje colaborativo con N participantes, donde cada participante i ∈ N posee un conjunto de datos privado y debe decidir si contribuirlo a una coalición conjunta para entrenamiento de modelos. Se modela como un juego cooperativo en forma característica:
Para satisfacer eficiencia débil (R3), se aplica escalado ρ:
r_i = (φ^rel_i/φ*_C)^ρ × v_C
donde φ*C = max{i∈C} φ^rel_i asegura normalización, y ρ ∈ 0,1 controla la magnitud de recompensas, equilibrando entre equidad y maximización del bienestar social.
Diferencias en Distribución de Recompensas: Aunque ambos métodos convergen aproximadamente en casos extremos (ρ=0 o ρ=1), las curvas de recompensas difieren significativamente en regiones intermedias
Mayor Equidad para Participantes de Bajo Rango: El método basado en ratios muestra una disminución más lenta de recompensas para participantes de bajo rango (líneas azul y naranja), ya que proporcionan un valor relativo desproporcionadamente alto en coaliciones más débiles
Moderación para Contribuyentes Altos: Aunque los contribuyentes altos aún reciben recompensas significativamente mayores, en el método basado en ratios sus recompensas son ligeramente menores, ya que las contribuciones relativas no son tan prominentes como las absolutas
Proporciona una alternativa principiada en escenarios donde la equidad proporcional y la contribución contextual son más importantes, manteniendo simultáneamente las mismas garantías teóricas.
Equivalencia Teórica: El valor de Shapley basado en ratios satisface todos los mismos axiomas de incentivos y equidad que la versión aditiva
Diferencia Práctica: Produce comportamientos significativamente diferentes en la distribución de recompensas, particularmente en énfasis en contribuciones relativas
Hallazgo de No Unicidad: El marco axiomático actual no determina únicamente el valor de Shapley, permitiendo múltiples mecanismos compatibles
Caracterización Completa: Se necesita un teorema de representación formal que describa todas las funciones que satisfacen axiomas sensibles a incentivos
Extensión de Axiomas: Posiblemente se requieran nuevos axiomas para distinguir entre equidad aditiva y proporcional
Esquemas Híbridos: Explorar esquemas de recompensa híbrida que interpolen entre valores aditivos y basados en ratios
Evaluación Empírica: Investigación del comportamiento empírico en conjuntos de datos reales de aprendizaje colaborativo
Shapley, L.S. (1953): A value for n-person games - Definición original del valor de Shapley
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - Trabajo base extendido por este artículo
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - Aspectos computacionales de teoría de juegos cooperativos
Otra literatura relacionada en seguridad de IA, IA colaborativa y estimación de datos
Resumen: Este artículo proporciona una alternativa al valor de Shapley matemáticamente rigurosa, particularmente adecuada para escenarios de aprendizaje automático colaborativo donde se valorizan las contribuciones relativas sobre diferencias absolutas. Aunque la contribución teórica es significativa, se requiere más validación empírica y casos de aplicación práctica para demostrar plenamente su valor práctico.