A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Filter, Möller, Ãzçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic
Коэффициентное значение Шепли для совместного машинного обучения - расширенная версия
Совместное машинное обучение позволяет нескольким владельцам данных совместно обучать модели для повышения производительности прогнозирования. Однако обеспечение совместимости стимулов и справедливого распределения вознаграждений на основе вклада остаётся критической проблемой. Предыдущая работа Сима и соавторов распределяла вознаграждения модели (нематериальные и свободно копируемые) на основе значений Шепли, основанных на вкладе данных каждой стороны, измеряемом информационным выигрышем. В данной статье вводится коэффициентное значение Шепли, которое заменяет стандартную аддитивную формулу мерой относительного вклада. Хотя общая структура вознаграждений (включая определения стимулов и параметры вознаграждения модели) остаётся согласованной с работой Сима и соавторов, базовая функция стоимости принципиально отличается. Эта альтернативная оценка приводит к различным распределениям вознаграждений модели и предоставляет новую перспективу для анализа свойств стимулов.
Центральная проблема совместного машинного обучения заключается в справедливом распределении вознаграждений модели между несколькими владельцами данных при обеспечении:
Совместимости стимулов: участники мотивированы вносить данные
По мере того как системы ИИ всё больше зависят от многоагентного сотрудничества, обеспечение справедливых и совместимых со стимулами механизмов кооперации критично как для технической надёжности, так и для этической жизнеспособности. Это связано со сложными проблемами в области безопасности ИИ, такими как выравнивание ИИ и совместный ИИ.
Традиционная теория кооперативных игр предполагает, что вознаграждения неделимы и не могут быть скопированы, но в совместном обучении:
Вознаграждения представляют собой обученные модели или наборы данных, которые можно копировать бесконечно
Аддитивные предельные вклады могут не отражать контекстную важность данных участников
Например: повышение точности слабой модели с 10% до 20% может быть более значимым, чем повышение сильной модели с 90% до 92%, но аддитивный метод вознаградит последнее больше
В данной статье предлагается заменить аддитивные выигрыши мультипликативными (коэффициентными) вкладами, чтобы отразить относительное влияние каждого участника на производительность модели, что особенно применимо к:
Выявлена неуникальность: показано, что текущая аксиоматическая схема не однозначно определяет значение Шепли, допуская множество совместимых механизмов
Рассмотрим установку совместного обучения с N участниками, где каждый участник i ∈ N владеет приватным набором данных и должен решить, вносить ли его вклад в объединённую коалицию для обучения модели. Моделируется как кооперативная игра в характеристической форме:
Для удовлетворения слабой эффективности (R3) применяется ρ-масштабирование:
r_i = (φ^rel_i/φ*_C)^ρ × v_C
где φ*C = max{i∈C} φ^rel_i обеспечивает нормализацию, ρ ∈ 0,1 контролирует величину вознаграждения, балансируя между справедливостью и максимизацией общественного благосостояния.
Различия в распределении вознаграждений: хотя оба метода приблизительно сходятся в экстремальных случаях (ρ=0 или ρ=1), кривые вознаграждений значительно отличаются в промежуточной области
Большая справедливость для участников низкого ранга: коэффициентный метод показывает более медленное снижение вознаграждений для участников низкого ранга (синие и оранжевые линии), поскольку они обеспечивают непропорционально высокую относительную стоимость в более слабых коалициях
Модерация для высокого вклада: хотя участники с высоким вкладом по-прежнему получают значительно большие вознаграждения, в коэффициентном методе их вознаграждения немного меньше, поскольку относительный вклад менее значителен, чем абсолютный
Предоставляет принципиальную альтернативу для сценариев, где пропорциональная справедливость и контекстный вклад более важны, сохраняя при этом те же теоретические гарантии.
Shapley, L.S. (1953): A value for n-person games — исходное определение значения Шепли
Sim, R.H.L. и соавторы (2020): Collaborative machine learning with incentive-aware model rewards — базовая работа, расширяемая в данной статье
Chalkiadakis, G. и соавторы (2011): Computational aspects of cooperative game theory — вычислительные аспекты теории кооперативных игр
Другая соответствующая литература по безопасности ИИ, совместному ИИ и оценке данных
Резюме: В данной статье предоставляется математически строгая альтернатива значению Шепли, особенно подходящая для сценариев совместного машинного обучения, где относительный вклад более важен, чем абсолютные различия. Хотя теоретический вклад значителен, требуется дополнительная эмпирическая проверка и практические примеры применения для полного доказательства её практической ценности.