2025-11-23T22:52:23.771043

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

Filter, MÃ¶ller, ÃzÃ§ep

Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.

academic

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

基本信息

论文ID: 2510.13261
标题: A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
作者: Björn Filter, Ralf Möller, Özgür Lütfü Özçep (University of Hamburg, Germany)
分类: cs.GT (Game Theory), cs.AI (Artificial Intelligence)
发表时间: 2025年10月15日
论文链接: https://arxiv.org/abs/2510.13261v1

激励兼容性：参与者有动机贡献数据
公平性：奖励与实际贡献成比例
可行性：奖励分配在技术上可实现

问题重要性

随着AI系统越来越依赖多智能体协作，确保公平和激励兼容的合作机制对于技术可靠性和伦理可行性都至关重要。这涉及AI安全中的AI对齐和协作AI等复杂挑战。

现有方法的局限性

传统的合作博弈论假设奖励是不可分割且不可复制的，但在协作学习中：

奖励是训练好的模型或数据集，可无限复制
加法边际贡献可能无法反映参与者数据的上下文重要性
例如：将弱模型准确率从10%提升到20%比将强模型从90%提升到92%可能更有意义，但加法方法会更多奖励后者

研究动机

本文提出用乘法（基于比率）贡献替代加法增益，捕获每个参与者对模型性能的相对影响，特别适用于：

数据质量异构的场景
存在冗余贡献的情况
早期阶段的模型构建

核心贡献

提出了基于比率的Shapley值：用相对改进度量替代绝对边际贡献
保持理论保证：证明新方法满足与加法Shapley值相同的激励和公平性公理
提供数学基础：为加法Shapley框架提供了有原则的替代方案
揭示非唯一性：表明当前公理框架允许多种兼容机制，而非唯一确定Shapley值

方法详解

任务定义

考虑N个参与者的协作学习设置，每个参与者i ∈ N拥有私有数据集，需要决定是否将其贡献给联合联盟进行模型训练。建模为特征形式的合作博弈：

参与者集合：N
价值函数：v : 2^N → R≥0，其中v(∅) = 0
单调性：∀C' ⊆ C ⊆ N, v(C') ≤ v(C)

核心技术创新

1. 比率边际贡献定义

对于参与者i ∈ N和联盟C ⊆ N \ {i}，相对边际贡献定义为：

Δ^rel_{i,C} := {
    v_{C∪{i}}/v_C - 1, if v_C ≠ 0
    0, else
}

2. 基于比率的Shapley值

参与者i的基于比率的Shapley值为：

φ^rel_i := (1/n!) ∑_{π∈Π_N} Δ^rel_{i,S_{π,i}}

其中Π_N是N的所有排列集合，S_{π,i}是排列π中i之前的参与者联盟。

3. ρ-缩放奖励机制

为满足弱效率性（R3），应用ρ-缩放：

r_i = (φ^rel_i/φ*_C)^ρ × v_C

其中φ*C = max{i∈C} φ^rel_i确保标准化，ρ ∈ 0,1控制奖励大小，在公平性和社会福利最大化之间进行权衡。

理论保证

激励公理（R1-R5）

R1 非负性：每个参与者获得非负奖励
R2 可行性：奖励不超过联盟价值
R3 弱效率性：至少一个参与者获得联盟全部价值
R4 个体理性：奖励至少等于单独行动的价值
R5 公平性：满足公平性公理F1-F4

公平性公理（F1-F4）

F1 无用性：无贡献者获得零奖励
F2 对称性：相同贡献者获得相等奖励
F3 严格期望性：更大贡献者获得更多奖励
F4 严格单调性：贡献增加时奖励增加

实验设置

合成实验设计

创建7个智能体{1,...,7}，设置：

单独价值：v_i = √i
联盟价值：v_C = √(∑_{i∈C} i)

对比方法

将基于比率的奖励R_i与Sim等人的加法Shapley奖励A_i进行比较：

R_i = (φ^rel_i/φ^{rel,*})^ρ × v_C
A_i = (φ^add_i/φ^{add,*})^ρ × v_C

实验结果

主要发现

奖励分布差异：虽然两种方法在极端情况下（ρ=0或ρ=1）近似收敛，但在中间区域奖励曲线显著不同
对低排名参与者更公平：基于比率的方法对低排名参与者（蓝色和橙色线）的奖励下降更缓慢，因为他们在较弱联盟中提供不成比例的高相对价值
对高贡献者的调节：虽然高贡献者仍获得显著更大奖励，但基于比率的方法中他们的奖励略小，因为相对贡献不如绝对贡献那么显著

优势场景

异构数据质量：少量高质量数据可显著改善弱模型
冗余贡献：边际加法增益因重叠信息变小的情况
早期阶段建模：绝对增益小但相对改进大的场景

结论与讨论

主要结论

理论等价性：基于比率的Shapley值满足与加法版本相同的所有激励和公平性公理
实践差异性：在奖励分配上产生显著不同的行为，特别是对相对贡献的重视
非唯一性发现：当前公理框架不唯一确定Shapley值，允许多种兼容机制存在

局限性

计算复杂性：与原始Shapley值面临相同的指数级计算挑战
参数敏感性：ρ参数的选择影响个体理性和稳定性
应用场景限制：更适合相对改进比绝对增益更重要的场景

未来方向

完整特征化：需要形式化表示定理，描述满足激励感知公理的所有函数
公理扩展：可能需要新公理来区分加法和比例公平性
混合方案：探索在加法和基于比率值之间插值的混合奖励方案
实证评估：在真实协作学习数据集上的经验行为研究

深度评价

优点

理论严谨性：提供了完整的数学证明，确保所有关键性质得到满足
概念创新性：从加法转向乘法推理提供了新的公平性视角
实用价值：特别适合数据异构或冗余的协作学习场景
框架兼容性：完全兼容现有的ρ-缩放机制和分析工具

不足

实验有限性：仅提供合成实验，缺乏真实数据集验证
计算效率：未讨论计算优化或近似算法
参数指导：缺乏ρ参数选择的实用指导
应用案例：需要更多具体应用领域的案例研究

影响力

理论贡献：揭示了协作学习奖励机制设计的更大空间
实践指导：为不同应用场景提供了方法选择依据
研究启发：开启了关于公平性公理完整性和唯一性的重要问题

适用场景

医疗AI协作：机构间数据质量差异显著
联邦学习：设备能力和数据分布异构
文档数字化：历史文献价值的相对重要性评估
传感器网络：数据冗余和互补性并存的环境

参考文献

主要参考文献包括：

Shapley, L.S. (1953): A value for n-person games - Shapley值的原始定义
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - 本文扩展的基础工作
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - 合作博弈论计算方面
其他相关的AI安全、协作AI和数据估值文献

总结：本文提供了一个在数学上严谨的Shapley值替代方案，特别适合重视相对贡献而非绝对差异的协作机器学习场景。虽然理论贡献显著，但需要更多实证验证和实际应用案例来充分证明其实用价值。

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

基本信息

摘要

研究背景与动机

问题定义

问题重要性

现有方法的局限性

研究动机

核心贡献

方法详解

任务定义

核心技术创新

1. 比率边际贡献定义

2. 基于比率的Shapley值

3. ρ-缩放奖励机制

理论保证

激励公理（R1-R5）

公平性公理（F1-F4）

实验设置

合成实验设计

对比方法

实验结果

主要发现

优势场景

相关工作

合作博弈论基础

协作机器学习

本文相对优势

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献