2025-11-23T22:52:23.771043

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

Filter, MÃ¶ller, ÃzÃ§ep

Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.

academic

協調機械学習のための比率ベースのシャプレー値 - 拡張版

基本情報

論文ID: 2510.13261
タイトル: A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
著者: Björn Filter、Ralf Möller、Özgür Lütfü Özçep（ドイツ、ハンブルク大学）
分類: cs.GT（ゲーム理論）、cs.AI（人工知能）
発表日: 2025年10月15日
論文リンク: https://arxiv.org/abs/2510.13261v1

要旨

協調機械学習により、複数のデータ所有者が予測性能を向上させるために共同でモデルを訓練することが可能になります。しかし、インセンティブ両立性と貢献度に基づく公正な報酬配分の確保は依然として重要な課題です。Simらの先行研究では、各参加者のデータ貢献に基づくシャプレー値を通じてモデル報酬（非金銭的かつ自由に複製可能）を配分し、この貢献は情報ゲインで測定されています。本論文は、標準的な加法公式を相対貢献度で置き換える比率ベースのシャプレー値を導入しています。全体的な報酬フレームワーク（インセンティブ定義とモデル報酬設定を含む）はSimらと一致していますが、基礎となる価値関数は根本的に異なります。この代替評価は異なるモデル報酬配分をもたらし、インセンティブ特性を分析するための新しい視点を提供します。

研究背景と動機

問題定義

協調機械学習における中核的な問題は、複数のデータ所有者間でモデル報酬を公正に配分する方法であり、以下を確保する必要があります：

インセンティブ両立性：参加者がデータを貢献する動機を持つこと
公正性：報酬が実際の貢献に比例すること
実行可能性：報酬配分が技術的に実現可能であること

問題の重要性

AIシステムがますます多エージェント協調に依存するようになるにつれて、公正でインセンティブ両立的な協力メカニズムを確保することは、技術的信頼性と倫理的実行可能性の両方にとって重要です。これはAI安全におけるAI整合性と協調AIなどの複雑な課題に関わります。

既存方法の限界

従来の協力ゲーム理論は報酬が不可分で複製不可能であると仮定していますが、協調学習では：

報酬は訓練済みモデルまたはデータセットであり、無制限に複製可能です
加法的な限界貢献は参加者のデータの文脈的重要性を反映しない可能性があります
例えば：弱いモデルの精度を10%から20%に向上させることは、強いモデルを90%から92%に向上させることより意味があるかもしれませんが、加法的方法はより多くの報酬を後者に与えます

研究動機

本論文は、加法的ゲインを乗法的（比率ベース）貢献で置き換えることを提案し、各参加者のモデル性能への相対的な影響を捉えます。これは特に以下に適しています：

データ品質が異質なシナリオ
冗長な貢献が存在する場合
モデル構築の初期段階

核心的貢献

比率ベースのシャプレー値の提案：絶対的な限界貢献を相対的改善度で置き換える
理論的保証の維持：新しい方法が加法的シャプレー値と同じインセンティブと公正性公理を満たすことを証明
数学的基礎の提供：加法的シャプレーフレームワークに対する原則的な代替案を提供
非一意性の発見：現在の公理フレームワークが複数の両立可能なメカニズムを許容し、シャプレー値を一意に決定しないことを示す

方法の詳細

タスク定義

N人の参加者による協調学習設定を考慮します。各参加者i ∈ Nは私的データセットを所有し、それを共同連合に貢献して共同モデル訓練を行うかどうかを決定する必要があります。これは特性形式の協力ゲームとしてモデル化されます：

参加者集合：N
価値関数：v : 2^N → R≥0、ここでv(∅) = 0
単調性：∀C' ⊆ C ⊆ N, v(C') ≤ v(C)

核心的技術革新

1. 比率的限界貢献の定義

参加者i ∈ Nと連合C ⊆ N \ {i}に対して、相対的限界貢献は以下のように定義されます：

Δ^rel_{i,C} := {
    v_{C∪{i}}/v_C - 1, if v_C ≠ 0
    0, else
}

2. 比率ベースのシャプレー値

参加者iの比率ベースのシャプレー値は以下の通りです：

φ^rel_i := (1/n!) ∑_{π∈Π_N} Δ^rel_{i,S_{π,i}}

ここでΠ_NはNのすべての順列の集合であり、S_{π,i}は順列πにおけるiの前の参加者連合です。

3. ρ-スケーリング報酬メカニズム

弱効率性（R3）を満たすために、ρ-スケーリングを適用します：

r_i = (φ^rel_i/φ*_C)^ρ × v_C

ここでφ*C = max{i∈C} φ^rel_iは正規化を確保し、ρ ∈ 0,1は報酬の大きさを制御し、公正性と社会的福祉最大化の間でバランスを取ります。

理論的保証

インセンティブ公理（R1-R5）

R1 非負性：各参加者は非負の報酬を受け取ります
R2 実行可能性：報酬は連合価値を超えません
R3 弱効率性：少なくとも1人の参加者が連合の全価値を受け取ります
R4 個別合理性：報酬は単独行動の価値以上です
R5 公正性：公正性公理F1-F4を満たします

公正性公理（F1-F4）

F1 無用性：貢献のない者はゼロ報酬を受け取ります
F2 対称性：同じ貢献者は等しい報酬を受け取ります
F3 厳密期待性：より大きな貢献者はより多くの報酬を受け取ります
F4 厳密単調性：貢献が増加すると報酬が増加します

実験設定

合成実験設計

7つのエージェント{1,...,7}を作成し、以下を設定します：

個別価値：v_i = √i
連合価値：v_C = √(∑_{i∈C} i)

比較方法

比率ベースの報酬R_iをSimらの加法的シャプレー報酬A_iと比較します：

R_i = (φ^rel_i/φ^{rel,*})^ρ × v_C
A_i = (φ^add_i/φ^{add,*})^ρ × v_C

実験結果

主要な発見

報酬分布の相違：両方法は極端な場合（ρ=0またはρ=1）でほぼ収束しますが、中間領域では報酬曲線が大きく異なります
低ランク参加者に対するより公正な扱い：比率ベースの方法は低ランク参加者（青と橙の線）に対する報酬の低下がより緩やかです。これは彼らがより弱い連合で不釣り合いに高い相対価値を提供するためです
高貢献者への調整：高貢献者は依然として著しく大きな報酬を受け取りますが、比率ベースの方法では相対貢献が絶対貢献ほど顕著でないため、彼らの報酬はやや小さくなります

有利なシナリオ

異質なデータ品質：少量の高品質データが弱いモデルを大幅に改善できる場合
冗長な貢献：重複情報のため加法的限界ゲインが小さくなる場合
初期段階のモデリング：絶対ゲインは小さいが相対改善が大きい場合

結論と議論

主要な結論

理論的等価性：比率ベースのシャプレー値は加法版と同じすべてのインセンティブと公正性公理を満たします
実践的相違性：報酬配分において著しく異なる動作をもたらし、特に相対貢献を重視します
非一意性の発見：現在の公理フレームワークはシャプレー値を一意に決定せず、複数の両立可能なメカニズムを許容します

限界

計算複雑性：元のシャプレー値と同じ指数級の計算課題に直面しています
パラメータ感度：ρパラメータの選択は個別合理性と安定性に影響します
応用シナリオの制限：相対改善が絶対ゲインより重要なシナリオに適しています

今後の方向性

完全な特性化：インセンティブ認識公理を満たすすべての関数を記述する形式的表現定理が必要です
公理の拡張：加法と比例公正性を区別するための新しい公理が必要な可能性があります
混合スキーム：加法値と比率値の間で補間する混合報酬スキームの探索
実証評価：実際の協調学習データセットでの経験的動作研究

深層評価

利点

理論的厳密性：完全な数学的証明を提供し、すべての重要な特性が満たされることを確保します
概念的革新性：加法から乗法推論への転換は公正性の新しい視点を提供します
実用的価値：特にデータが異質または冗長な協調学習シナリオに適しています
フレームワーク互換性：既存のρ-スケーリングメカニズムと分析ツールと完全に互換性があります

不足点

実験の限定性：合成実験のみで、実データセットでの検証が不足しています
計算効率：計算最適化または近似アルゴリズムについて議論されていません
パラメータガイダンス：ρパラメータ選択の実用的ガイダンスが不足しています
応用事例：より多くの具体的な応用分野の事例研究が必要です

影響力

理論的貢献：協調学習報酬メカニズム設計のより大きな空間を明らかにします
実践的ガイダンス：異なる応用シナリオのための方法選択の根拠を提供します
研究への示唆：公正性公理の完全性と一意性に関する重要な問題を開きます

適用シナリオ

医療AI協調：機関間でデータ品質の差が顕著な場合
連邦学習：デバイス能力とデータ分布が異質な場合
文書デジタル化：歴史文献価値の相対的重要性評価
センサーネットワーク：データの冗長性と相補性が共存する環境

参考文献

主要な参考文献には以下が含まれます：

Shapley, L.S. (1953): A value for n-person games - シャプレー値の原始的定義
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - 本論文が拡張する基礎研究
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - 協力ゲーム理論の計算的側面
その他のAI安全、協調AI、データ評価に関連する文献

要約：本論文は、相対貢献を絶対差異ではなく重視する協調機械学習シナリオに特に適した、数学的に厳密なシャプレー値の代替案を提供します。理論的貢献は重要ですが、その実用的価値を十分に証明するには、より多くの実証検証と実際の応用事例が必要です。