2025-11-23T22:52:23.771043

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

Filter, Möller, Özçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic

協調機械孊習のための比率ベヌスのシャプレヌ倀 - 拡匵版

基本情報

  • 論文ID: 2510.13261
  • タむトル: A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
  • 著者: Björn Filter、Ralf Möller、ÖzgÃŒr LÃŒtfÃŒ Özçepドむツ、ハンブルク倧孊
  • 分類: cs.GTゲヌム理論、cs.AI人工知胜
  • 発衚日: 2025幎10月15日
  • 論文リンク: https://arxiv.org/abs/2510.13261v1

芁旚

協調機械孊習により、耇数のデヌタ所有者が予枬性胜を向䞊させるために共同でモデルを蚓緎するこずが可胜になりたす。しかし、むンセンティブ䞡立性ず貢献床に基づく公正な報酬配分の確保は䟝然ずしお重芁な課題です。Simらの先行研究では、各参加者のデヌタ貢献に基づくシャプレヌ倀を通じおモデル報酬非金銭的か぀自由に耇補可胜を配分し、この貢献は情報ゲむンで枬定されおいたす。本論文は、暙準的な加法公匏を盞察貢献床で眮き換える比率ベヌスのシャプレヌ倀を導入しおいたす。党䜓的な報酬フレヌムワヌクむンセンティブ定矩ずモデル報酬蚭定を含むはSimらず䞀臎しおいたすが、基瀎ずなる䟡倀関数は根本的に異なりたす。この代替評䟡は異なるモデル報酬配分をもたらし、むンセンティブ特性を分析するための新しい芖点を提䟛したす。

研究背景ず動機

問題定矩

協調機械孊習における䞭栞的な問題は、耇数のデヌタ所有者間でモデル報酬を公正に配分する方法であり、以䞋を確保する必芁がありたす

  1. むンセンティブ䞡立性参加者がデヌタを貢献する動機を持぀こず
  2. 公正性報酬が実際の貢献に比䟋するこず
  3. 実行可胜性報酬配分が技術的に実珟可胜であるこず

問題の重芁性

AIシステムがたすたす倚゚ヌゞェント協調に䟝存するようになるに぀れお、公正でむンセンティブ䞡立的な協力メカニズムを確保するこずは、技術的信頌性ず倫理的実行可胜性の䞡方にずっお重芁です。これはAI安党におけるAI敎合性ず協調AIなどの耇雑な課題に関わりたす。

既存方法の限界

埓来の協力ゲヌム理論は報酬が䞍可分で耇補䞍可胜であるず仮定しおいたすが、協調孊習では

  • 報酬は蚓緎枈みモデルたたはデヌタセットであり、無制限に耇補可胜です
  • 加法的な限界貢献は参加者のデヌタの文脈的重芁性を反映しない可胜性がありたす
  • 䟋えば匱いモデルの粟床を10%から20%に向䞊させるこずは、匷いモデルを90%から92%に向䞊させるこずより意味があるかもしれたせんが、加法的方法はより倚くの報酬を埌者に䞎えたす

研究動機

本論文は、加法的ゲむンを乗法的比率ベヌス貢献で眮き換えるこずを提案し、各参加者のモデル性胜ぞの盞察的な圱響を捉えたす。これは特に以䞋に適しおいたす

  • デヌタ品質が異質なシナリオ
  • 冗長な貢献が存圚する堎合
  • モデル構築の初期段階

栞心的貢献

  1. 比率ベヌスのシャプレヌ倀の提案絶察的な限界貢献を盞察的改善床で眮き換える
  2. 理論的保蚌の維持新しい方法が加法的シャプレヌ倀ず同じむンセンティブず公正性公理を満たすこずを蚌明
  3. 数孊的基瀎の提䟛加法的シャプレヌフレヌムワヌクに察する原則的な代替案を提䟛
  4. 非䞀意性の発芋珟圚の公理フレヌムワヌクが耇数の䞡立可胜なメカニズムを蚱容し、シャプレヌ倀を䞀意に決定しないこずを瀺す

方法の詳现

タスク定矩

N人の参加者による協調孊習蚭定を考慮したす。各参加者i ∈ Nは私的デヌタセットを所有し、それを共同連合に貢献しお共同モデル蚓緎を行うかどうかを決定する必芁がありたす。これは特性圢匏の協力ゲヌムずしおモデル化されたす

  • 参加者集合N
  • 䟡倀関数v : 2^N → R≥0、ここでv(∅) = 0
  • 単調性∀C' ⊆ C ⊆ N, v(C') ≀ v(C)

栞心的技術革新

1. 比率的限界貢献の定矩

参加者i ∈ Nず連合C ⊆ N \ {i}に察しお、盞察的限界貢献は以䞋のように定矩されたす

Δ^rel_{i,C} := {
    v_{C∪{i}}/v_C - 1, if v_C ≠ 0
    0, else
}

2. 比率ベヌスのシャプレヌ倀

参加者iの比率ベヌスのシャプレヌ倀は以䞋の通りです

φ^rel_i := (1/n!) ∑_{π∈Π_N} Δ^rel_{i,S_{π,i}}

ここでΠ_NはNのすべおの順列の集合であり、S_{π,i}は順列πにおけるiの前の参加者連合です。

3. ρ-スケヌリング報酬メカニズム

匱効率性R3を満たすために、ρ-スケヌリングを適甚したす

r_i = (φ^rel_i/φ*_C)^ρ × v_C

ここでφ*C = max{i∈C} φ^rel_iは正芏化を確保し、ρ ∈ 0,1は報酬の倧きさを制埡し、公正性ず瀟䌚的犏祉最倧化の間でバランスを取りたす。

理論的保蚌

むンセンティブ公理R1-R5

  • R1 非負性各参加者は非負の報酬を受け取りたす
  • R2 実行可胜性報酬は連合䟡倀を超えたせん
  • R3 匱効率性少なくずも1人の参加者が連合の党䟡倀を受け取りたす
  • R4 個別合理性報酬は単独行動の䟡倀以䞊です
  • R5 公正性公正性公理F1-F4を満たしたす

公正性公理F1-F4

  • F1 無甚性貢献のない者はれロ報酬を受け取りたす
  • F2 察称性同じ貢献者は等しい報酬を受け取りたす
  • F3 厳密期埅性より倧きな貢献者はより倚くの報酬を受け取りたす
  • F4 厳密単調性貢献が増加するず報酬が増加したす

実隓蚭定

合成実隓蚭蚈

7぀の゚ヌゞェント{1,...,7}を䜜成し、以䞋を蚭定したす

  • 個別䟡倀v_i = √i
  • 連合䟡倀v_C = √(∑_{i∈C} i)

比范方法

比率ベヌスの報酬R_iをSimらの加法的シャプレヌ報酬A_iず比范したす

R_i = (φ^rel_i/φ^{rel,*})^ρ × v_C
A_i = (φ^add_i/φ^{add,*})^ρ × v_C

実隓結果

䞻芁な発芋

  1. 報酬分垃の盞違䞡方法は極端な堎合ρ=0たたはρ=1でほが収束したすが、䞭間領域では報酬曲線が倧きく異なりたす
  2. 䜎ランク参加者に察するより公正な扱い比率ベヌスの方法は䜎ランク参加者青ず橙の線に察する報酬の䜎䞋がより緩やかです。これは圌らがより匱い連合で䞍釣り合いに高い盞察䟡倀を提䟛するためです
  3. 高貢献者ぞの調敎高貢献者は䟝然ずしお著しく倧きな報酬を受け取りたすが、比率ベヌスの方法では盞察貢献が絶察貢献ほど顕著でないため、圌らの報酬はやや小さくなりたす

有利なシナリオ

  1. 異質なデヌタ品質少量の高品質デヌタが匱いモデルを倧幅に改善できる堎合
  2. 冗長な貢献重耇情報のため加法的限界ゲむンが小さくなる堎合
  3. 初期段階のモデリング絶察ゲむンは小さいが盞察改善が倧きい堎合

関連研究

協力ゲヌム理論の基瀎

  • シャプレヌ倀7期埅される限界加法貢献に基づく叀兞的方法
  • 埓来の仮定では報酬は䞍可分で耇補䞍可胜11,10

協調機械孊習

  • Simら9耇補可胜なモデル報酬にシャプレヌ倀を初めお適甚
  • 連邊孊習におけるデヌタ評䟡11
  • デヌタBanzhafなどの堅牢なデヌタ評䟡フレヌムワヌク10

本論文の盞察的優䜍性

比䟋公正性ず文脈的貢献がより重芁なシナリオにおいお、同じ理論的保蚌を維持しながら原則的な代替案を提䟛したす。

結論ず議論

䞻芁な結論

  1. 理論的等䟡性比率ベヌスのシャプレヌ倀は加法版ず同じすべおのむンセンティブず公正性公理を満たしたす
  2. 実践的盞違性報酬配分においお著しく異なる動䜜をもたらし、特に盞察貢献を重芖したす
  3. 非䞀意性の発芋珟圚の公理フレヌムワヌクはシャプレヌ倀を䞀意に決定せず、耇数の䞡立可胜なメカニズムを蚱容したす

限界

  1. 蚈算耇雑性元のシャプレヌ倀ず同じ指数玚の蚈算課題に盎面しおいたす
  2. パラメヌタ感床ρパラメヌタの遞択は個別合理性ず安定性に圱響したす
  3. 応甚シナリオの制限盞察改善が絶察ゲむンより重芁なシナリオに適しおいたす

今埌の方向性

  1. 完党な特性化むンセンティブ認識公理を満たすすべおの関数を蚘述する圢匏的衚珟定理が必芁です
  2. 公理の拡匵加法ず比䟋公正性を区別するための新しい公理が必芁な可胜性がありたす
  3. 混合スキヌム加法倀ず比率倀の間で補間する混合報酬スキヌムの探玢
  4. 実蚌評䟡実際の協調孊習デヌタセットでの経隓的動䜜研究

深局評䟡

利点

  1. 理論的厳密性完党な数孊的蚌明を提䟛し、すべおの重芁な特性が満たされるこずを確保したす
  2. 抂念的革新性加法から乗法掚論ぞの転換は公正性の新しい芖点を提䟛したす
  3. 実甚的䟡倀特にデヌタが異質たたは冗長な協調孊習シナリオに適しおいたす
  4. フレヌムワヌク互換性既存のρ-スケヌリングメカニズムず分析ツヌルず完党に互換性がありたす

䞍足点

  1. 実隓の限定性合成実隓のみで、実デヌタセットでの怜蚌が䞍足しおいたす
  2. 蚈算効率蚈算最適化たたは近䌌アルゎリズムに぀いお議論されおいたせん
  3. パラメヌタガむダンスρパラメヌタ遞択の実甚的ガむダンスが䞍足しおいたす
  4. 応甚事䟋より倚くの具䜓的な応甚分野の事䟋研究が必芁です

圱響力

  1. 理論的貢献協調孊習報酬メカニズム蚭蚈のより倧きな空間を明らかにしたす
  2. 実践的ガむダンス異なる応甚シナリオのための方法遞択の根拠を提䟛したす
  3. 研究ぞの瀺唆公正性公理の完党性ず䞀意性に関する重芁な問題を開きたす

適甚シナリオ

  1. 医療AI協調機関間でデヌタ品質の差が顕著な堎合
  2. 連邊孊習デバむス胜力ずデヌタ分垃が異質な堎合
  3. 文曞デゞタル化歎史文献䟡倀の盞察的重芁性評䟡
  4. センサヌネットワヌクデヌタの冗長性ず盞補性が共存する環境

参考文献

䞻芁な参考文献には以䞋が含たれたす

  • Shapley, L.S. (1953): A value for n-person games - シャプレヌ倀の原始的定矩
  • Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - 本論文が拡匵する基瀎研究
  • Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - 協力ゲヌム理論の蚈算的偎面
  • その他のAI安党、協調AI、デヌタ評䟡に関連する文献

芁玄本論文は、盞察貢献を絶察差異ではなく重芖する協調機械孊習シナリオに特に適した、数孊的に厳密なシャプレヌ倀の代替案を提䟛したす。理論的貢献は重芁ですが、その実甚的䟡倀を十分に蚌明するには、より倚くの実蚌怜蚌ず実際の応甚事䟋が必芁です。