2025-11-23T22:52:23.771043

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

Filter, Möller, Özçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic

협업 머신러닝을 위한 비율 기반 샤플리 값 - 확장판

기본 정보

  • 논문 ID: 2510.13261
  • 제목: A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
  • 저자: Björn Filter, Ralf Möller, Özgür Lütfü Özçep (독일 함부르크 대학교)
  • 분류: cs.GT (게임 이론), cs.AI (인공지능)
  • 발표 시간: 2025년 10월 15일
  • 논문 링크: https://arxiv.org/abs/2510.13261v1

초록

협업 머신러닝은 여러 데이터 소유자가 모델을 공동으로 훈련하여 예측 성능을 향상시킬 수 있게 한다. 그러나 유인 양립성 보장 및 기여도 기반의 공정한 보상 분배는 여전히 핵심 과제이다. Sim 등의 선행 연구는 각 참여자의 데이터 기여도에 기반한 샤플리 값을 통해 모델 보상(비화폐적이며 자유롭게 복제 가능)을 분배했으며, 이 기여도는 정보 이득으로 측정되었다. 본 논문은 표준 가법식을 상대적 기여도 측정으로 대체하는 비율 기반 샤플리 값을 제시한다. 전체 보상 프레임워크(유인 정의 및 모델 보상 설정 포함)는 Sim 등과 일치하지만, 기저 가치 함수는 근본적으로 다르다. 이러한 대체 평가는 서로 다른 모델 보상 분배를 초래하며 유인 속성 분석을 위한 새로운 관점을 제공한다.

연구 배경 및 동기

문제 정의

협업 머신러닝의 핵심 문제는 여러 데이터 소유자 간에 모델 보상을 공정하게 분배하는 방법으로, 다음을 보장해야 한다:

  1. 유인 양립성: 참여자가 데이터 기여에 동기를 가짐
  2. 공정성: 보상이 실제 기여도와 비례
  3. 실행 가능성: 보상 분배가 기술적으로 실현 가능

문제의 중요성

AI 시스템이 점점 더 다중 에이전트 협력에 의존함에 따라, 공정하고 유인 양립적인 협력 메커니즘을 보장하는 것은 기술적 신뢰성과 윤리적 실행 가능성 모두에 필수적이다. 이는 AI 안전의 AI 정렬 및 협업 AI 등의 복잡한 과제를 포함한다.

기존 방법의 한계

전통적인 협력 게임 이론은 보상이 분할 불가능하고 복제 불가능하다고 가정하지만, 협업 학습에서는:

  • 보상이 훈련된 모델 또는 데이터셋으로, 무제한 복제 가능
  • 가법 한계 기여도는 참여자 데이터의 상황적 중요성을 반영하지 못할 수 있음
  • 예: 약한 모델 정확도를 10%에서 20%로 향상시키는 것이 강한 모델을 90%에서 92%로 향상시키는 것보다 의미 있을 수 있지만, 가법 방법은 후자에 더 많은 보상을 제공

연구 동기

본 논문은 가법 이득을 곱셈(비율 기반) 기여도로 대체하여 각 참여자의 모델 성능에 대한 상대적 영향을 포착할 것을 제안하며, 특히 다음에 적합하다:

  • 데이터 품질이 이질적인 시나리오
  • 중복 기여가 존재하는 경우
  • 모델 구축의 초기 단계

핵심 기여

  1. 비율 기반 샤플리 값 제시: 절대 한계 기여도를 상대적 개선도 측정으로 대체
  2. 이론적 보장 유지: 새로운 방법이 가법 샤플리 값과 동일한 유인 및 공정성 공리를 만족함을 증명
  3. 수학적 기초 제공: 가법 샤플리 프레임워크에 대한 원칙적 대안 제시
  4. 비유일성 발견: 현재 공리 프레임워크가 샤플리 값을 유일하게 결정하지 않으며, 여러 호환 메커니즘의 존재를 허용함을 나타냄

방법론 상세 설명

작업 정의

N명의 참여자가 있는 협업 학습 설정을 고려하며, 각 참여자 i ∈ N은 개인 데이터셋을 소유하고 공동 연합에 기여할지 여부를 결정해야 한다. 특성형 협력 게임으로 모델링:

  • 참여자 집합: N
  • 가치 함수: v : 2^N → R≥0, 여기서 v(∅) = 0
  • 단조성: ∀C' ⊆ C ⊆ N, v(C') ≤ v(C)

핵심 기술 혁신

1. 비율 한계 기여도 정의

참여자 i ∈ N과 연합 C ⊆ N \ {i}에 대해, 상대적 한계 기여도는 다음과 같이 정의된다:

Δ^rel_{i,C} := {
    v_{C∪{i}}/v_C - 1, if v_C ≠ 0
    0, else
}

2. 비율 기반 샤플리 값

참여자 i의 비율 기반 샤플리 값은:

φ^rel_i := (1/n!) ∑_{π∈Π_N} Δ^rel_{i,S_{π,i}}

여기서 Π_N은 N의 모든 순열 집합이고, S_{π,i}는 순열 π에서 i 이전의 참여자 연합이다.

3. ρ-스케일링 보상 메커니즘

약한 효율성(R3)을 만족하기 위해 ρ-스케일링을 적용:

r_i = (φ^rel_i/φ*_C)^ρ × v_C

여기서 φ*C = max{i∈C} φ^rel_i는 정규화를 보장하고, ρ ∈ 0,1은 공정성과 사회 복지 최대화 간의 균형을 조절하는 보상 크기를 제어한다.

이론적 보장

유인 공리 (R1-R5)

  • R1 비음성: 각 참여자는 비음의 보상을 받음
  • R2 실행 가능성: 보상이 연합 가치를 초과하지 않음
  • R3 약한 효율성: 최소한 한 명의 참여자가 연합 전체 가치를 받음
  • R4 개인 합리성: 보상이 단독 행동의 가치 이상
  • R5 공정성: 공정성 공리 F1-F4를 만족

공정성 공리 (F1-F4)

  • F1 무용성: 기여하지 않은 자는 영 보상을 받음
  • F2 대칭성: 동일한 기여자는 동일한 보상을 받음
  • F3 엄격한 기대성: 더 큰 기여자는 더 많은 보상을 받음
  • F4 엄격한 단조성: 기여 증가 시 보상 증가

실험 설정

합성 실험 설계

7명의 에이전트 {1,...,7}를 생성하고 다음을 설정:

  • 개별 가치: v_i = √i
  • 연합 가치: v_C = √(∑_{i∈C} i)

비교 방법

비율 기반 보상 R_i를 Sim 등의 가법 샤플리 보상 A_i와 비교:

R_i = (φ^rel_i/φ^{rel,*})^ρ × v_C
A_i = (φ^add_i/φ^{add,*})^ρ × v_C

실험 결과

주요 발견

  1. 보상 분배 차이: 두 방법이 극단적인 경우(ρ=0 또는 ρ=1)에서 근사적으로 수렴하지만, 중간 영역에서 보상 곡선은 현저히 다름
  2. 낮은 순위 참여자에 대한 더 공정한 대우: 비율 기반 방법은 낮은 순위 참여자(파란색 및 주황색 선)에 대한 보상 감소가 더 완만함. 이는 그들이 약한 연합에서 불균형적으로 높은 상대적 가치를 제공하기 때문
  3. 높은 기여자에 대한 조절: 높은 기여자는 여전히 현저히 더 큰 보상을 받지만, 비율 기반 방법에서 그들의 보상은 약간 작음. 상대적 기여도가 절대 기여도만큼 두드러지지 않기 때문

유리한 시나리오

  1. 이질적 데이터 품질: 소량의 고품질 데이터가 약한 모델을 크게 개선할 수 있음
  2. 중복 기여: 한계 가법 이득이 중복 정보로 인해 작아지는 경우
  3. 초기 단계 모델링: 절대 이득은 작지만 상대적 개선이 큰 시나리오

관련 연구

협력 게임 이론 기초

  • 샤플리 값7: 기대 한계 가법 기여도에 기반한 고전적 방법
  • 전통적 가정: 보상이 분할 불가능하고 복제 불가능11,10

협업 머신러닝

  • Sim 등9: 복제 가능한 모델 보상에 샤플리 값을 처음 적용
  • 연합 학습에서의 데이터 평가11
  • 데이터 반자프 등 견고한 데이터 평가 프레임워크10

본 논문의 상대적 우위

비례 공정성 및 상황적 기여가 더 중요한 시나리오에서 동일한 이론적 보장을 유지하면서 원칙적 대안을 제공한다.

결론 및 논의

주요 결론

  1. 이론적 동등성: 비율 기반 샤플리 값은 가법 버전과 동일한 모든 유인 및 공정성 공리를 만족
  2. 실제 차이성: 보상 분배에서 현저히 다른 행동을 초래하며, 특히 상대적 기여도를 중시
  3. 비유일성 발견: 현재 공리 프레임워크가 샤플리 값을 유일하게 결정하지 않으며, 여러 호환 메커니즘의 존재를 허용

한계

  1. 계산 복잡성: 원래 샤플리 값과 동일한 지수급 계산 과제에 직면
  2. 매개변수 민감성: ρ 매개변수의 선택이 개인 합리성 및 안정성에 영향
  3. 응용 시나리오 제한: 상대적 개선이 절대 이득보다 중요한 시나리오에 더 적합

향후 방향

  1. 완전한 특성화: 유인 인식 공리를 만족하는 모든 함수를 설명하는 형식적 표현 정리 필요
  2. 공리 확장: 가법 및 비율 공정성을 구분하기 위한 새로운 공리 가능성
  3. 혼합 방안: 가법 및 비율 기반 값 간 보간하는 혼합 보상 방안 탐색
  4. 실증 평가: 실제 협업 학습 데이터셋에서의 경험적 행동 연구

심층 평가

장점

  1. 이론적 엄밀성: 모든 핵심 속성이 만족됨을 보장하는 완전한 수학적 증명 제공
  2. 개념적 혁신성: 가법에서 곱셈 추론으로의 전환은 공정성의 새로운 관점 제공
  3. 실용적 가치: 데이터 이질성 또는 중복이 있는 협업 학습 시나리오에 특히 적합
  4. 프레임워크 호환성: 기존 ρ-스케일링 메커니즘 및 분석 도구와 완전히 호환

부족한 점

  1. 실험 제한성: 합성 실험만 제공하며 실제 데이터셋 검증 부족
  2. 계산 효율성: 계산 최적화 또는 근사 알고리즘 미논의
  3. 매개변수 지침: ρ 매개변수 선택에 대한 실용적 지침 부족
  4. 응용 사례: 구체적 응용 분야의 사례 연구 필요

영향력

  1. 이론적 기여: 협업 학습 보상 메커니즘 설계의 더 큰 공간 발견
  2. 실제 지침: 다양한 응용 시나리오에 대한 방법 선택 근거 제공
  3. 연구 영감: 공정성 공리의 완전성 및 유일성에 관한 중요한 질문 개시

적용 시나리오

  1. 의료 AI 협력: 기관 간 데이터 품질 차이가 현저함
  2. 연합 학습: 장치 능력 및 데이터 분포가 이질적
  3. 문서 디지털화: 역사 문헌 가치의 상대적 중요성 평가
  4. 센서 네트워크: 데이터 중복 및 상호 보완성이 공존하는 환경

참고문헌

주요 참고문헌 포함:

  • Shapley, L.S. (1953): A value for n-person games - 샤플리 값의 원래 정의
  • Sim, R.H.L. 등 (2020): Collaborative machine learning with incentive-aware model rewards - 본 논문이 확장하는 기초 연구
  • Chalkiadakis, G. 등 (2011): Computational aspects of cooperative game theory - 협력 게임 이론의 계산 측면
  • 기타 관련 AI 안전, 협업 AI 및 데이터 평가 문헌

요약: 본 논문은 상대적 기여도보다 절대 차이를 중시하는 협업 머신러닝 시나리오에 특히 적합한 수학적으로 엄밀한 샤플리 값 대안을 제공한다. 이론적 기여는 상당하지만, 실용적 가치를 완전히 입증하기 위해서는 더 많은 실증 검증 및 실제 응용 사례가 필요하다.