2025-11-23T22:52:23.771043

A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version

Filter, Möller, Özçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic

Un Valore di Shapley Basato su Rapporto per l'Apprendimento Automatico Collaborativo - Versione Estesa

Informazioni Fondamentali

  • ID Articolo: 2510.13261
  • Titolo: Un Valore di Shapley Basato su Rapporto per l'Apprendimento Automatico Collaborativo - Versione Estesa
  • Autori: Björn Filter, Ralf Möller, Özgür Lütfü Özçep (Università di Amburgo, Germania)
  • Classificazione: cs.GT (Teoria dei Giochi), cs.AI (Intelligenza Artificiale)
  • Data di Pubblicazione: 15 ottobre 2025
  • Link Articolo: https://arxiv.org/abs/2510.13261v1

Riassunto

L'apprendimento automatico collaborativo consente a più proprietari di dati di addestrare congiuntamente modelli per migliorare le prestazioni predittive. Tuttavia, garantire la compatibilità degli incentivi e l'equa distribuzione dei premi basata sul contributo rimane una sfida critica. Il lavoro precedente di Sim et al. affronta questo problema assegnando premi del modello (non monetari e liberamente replicabili) basati sul valore di Shapley della contribuzione dati di ciascuna parte, misurata attraverso il guadagno informativo. Questo articolo introduce un valore di Shapley basato su rapporto, sostituendo la formula additiva standard con una misura di contribuzione relativa. Sebbene il quadro complessivo dei premi (incluse le definizioni degli incentivi e l'impostazione dei premi del modello) rimanga coerente con Sim et al., la funzione di valore sottostante è fondamentalmente diversa. Questa valutazione alternativa produce distribuzioni di premi del modello differenti e fornisce una nuova prospettiva per l'analisi delle proprietà degli incentivi.

Contesto di Ricerca e Motivazione

Definizione del Problema

Il problema centrale nell'apprendimento automatico collaborativo è come distribuire equamente i premi del modello tra più proprietari di dati, garantendo:

  1. Compatibilità degli Incentivi: i partecipanti hanno motivazione a contribuire dati
  2. Equità: i premi sono proporzionali al contributo effettivo
  3. Fattibilità: la distribuzione dei premi è tecnicamente realizzabile

Importanza del Problema

Con i sistemi di IA sempre più dipendenti dalla collaborazione multi-agente, garantire meccanismi di cooperazione equi e compatibili con gli incentivi è cruciale sia per l'affidabilità tecnica che per la fattibilità etica. Ciò coinvolge sfide complesse nell'allineamento dell'IA e nell'IA collaborativa nella sicurezza dell'IA.

Limitazioni degli Approcci Esistenti

La teoria classica dei giochi cooperativi assume che i premi siano indivisibili e non replicabili, ma nell'apprendimento collaborativo:

  • I premi sono modelli addestrati o insiemi di dati, replicabili infinitamente
  • I contributi marginali additivi potrebbero non riflettere l'importanza contestuale dei dati dei partecipanti
  • Esempio: migliorare l'accuratezza di un modello debole dal 10% al 20% potrebbe essere più significativo che migliorare un modello forte dal 90% al 92%, ma il metodo additivo premierebbe maggiormente quest'ultimo

Motivazione della Ricerca

Questo articolo propone di sostituire i guadagni additivi con contribuzioni moltiplicative (basate su rapporto), catturando l'impatto relativo di ciascun partecipante sulle prestazioni del modello, particolarmente adatto a:

  • Scenari con qualità dati eterogenea
  • Situazioni con contributi ridondanti
  • Costruzione di modelli nelle fasi iniziali

Contributi Principali

  1. Propone il Valore di Shapley Basato su Rapporto: sostituisce i contributi marginali assoluti con misure di miglioramento relativo
  2. Mantiene Garanzie Teoriche: dimostra che il nuovo metodo soddisfa gli stessi assiomi di incentivo e equità del valore di Shapley additivo
  3. Fornisce Fondamenti Matematici: offre un'alternativa principiata al quadro di Shapley additivo
  4. Rivela Non-Unicità: mostra che il quadro assiomatico attuale non determina univocamente il valore di Shapley, permettendo molteplici meccanismi compatibili

Dettagli del Metodo

Definizione del Compito

Considerare un'impostazione di apprendimento collaborativo con N partecipanti, dove ogni partecipante i ∈ N possiede un insieme di dati privato e deve decidere se contribuirlo a una coalizione congiunta per l'addestramento del modello. Modellato come un gioco cooperativo in forma caratteristica:

  • Insieme di Partecipanti: N
  • Funzione di Valore: v : 2^N → R≥0, dove v(∅) = 0
  • Monotonicità: ∀C' ⊆ C ⊆ N, v(C') ≤ v(C)

Innovazioni Tecniche Principali

1. Definizione di Contribuzione Marginale Relativa

Per un partecipante i ∈ N e una coalizione C ⊆ N \ {i}, il contributo marginale relativo è definito come:

Δ^rel_{i,C} := {
    v_{C∪{i}}/v_C - 1, se v_C ≠ 0
    0, altrimenti
}

2. Valore di Shapley Basato su Rapporto

Il valore di Shapley basato su rapporto per il partecipante i è:

φ^rel_i := (1/n!) ∑_{π∈Π_N} Δ^rel_{i,S_{π,i}}

dove Π_N è l'insieme di tutte le permutazioni di N, e S_{π,i} è la coalizione di partecipanti che precedono i nella permutazione π.

3. Meccanismo di Ricompensa con Scaling ρ

Per soddisfare l'efficienza debole (R3), si applica lo scaling ρ:

r_i = (φ^rel_i/φ*_C)^ρ × v_C

dove φ*C = max{i∈C} φ^rel_i assicura la normalizzazione, e ρ ∈ 0,1 controlla la grandezza della ricompensa, bilanciando tra equità e massimizzazione del benessere sociale.

Garanzie Teoriche

Assiomi di Incentivo (R1-R5)

  • R1 Non-Negatività: ogni partecipante riceve una ricompensa non negativa
  • R2 Fattibilità: le ricompense non superano il valore della coalizione
  • R3 Efficienza Debole: almeno un partecipante riceve l'intero valore della coalizione
  • R4 Razionalità Individuale: la ricompensa è almeno pari al valore dell'azione indipendente
  • R5 Equità: soddisfa gli assiomi di equità F1-F4

Assiomi di Equità (F1-F4)

  • F1 Inutilità: i contributori nulli ricevono ricompensa zero
  • F2 Simmetria: i contributori identici ricevono ricompense uguali
  • F3 Aspettativa Ristretta: i contributori maggiori ricevono più ricompensa
  • F4 Monotonicità Ristretta: all'aumentare del contributo aumenta la ricompensa

Impostazione Sperimentale

Progettazione di Esperimenti Sintetici

Creazione di 7 agenti {1,...,7}, con impostazione:

  • Valore individuale: v_i = √i
  • Valore della coalizione: v_C = √(∑_{i∈C} i)

Metodi di Confronto

Confronto della ricompensa basata su rapporto R_i con la ricompensa di Shapley additiva A_i di Sim et al.:

R_i = (φ^rel_i/φ^{rel,*})^ρ × v_C
A_i = (φ^add_i/φ^{add,*})^ρ × v_C

Risultati Sperimentali

Risultati Principali

  1. Differenze nella Distribuzione dei Premi: sebbene i due metodi convergano approssimativamente in casi estremi (ρ=0 o ρ=1), le curve di ricompensa differiscono significativamente nella regione intermedia
  2. Maggiore Equità per Partecipanti di Basso Rango: il metodo basato su rapporto mostra un calo più lento delle ricompense per i partecipanti di basso rango (linee blu e arancioni), poiché forniscono valore relativo sproporzionatamente alto in coalizioni più deboli
  3. Moderazione per Contributori Elevati: sebbene i contributori elevati ricevano comunque ricompense significativamente maggiori, nel metodo basato su rapporto le loro ricompense sono leggermente inferiori, poiché i contributi relativi non sono così pronunciati come i contributi assoluti

Scenari di Vantaggio

  1. Qualità Dati Eterogenea: una piccola quantità di dati ad alta qualità può migliorare significativamente un modello debole
  2. Contributi Ridondanti: situazioni in cui i guadagni marginali additivi diminuiscono a causa di informazioni sovrapposte
  3. Modellazione nelle Fasi Iniziali: scenari in cui i guadagni assoluti sono piccoli ma i miglioramenti relativi sono significativi

Lavori Correlati

Fondamenti della Teoria dei Giochi Cooperativi

  • Valore di Shapley 7: metodo classico basato su contributi marginali additivi attesi
  • Assunzioni tradizionali che i premi siano indivisibili e non replicabili 11,10

Apprendimento Automatico Collaborativo

  • Sim et al. 9: primo applicazione del valore di Shapley a premi di modelli replicabili
  • Valutazione dei dati nell'apprendimento federato 11
  • Framework robusti di valutazione dei dati come Banzhaf 10

Vantaggi Relativi di Questo Articolo

Fornisce un'alternativa principiata in scenari dove l'equità proporzionale e l'importanza contestuale dei contributi sono più rilevanti, mantenendo le stesse garanzie teoriche.

Conclusioni e Discussione

Conclusioni Principali

  1. Equivalenza Teorica: il valore di Shapley basato su rapporto soddisfa tutti gli stessi assiomi di incentivo e equità della versione additiva
  2. Differenza Pratica: produce comportamenti significativamente diversi nella distribuzione dei premi, particolarmente nell'enfasi sui contributi relativi
  3. Scoperta di Non-Unicità: il quadro assiomatico attuale non determina univocamente il valore di Shapley, permettendo l'esistenza di molteplici meccanismi compatibili

Limitazioni

  1. Complessità Computazionale: affronta le stesse sfide di complessità esponenziale del valore di Shapley originale
  2. Sensibilità ai Parametri: la scelta del parametro ρ influenza la razionalità individuale e la stabilità
  3. Restrizioni di Applicabilità: più adatto a scenari dove i miglioramenti relativi sono più importanti dei guadagni assoluti

Direzioni Future

  1. Caratterizzazione Completa: è necessario un teorema di rappresentazione formale che descriva tutte le funzioni soddisfacenti gli assiomi di incentivo consapevole
  2. Estensione degli Assiomi: potrebbero essere necessari nuovi assiomi per distinguere tra equità additiva e proporzionale
  3. Schemi Ibridi: esplorazione di schemi di ricompensa ibridi che interpolano tra valori additivi e basati su rapporto
  4. Valutazione Empirica: studio del comportamento empirico su insiemi di dati reali di apprendimento collaborativo

Valutazione Approfondita

Punti di Forza

  1. Rigore Teorico: fornisce prove matematiche complete, garantendo che tutte le proprietà critiche siano soddisfatte
  2. Innovazione Concettuale: il passaggio dal ragionamento additivo a quello moltiplicativo offre una nuova prospettiva sull'equità
  3. Valore Pratico: particolarmente adatto a scenari di apprendimento collaborativo con dati eterogenei o ridondanti
  4. Compatibilità del Quadro: completamente compatibile con il meccanismo di scaling ρ esistente e gli strumenti di analisi

Insufficienze

  1. Limitatezza Sperimentale: fornisce solo esperimenti sintetici, mancano validazioni su insiemi di dati reali
  2. Efficienza Computazionale: non affronta ottimizzazioni computazionali o algoritmi di approssimazione
  3. Guida ai Parametri: manca una guida pratica per la scelta del parametro ρ
  4. Casi di Studio Applicativi: necessitano più casi di studio in domini applicativi specifici

Impatto

  1. Contributo Teorico: rivela uno spazio più ampio per la progettazione di meccanismi di ricompensa nell'apprendimento collaborativo
  2. Guida Pratica: fornisce fondamenti per la scelta del metodo in diversi scenari applicativi
  3. Ispirazione per la Ricerca: apre importanti questioni sulla completezza e l'unicità degli assiomi di equità

Scenari di Applicabilità

  1. IA Medica Collaborativa: istituzioni con differenze significative nella qualità dei dati
  2. Apprendimento Federato: dispositivi con capacità eterogenee e distribuzioni di dati
  3. Digitalizzazione di Documenti: valutazione dell'importanza relativa del valore di documenti storici
  4. Reti di Sensori: ambienti con ridondanza e complementarità dei dati simultanee

Riferimenti Bibliografici

I principali riferimenti includono:

  • Shapley, L.S. (1953): A value for n-person games - Definizione originale del valore di Shapley
  • Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - Lavoro fondamentale esteso in questo articolo
  • Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - Aspetti computazionali della teoria dei giochi cooperativi
  • Altra letteratura correlata su sicurezza dell'IA, IA collaborativa e valutazione dei dati

Sintesi: Questo articolo fornisce un'alternativa al valore di Shapley matematicamente rigorosa, particolarmente adatta a scenari di apprendimento automatico collaborativo dove i contributi relativi sono più importanti delle differenze assolute. Sebbene il contributo teorico sia significativo, sono necessarie ulteriori validazioni empiriche e casi di applicazione pratica per dimostrare pienamente il suo valore pratico.