A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version
Filter, Möller, Ãzçep
Collaborative machine learning enables multiple data owners to jointly train models for improved predictive performance. However, ensuring incentive compatibility and fair contribution-based rewards remains a critical challenge. Prior work by Sim and colleagues (Rachel Hwee Ling Sim et al: Collaborative machine learning with incentive-aware model rewards. In: International conference on machine learning. PMLR. 2020, pp. 8927-8963) addressed this by allocating model rewards, which are non-monetary and freely replicable, based on the Shapley value of each party's data contribution, measured via information gain. In this paper, we introduce a ratio-based Shapley value that replaces the standard additive formulation with a relative contribution measure. While our overall reward framework, including the incentive definitions and model-reward setting, remains aligned with that of Sim and colleagues, the underlying value function is fundamentally different. Our alternative valuation induces a different distribution of model rewards and offers a new lens through which to analyze incentive properties. We formally define the ratio-based value and prove that it satisfies the same set of incentive conditions as the additive formulation, including adapted versions of fairness, individual rationality, and stability. Like the original approach, our method faces the same fundamental trade-offs between these incentives. Our contribution is a mathematically grounded alternative to the additive Shapley framework, potentially better suited to contexts where proportionality among contributors is more meaningful than additive differences.
academic
Un Valore di Shapley Basato su Rapporto per l'Apprendimento Automatico Collaborativo - Versione Estesa
L'apprendimento automatico collaborativo consente a più proprietari di dati di addestrare congiuntamente modelli per migliorare le prestazioni predittive. Tuttavia, garantire la compatibilità degli incentivi e l'equa distribuzione dei premi basata sul contributo rimane una sfida critica. Il lavoro precedente di Sim et al. affronta questo problema assegnando premi del modello (non monetari e liberamente replicabili) basati sul valore di Shapley della contribuzione dati di ciascuna parte, misurata attraverso il guadagno informativo. Questo articolo introduce un valore di Shapley basato su rapporto, sostituendo la formula additiva standard con una misura di contribuzione relativa. Sebbene il quadro complessivo dei premi (incluse le definizioni degli incentivi e l'impostazione dei premi del modello) rimanga coerente con Sim et al., la funzione di valore sottostante è fondamentalmente diversa. Questa valutazione alternativa produce distribuzioni di premi del modello differenti e fornisce una nuova prospettiva per l'analisi delle proprietà degli incentivi.
Il problema centrale nell'apprendimento automatico collaborativo è come distribuire equamente i premi del modello tra più proprietari di dati, garantendo:
Compatibilità degli Incentivi: i partecipanti hanno motivazione a contribuire dati
Equità: i premi sono proporzionali al contributo effettivo
Fattibilità: la distribuzione dei premi è tecnicamente realizzabile
Con i sistemi di IA sempre più dipendenti dalla collaborazione multi-agente, garantire meccanismi di cooperazione equi e compatibili con gli incentivi è cruciale sia per l'affidabilità tecnica che per la fattibilità etica. Ciò coinvolge sfide complesse nell'allineamento dell'IA e nell'IA collaborativa nella sicurezza dell'IA.
La teoria classica dei giochi cooperativi assume che i premi siano indivisibili e non replicabili, ma nell'apprendimento collaborativo:
I premi sono modelli addestrati o insiemi di dati, replicabili infinitamente
I contributi marginali additivi potrebbero non riflettere l'importanza contestuale dei dati dei partecipanti
Esempio: migliorare l'accuratezza di un modello debole dal 10% al 20% potrebbe essere più significativo che migliorare un modello forte dal 90% al 92%, ma il metodo additivo premierebbe maggiormente quest'ultimo
Questo articolo propone di sostituire i guadagni additivi con contribuzioni moltiplicative (basate su rapporto), catturando l'impatto relativo di ciascun partecipante sulle prestazioni del modello, particolarmente adatto a:
Propone il Valore di Shapley Basato su Rapporto: sostituisce i contributi marginali assoluti con misure di miglioramento relativo
Mantiene Garanzie Teoriche: dimostra che il nuovo metodo soddisfa gli stessi assiomi di incentivo e equità del valore di Shapley additivo
Fornisce Fondamenti Matematici: offre un'alternativa principiata al quadro di Shapley additivo
Rivela Non-Unicità: mostra che il quadro assiomatico attuale non determina univocamente il valore di Shapley, permettendo molteplici meccanismi compatibili
Considerare un'impostazione di apprendimento collaborativo con N partecipanti, dove ogni partecipante i ∈ N possiede un insieme di dati privato e deve decidere se contribuirlo a una coalizione congiunta per l'addestramento del modello. Modellato come un gioco cooperativo in forma caratteristica:
Per soddisfare l'efficienza debole (R3), si applica lo scaling ρ:
r_i = (φ^rel_i/φ*_C)^ρ × v_C
dove φ*C = max{i∈C} φ^rel_i assicura la normalizzazione, e ρ ∈ 0,1 controlla la grandezza della ricompensa, bilanciando tra equità e massimizzazione del benessere sociale.
Differenze nella Distribuzione dei Premi: sebbene i due metodi convergano approssimativamente in casi estremi (ρ=0 o ρ=1), le curve di ricompensa differiscono significativamente nella regione intermedia
Maggiore Equità per Partecipanti di Basso Rango: il metodo basato su rapporto mostra un calo più lento delle ricompense per i partecipanti di basso rango (linee blu e arancioni), poiché forniscono valore relativo sproporzionatamente alto in coalizioni più deboli
Moderazione per Contributori Elevati: sebbene i contributori elevati ricevano comunque ricompense significativamente maggiori, nel metodo basato su rapporto le loro ricompense sono leggermente inferiori, poiché i contributi relativi non sono così pronunciati come i contributi assoluti
Fornisce un'alternativa principiata in scenari dove l'equità proporzionale e l'importanza contestuale dei contributi sono più rilevanti, mantenendo le stesse garanzie teoriche.
Equivalenza Teorica: il valore di Shapley basato su rapporto soddisfa tutti gli stessi assiomi di incentivo e equità della versione additiva
Differenza Pratica: produce comportamenti significativamente diversi nella distribuzione dei premi, particolarmente nell'enfasi sui contributi relativi
Scoperta di Non-Unicità: il quadro assiomatico attuale non determina univocamente il valore di Shapley, permettendo l'esistenza di molteplici meccanismi compatibili
Caratterizzazione Completa: è necessario un teorema di rappresentazione formale che descriva tutte le funzioni soddisfacenti gli assiomi di incentivo consapevole
Estensione degli Assiomi: potrebbero essere necessari nuovi assiomi per distinguere tra equità additiva e proporzionale
Schemi Ibridi: esplorazione di schemi di ricompensa ibridi che interpolano tra valori additivi e basati su rapporto
Valutazione Empirica: studio del comportamento empirico su insiemi di dati reali di apprendimento collaborativo
Shapley, L.S. (1953): A value for n-person games - Definizione originale del valore di Shapley
Sim, R.H.L. et al. (2020): Collaborative machine learning with incentive-aware model rewards - Lavoro fondamentale esteso in questo articolo
Chalkiadakis, G. et al. (2011): Computational aspects of cooperative game theory - Aspetti computazionali della teoria dei giochi cooperativi
Altra letteratura correlata su sicurezza dell'IA, IA collaborativa e valutazione dei dati
Sintesi: Questo articolo fornisce un'alternativa al valore di Shapley matematicamente rigorosa, particolarmente adatta a scenari di apprendimento automatico collaborativo dove i contributi relativi sono più importanti delle differenze assolute. Sebbene il contributo teorico sia significativo, sono necessarie ulteriori validazioni empiriche e casi di applicazione pratica per dimostrare pienamente il suo valore pratico.