Generalized Top-k Mallows Model for Ranked Choices
Haddadan, Ahmadian
The classic Mallows model is a foundational tool for modeling user preferences. However, it has limitations in capturing real-world scenarios, where users often focus only on a limited set of preferred items and are indifferent to the rest. To address this, extensions such as the top-k Mallows model have been proposed, aligning better with practical applications. In this paper, we address several challenges related to the generalized top-k Mallows model, with a focus on analyzing buyer choices. Our key contributions are: (1) a novel sampling scheme tailored to generalized top-k Mallows models, (2) an efficient algorithm for computing choice probabilities under this model, and (3) an active learning algorithm for estimating the model parameters from observed choice data. These contributions provide new tools for analysis and prediction in critical decision-making scenarios. We present a rigorous mathematical analysis for the performance of our algorithms. Furthermore, through extensive experiments on synthetic data and real-world data, we demonstrate the scalability and accuracy of our proposed methods, and we compare the predictive power of Mallows model for top-k lists compared to the simpler Multinomial Logit model.
academic
Modello Mallows Top-k Generalizzato per Scelte Ordinate
Il modello Mallows classico rappresenta uno strumento fondamentale per la modellazione delle preferenze degli utenti, ma presenta limitazioni nel catturare scenari reali—gli utenti tipicamente si concentrano su un insieme limitato di articoli preferiti, rimanendo indifferenti ai restanti. Questo articolo affronta diverse sfide del modello Mallows top-k generalizzato, concentrandosi sull'analisi delle scelte degli acquirenti. I contributi principali includono: (1) un nuovo schema di campionamento personalizzato per il modello Mallows top-k generalizzato; (2) un algoritmo efficiente per il calcolo delle probabilità di scelta secondo questo modello; (3) un algoritmo di apprendimento attivo per la stima dei parametri del modello dai dati di scelta osservati. Questi contributi forniscono nuovi strumenti per l'analisi e la previsione in scenari decisionali critici, e la scalabilità e l'accuratezza dei metodi sono verificate attraverso rigorosa analisi matematica e ampi esperimenti su dati sintetici e reali.
Il problema centrale affrontato in questo articolo è: come modellare efficacemente le preferenze degli utenti e prevedere il loro comportamento di scelta in scenari realistici dove gli utenti forniscono solo informazioni di ordinamento parziale (liste top-k) piuttosto che ordinamenti completi.
Ampia Applicabilità Pratica: In sistemi di raccomandazione, piattaforme pubblicitarie, motori di ricerca, aggregatori di notizie e altri scenari, gli utenti tipicamente esprimono preferenze solo per un numero limitato di articoli
Valore Decisionale Commerciale: La previsione accurata del comportamento di scelta dei clienti è cruciale per decisioni critiche come la gestione dei ricavi e l'ottimizzazione del portafoglio prodotti
Significato Teorico: Estensione di modelli probabilistici classici di ordinamento a scenari di ordinamento parziale più realistici
Modello Mallows Classico: Limitato a permutazioni complete (full permutations), incapace di gestire ordinamenti parziali
Modello Multinomial Logit (MNL): Sebbene semplice, ha capacità espressiva limitata e soddisfa l'ipotesi di indipendenza dalle alternative irrilevanti (IIA), limitando la modellazione di comportamenti di scelta complessi
Estensioni top-k Esistenti: Il modello top-k Mallows proposto da Chierichetti et al. (2018) manca di algoritmi di campionamento efficienti e metodi di calcolo delle probabilità di scelta
Difficoltà nell'Apprendimento dei Parametri: L'apprendimento dei parametri del modello dai dati di scelta (piuttosto che da ordinamenti completi) manca di garanzie teoriche
Gli autori ritengono che l'estensione del modello Mallows a liste top-k possa riflettere più realisticamente la struttura delle preferenze degli utenti, ma richiede la risoluzione di tre problemi algoritmici critici: campionamento efficiente, calcolo delle probabilità di scelta e apprendimento dei parametri.
Algoritmo di Campionamento PRIM: Propone Profile-based Repeated Insertion Method (PRIM), che realizza un campionamento efficiente dalla distribuzione TopKGMM, riducendo la complessità temporale da O(k²4^k + k²log n) a O(k2^k + k²log n)
Algoritmo DYPCHIP per Probabilità di Scelta: Progetta l'algoritmo Dynamic Programming for Choice Probabilities (DYPCHIP), che calcola efficientemente le probabilità di scelta secondo il modello Mallows top-k
Algoritmo di Apprendimento Attivo BUCCHOI: Sviluppa l'algoritmo Build Center from Choices (BUCCHOI) di apprendimento attivo, che deduce il centro della distribuzione e la dimensione centrale k presentando assortimenti di dimensioni specificate e osservando le scelte, con complessità campionaria Θ(r²log n)
Generalizzazione del Modello: Estende il modello Mallows top-k di Chierichetti et al. a una versione generalizzata (TopKGMM), associando pesi a ogni prodotto
Verifica Empirica: Dimostra sul dataset di preferenze Sushi che il modello Mallows top-k ha significativamente maggiore accuratezza predittiva rispetto al modello MNL
Questa decomposizione è l'innovazione algoritmica centrale, che scompone la complessa distribuzione di liste top-k in due fasi: selezione del profilo e ordinamento condizionato.
Quindi costruire τ mediante il metodo di inserimento ripetuto condizionato a S
Flusso dell'Algoritmo:
1. Precalcolare le probabilità di tutti i profili (tempo O(2^γk), γ=min{k,n-k})
2. Campionare il profilo S
3. Inizializzazione: campionare uniformemente k-ℓ elementi da [n]\[k]
4. Inserire elementi s in S in ordine di priorità, con probabilità di inserimento
nella posizione j:
P(inserire s nella posizione j) ∝ exp(-βw_s·j)
Punti di Innovazione:
Risolve il problema aperto lasciato da Chierichetti et al. (mancanza di un metodo di campionamento simile a RIM)
Riduce significativamente la complessità attraverso la decomposizione del profilo
Il costo ammortizzato per campione dopo il preprocessing è solo O(k log n)
Idea Centrale: Attraverso la programmazione dinamica, calcolare la probabilità di scelta condizionata al profilo S
Struttura dell'Algoritmo:
Tabella DP Tridimensionale π_S(i, j, q):
i: i-esimo elemento nell'assortimento A
j: posizione attuale
q: q-esima iterazione dell'algoritmo PRIM
Significato: dopo la q-esima iterazione, probabilità che a_i sia l'elemento con ranking più alto in A∅ e sia posizionato nella posizione j
Relazione di Ricorrenza:
Quando il nuovo elemento non è in A:
π_S(i,j,q) = π_S(i,j,q-1)·P(inserimento>j) + π_S(i,j-1,q-1)·P(inserimento≤j-1)
Quando il nuovo elemento è in A:
π_S(i,j,q) = π_S(i,j,q-1)·P(inserimento>j)
π_S(cur,j,q) = P(inserimento=j)·Σ_{i<cur}Σ_{j'≥j}π_S(i,j',q-1)
Miglioramento Relativo: Riduzione dell'errore del 51.4%
Scoperte Chiave:
Quando β è piccolo (0.01-0.1) le prestazioni sono migliori, indicando una distribuzione relativamente uniforme
L'effetto è migliore quando p=0.5, bilanciando diversi tipi di incoerenza
TopKGMM è significativamente superiore a MNL, verificando la capacità espressiva del modello
Caso Con Clustering (Tabella 2, 2 cluster):
p=0.1, β=0.1: errore di test 0.0771
p=1.25, β=0.05: errore di test 0.0788
Osservazione: Le prestazioni dopo il clustering migliorano leggermente, ma il coefficiente di silhouette è molto basso (<0.012), suggerendo che i dati potrebbero provenire da una singola distribuzione
Questo articolo fornisce contributi importanti nell'intersezione tra il modello Mallows top-k e la modellazione della scelta. Attraverso l'ingegnosa decomposizione del profilo, gli autori progettano una suite completa di strumenti algoritmici e forniscono analisi teorica rigorosa. Gli esperimenti verificano l'efficacia dei metodi, in particolare il significativo vantaggio rispetto a MNL su dati reali.
Il valore principale risiede in: (1) risoluzione teorica di importanti problemi aperti; (2) fornitura di strumenti praticabili; (3) fondazione per ricerche future.
La principale limitazione è la dipendenza esponenziale da k, che limita l'applicazione in scenari con k grande. La ricerca futura su modelli misti e lo sviluppo di algoritmi di approssimazione miglioreranno ulteriormente l'applicabilità pratica di questo metodo.
Per applicazioni che richiedono la modellazione di preferenze di ordinamento parziale e la previsione del comportamento di scelta, il framework TopKGMM e gli algoritmi forniti in questo articolo rappresentano uno strumento prezioso, in particolare in scenari con k relativamente piccolo (≤12) e dove è richiesta elevata accuratezza predittiva.