2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu

Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.

academic

Spiegazioni Comparative tramite Ragionamento Controffattuale nelle Raccomandazioni

Informazioni Fondamentali

ID Articolo: 2510.10920
Titolo: Comparative Explanations via Counterfactual Reasoning in Recommendations
Autori: Yi Yu (Huawei Technologies Co., Ltd.), Zhenxing Hu (Huawei Technologies Co., Ltd.)
Classificazione: cs.IR (Information Retrieval), cs.AI (Intelligenza Artificiale)
Data di Pubblicazione/Conferenza: Sottomesso a Conferenza nel 2025 (conferenza specifica da definire)
Link Articolo: https://arxiv.org/abs/2510.10920

Riassunto

I sistemi di raccomandazione esplicabili cercano di identificare i fattori influenti degli articoli nelle raccomandazioni attraverso il ragionamento controffattuale, che possono essere utilizzati come spiegazioni. Tuttavia, i metodi all'avanguardia attuali mirano a minimizzare le variazioni degli attributi dei prodotti mentre invertono le decisioni di raccomandazione in base ai punteggi dei confini decisionali aggregati, il che spesso porta a inesattezze fattuali nelle spiegazioni. Per affrontare questo problema, il presente articolo propone un nuovo metodo di spiegazione controffattuale comparativa per le raccomandazioni (CoCountER). CoCountER crea dati controffattuali basati su operazioni di scambio soft, in grado di fornire spiegazioni per le raccomandazioni di coppie di articoli arbitrariamente comparabili. Gli esperimenti empirici convalidano l'efficacia del metodo.

Contesto di Ricerca e Motivazione

Definizione del Problema

I sistemi di raccomandazione esplicabili mirano a fornire raccomandazioni di alta qualità agli utenti fornendo al contempo spiegazioni chiare per aiutare gli utenti a comprendere la logica alla base delle raccomandazioni, aumentando così la fiducia e la soddisfazione dell'utente nei confronti del sistema.

Limitazioni dei Metodi Esistenti

Problemi dei metodi basati su corrispondenza: I metodi di spiegazione basati su template (come EFM, MTER, A2CF) ottimizzano le rappresentazioni di raccomandazione e attributi attraverso tecniche di fattorizzazione tensoriale, ma potrebbero selezionare attributi con punteggi di corrispondenza elevati ma prestazioni effettive scarse come spiegazioni.
Difetti dei metodi controffattuali esistenti: Metodi come CountER invertono le decisioni minimizzando la riduzione delle caratteristiche, ma presentano problemi di inesattezza fattuale. Utilizzando l'esempio degli auricolari nell'articolo, CountER potrebbe selezionare il comfort come spiegazione per la raccomandazione degli auricolari A, ma in realtà gli auricolari A hanno prestazioni inferiori nel comfort rispetto agli auricolari B.
Causa fondamentale: I metodi esistenti ottimizzano la spinta di tutte le riduzioni di attributi verso il punteggio del confine decisionale, piuttosto che spingere ogni attributo verso il confine decisionale, causando spiegazioni contraddittorie all'intuizione.

Motivazione della Ricerca

Il presente articolo propone di risolvere i problemi di cui sopra attraverso il ragionamento controffattuale comparativo, generando spiegazioni più fedeli e intuitive attraverso operazioni di scambio a livello di attributo tra coppie di articoli.

Contributi Fondamentali

Propone un nuovo metodo di creazione di dati controffattuali: Meccanismo di generazione di dati controffattuali basato su operazioni di scambio soft
Framework innovativo di spiegazione controffattuale comparativa: CoCountER è in grado di fornire spiegazioni per le raccomandazioni di coppie di articoli arbitrariamente comparabili
Convalida sperimentale: Convalida l'efficacia del metodo su più dataset, superando i metodi esistenti nelle metriche di rilevanza controffattuale

Dettagli del Metodo

Definizione del Compito

Dato un utente target u, un articolo di spiegazione i e un articolo di riferimento j, dove il punteggio di raccomandazione soddisfa r_{u,i} > r_{u,j}, l'obiettivo è identificare gli attributi chiave che influenzano la decisione di raccomandazione attraverso operazioni di scambio minime.

Architettura del Modello

1. Preelaborazione dei Dati

Utilizza lo strumento Sentires per estrarre tuple (utente, articolo, attributo, sentimento) dai commenti degli utenti, costruendo:

Matrice di attenzione utente-attributo X: X_{u,a} rappresenta il livello di attenzione dell'utente u verso l'attributo a
Matrice di qualità articolo-attributo Y: Y_{i,a} rappresenta le prestazioni dell'articolo i sull'attributo a

Formula di calcolo:

X_{u,a} = {
  0, se l'utente u non ha menzionato l'attributo a
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), altrimenti
}

Y_{i,a} = {
  0, se l'articolo i non è stato menzionato sull'attributo a
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), altrimenti
}

2. Modello di Raccomandazione

Adotta un'architettura di strato di fusione semplice:

r_{u,i} = g_θ(X_u, Y_i)

Implementato attraverso una rete completamente connessa a tre strati + funzione di attivazione ReLU + output Sigmoid.

3. Nucleo della Spiegazione Controffattuale Comparativa

Progettazione della Funzione di Scambio:

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

dove σ(ψ) è la funzione sigmoid e ψ è il vettore di variabili di scambio addestrabile.

Obiettivo di Ottimizzazione:

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

dove L è la perdita di ordinamento dei confini:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

Punti di Innovazione Tecnica

Operazione di Scambio Soft: Implementa un'operazione di scambio differenziabile attraverso la funzione sigmoid, con valori vicini a 0 che indicano nessuno scambio e valori vicini a 1 che indicano scambio completo
Framework Comparativo: A differenza delle spiegazioni tradizionali di singoli articoli, fornisce spiegazioni comparative tra articoli
Universalità: Quando l'articolo di riferimento è fisso e viene calcolata solo la prima parte della funzione di scambio, può degenerare in un metodo controffattuale basato su riduzione

Configurazione Sperimentale

Dataset

Utilizza tre categorie del dataset di recensioni Amazon:

Electronics: 963 utenti, 1.112 articoli, 19.418 recensioni, 877 attributi
CDs & Vinyl: 2.129 utenti, 2.907 articoli, 56.045 recensioni, 810 attributi
Movies: 5.586 utenti, 6.703 articoli, 187.490 recensioni, 1.530 attributi

Preelaborazione dei dati: Filtra utenti e articoli con meno di 10 interazioni, divide in set di addestramento/validazione/test con rapporto 8:1:1.

Metriche di Valutazione

Metriche orientate all'utente: Precision e Recall
Metriche orientate al modello: Probability of Necessity (PN) e Probability of Sufficiency (PS)

Metodi di Confronto

Metodo casuale: Random
Metodi di ordinamento: Sort-i (ordina per prestazioni dell'attributo dell'articolo), Sort-u (ordina per attenzione dell'utente)
Metodi basati su corrispondenza: EFM, A2CF
Metodi controffattuali: CountER, CoCountER (metodo del presente articolo)

Dettagli di Implementazione

Tasso di apprendimento η ottimizzato mediante discesa del gradiente
Soglia di confine m utilizzata per la perdita di ordinamento
Fattore di bilanciamento λ coordina i due obiettivi di ottimizzazione
Soglia di scambio impostata a 0,5 per identificare gli attributi di spiegazione

Risultati Sperimentali

Risultati Principali

Su tutti e tre i dataset, CoCountER supera costantemente tutti i metodi di base nelle metriche di rilevanza controffattuale PN e PS:

Dataset Electronics:

PN: 0,734 (vs CountER 0,511)
PS: 0,931 (vs CountER 0,894)

Dataset CDs & Vinyl:

PN: 0,773 (vs CountER 0,526)
PS: 0,936 (vs CountER 0,921)

Dataset Movies:

PN: 0,744 (vs CountER 0,496)
PS: 0,928 (vs CountER 0,889)

Analisi degli Iperparametri

Impatto della posizione dell'articolo di riferimento: Gli articoli di riferimento con ranking più basso creano vincoli di ottimizzazione minori, consentendo di scoprire più attributi controffattuali efficaci, migliorando le prestazioni di PN e PS
Impatto del numero di articoli di riferimento: L'aumento moderato del numero di articoli di riferimento migliora le prestazioni, ma un numero eccessivo introduce rumore causando un leggero calo

Scoperte Sperimentali

CoCountER fornisce spiegazioni più fedeli e consapevoli del contesto rispetto a CountER attraverso operazioni di scambio a livello di attributo
La progettazione controffattuale comparativa cattura i veri attributi causali alla base delle raccomandazioni
Il metodo mantiene stabilità in un'ampia gamma di impostazioni, dimostrando buona robustezza

Lavori Correlati

Sistemi di Raccomandazione Esplicabili

Metodi basati su attributi: EFM, MTER, A2CF e altri utilizzano tecniche di fattorizzazione tensoriale per costruire spiegazioni basate su template
Metodi di ragionamento controffattuale: CountER introduce per la prima volta il ragionamento controffattuale nei sistemi di raccomandazione esplicabili
Metodi di generazione di testo: Combinano modelli di linguaggio pre-addestrati come BERT per generare spiegazioni testuali

Spiegazioni Comparative

Yang e altri propongono il concetto di spiegazione comparativa, ma adottano un decodificatore autoregressivo per generare spiegazioni testuali, differente dalla prospettiva di ragionamento controffattuale del presente articolo.

Applicazione del Ragionamento Causale nei Sistemi di Raccomandazione

Negli ultimi anni, il ragionamento causale è stato ampiamente applicato all'aumento dei dati e al miglioramento dell'equità nei sistemi di raccomandazione.

Conclusioni e Discussione

Conclusioni Principali

Propone il framework CoCountER che genera spiegazioni di raccomandazione più fedeli attraverso il ragionamento controffattuale comparativo
L'operazione di scambio soft è in grado di identificare efficacemente gli attributi chiave che influenzano le decisioni di raccomandazione
Gli esperimenti dimostrano che il metodo supera significativamente i metodi esistenti nelle metriche controffattuali

Limitazioni

Semplificazione del modello di raccomandazione: Per concentrarsi sulla esplicabilità, adotta un'architettura di modello di raccomandazione relativamente semplice
Complessità computazionale: Richiede l'ottimizzazione per ogni articolo di riferimento, aumentando i costi computazionali
Dipendenza dagli attributi: Il metodo dipende dagli attributi estratti dalle recensioni, è sensibile alla qualità degli attributi

Direzioni Future

L'articolo propone di combinare il ragionamento controffattuale con modelli generativi per produrre spiegazioni in linguaggio naturale di scenari controffattuali.

Valutazione Approfondita

Punti di Forza

Forte innovazione: Propone per la prima volta un framework di spiegazione controffattuale comparativa, risolvendo il problema di inesattezza fattuale dei metodi esistenti
Fondamenta teoriche solide: Spiega chiaramente i problemi dei metodi esistenti attraverso esempi concreti e fornisce analisi teorica
Progettazione del metodo ragionevole: La progettazione dell'operazione di scambio soft garantisce sia la differenziabilità che fornisce spiegazioni intuitive
Esperimenti sufficienti: Convalida su più dataset, include analisi di sensibilità degli iperparametri

Insufficienze

Limitazioni delle metriche di valutazione: Si concentra principalmente su metriche controffattuali, manca di studi con utenti per convalidare l'usabilità pratica delle spiegazioni
Metodi di base limitati: Sebbene includa i principali metodi di confronto, mancano più metodi di spiegazione controffattuale recenti
Problemi di scalabilità: Con l'aumento del numero di articoli, il numero di coppie di articoli da considerare cresce quadraticamente
Considerazioni insufficienti per il deployment pratico: Manca di discussione sull'efficienza e sulla scalabilità durante il deployment in sistemi di raccomandazione reali

Impatto

Contributo accademico: Fornisce una nuova direzione di ricerca nel campo dei sistemi di raccomandazione esplicabili
Valore pratico: Genera spiegazioni più intuitive, contribuendo a migliorare l'esperienza utente
Riproducibilità: Fornisce descrizioni dettagliate degli algoritmi e dettagli di implementazione

Scenari Applicabili

Raccomandazioni di e-commerce: Particolarmente adatto a scenari che richiedono spiegazioni del perché un prodotto è consigliato rispetto ad altri
Raccomandazioni di contenuti: Applicabile a sistemi di raccomandazione di film, musica e altri contenuti
Decisioni ad alto rischio: Adatto a scenari che richiedono elevata esplicabilità nelle raccomandazioni

Riferimenti Bibliografici

L'articolo cita 30 lavori correlati, coprendo importanti lavori in più campi correlati inclusi sistemi di raccomandazione esplicabili, ragionamento controffattuale e ragionamento causale, fornendo una base teorica solida per la ricerca.

Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità che propone un framework innovativo di spiegazione controffattuale comparativa, risolvendo importanti problemi dei metodi esistenti. La progettazione del metodo è ragionevole, la convalida sperimentale è sufficiente e fornisce contributi significativi al campo dei sistemi di raccomandazione esplicabili. Sebbene esistano alcune limitazioni, nel complesso è un lavoro di ricerca di valore.