Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic
Miglioramento della Causalità per la Raccomandazione Cross-Domain
La raccomandazione cross-domain rappresenta una componente essenziale dei sistemi di raccomandazione, migliorando le raccomandazioni nel dominio target attraverso informazioni ausiliarie da compiti o caratteristiche del dominio sorgente. Tuttavia, l'introduzione di compiti del dominio sorgente incoerenti può portare a una modellazione cross-domain insufficiente o a trasferimento negativo, mentre l'introduzione di caratteristiche del dominio sorgente senza considerare le relazioni causali potenziali può limitare il loro contributo alla previsione finale. Questo articolo propone un framework di miglioramento causale CE-CDR, che innanzitutto riformula la raccomandazione cross-domain come grafo causale, quindi costruisce euristicamente un dataset consapevole della causalità e deriva una funzione di perdita causale con etichette parziali teoricamente imparziale, per generalizzare a modelli cross-domain non osservati. Il metodo è stato distribuito in ambiente di produzione, dimostrando il suo valore di applicazione pratica.
I sistemi tradizionali di raccomandazione cross-domain affrontano due sfide principali:
Incoerenza dei Compiti: i metodi di apprendimento multi-task promuovono il trasferimento di conoscenze cross-domain attraverso la condivisione di parametri o rappresentazioni, ma a causa dell'incoerenza dei compiti tra i domini, potrebbero non catturare informazioni cross-domain preziose, causando persino trasferimento negativo
Scarsità di Relazioni Causali: i metodi che utilizzano il comportamento del dominio sorgente come caratteristica di input aggiuntiva ignorano la scarsità di relazioni causali tra il dominio sorgente e quello target; le preferenze dell'utente nel dominio target non sono necessariamente influenzate dal comportamento nel dominio sorgente
I metodi esistenti apprendono sia la funzione L→S e L→T (apprendimento multi-task) sia la funzione (L,S)→T (fusione di caratteristiche), ma nessuno modella direttamente le relazioni causali cross-domain. Questo articolo propone di addestrare direttamente le rappresentazioni cross-domain su dataset annotati causalmente, apprendendo la funzione (L,S)→I→T, dove I rappresenta informazioni cross-domain trasferibili di valore.
La sfida principale è identificare etichette causali vere imparziali in scenari reali, il che è estremamente difficile. Questo articolo affronta questo problema costruendo euristicamente un dataset consapevole della causalità e progettando una funzione di perdita teoricamente imparziale.
Ricostruzione del Grafo Causale: riformula per la prima volta il compito di raccomandazione cross-domain come grafo causale, fornendo una guida metodologica principiata per la progettazione del metodo
Framework di Miglioramento Causale: propone il framework CE-CDR, che modella direttamente le relazioni causali cross-domain da prospettive di dati e modello
Innovazione Teorica: deriva la perdita causale con etichette parziali (PLCL) teoricamente imparziale, in grado di generalizzare a modelli causali non osservati
Verifica Pratica: come plugin model-agnostic possiede applicabilità universale ed è stato distribuito in ambiente di produzione con effetti significativi
Si consideri uno scenario di raccomandazione cross-domain contenente un dominio sorgente s e un dominio target t, con i due domini che condividono l'insieme di utenti U. Ogni dominio ha il proprio insieme di elementi: Is per il dominio sorgente e It per il dominio target. L'utente u ha sequenze di interazione in entrambi i domini Ss^u e St^u. L'obiettivo è utilizzare la conoscenza del dominio sorgente per migliorare l'accuratezza della raccomandazione nel dominio target.
Ipotesi Fondamentale: Ipotesi di Allineamento Similarità-Causalità
Per un dato utente, la sua preferenza per un elemento is nel dominio sorgente influenza causalmente la sua preferenza per elementi simili it nel dominio target
Metodo di Implementazione:
Utilizza due misure di similarità: similarità di contenuto e similarità comportamentale
Gli embedding di contenuto vengono appresi attraverso un compito di classificazione di categoria condiviso cross-domain
Gli embedding comportamentali vengono generati da un codificatore grafico dell'interazione globale utente-elemento
Formula di calcolo della similarità:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
La similarità complessiva viene calcolata prendendo il massimo dopo la calibrazione CDF:
Perdita Causale con Etichette Parziali (PLCL):
L'innovazione fondamentale risiede nel trattamento del problema dell'annotazione parziale. Poiché l'alta similarità non è una condizione necessaria per la causalità, l'addestramento diretto sul dataset costruito da CLM produrrebbe distorsione.
Proposizione 1: Dato il vero punteggio di propensione e(x), il modello causale f(x) può apprendere stime di probabilità causale teoricamente imparziali attraverso l'ottimizzazione della seguente perdita:
L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]
dove l'etichetta corretta è:
h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]
Proposizione 2: Il modello di propensione e(x) viene ottimizzato attraverso la seguente perdita:
Prospettiva Causale: Riesamina sistematicamente per la prima volta il problema della raccomandazione cross-domain dal punto di vista dell'inferenza causale
Apprendimento con Etichette Parziali: Introduce innovativamente l'apprendimento con etichette parziali nella modellazione causale, risolvendo il problema della distorsione di annotazione
Garanzie Teoriche: Fornisce una funzione di perdita teoricamente imparziale, garantendo la capacità di generalizzazione del modello
Fusione Adattiva: Meccanismo di gating dinamico che regola il contributo di informazioni cross-domain in base alle caratteristiche dell'utente
Verifica della Capacità di Generalizzazione:
Escludendo un tipo di similarità nella costruzione del dataset, si scopre che DCMM può identificare modelli causali non osservati, provando la capacità di generalizzazione del modello oltre la strategia di annotazione.
Analisi del Contributo di Caratteristiche:
Gli esperimenti di mascheramento di caratteristiche mostrano che l'attivazione di caratteristiche cross-domain di CE-CDR ha una varianza molto maggiore rispetto ai metodi di base, provando un utilizzo più efficace di informazioni cross-domain.
Interpretazione del Gating Dinamico:
Gli utenti con informazioni ricche nel dominio sorgente hanno valori di gating più elevati, verificando l'efficacia del meccanismo di fusione adattiva.
I metodi esistenti si dividono principalmente in due categorie:
Apprendimento Multi-Task: Promuove il trasferimento di conoscenze attraverso la condivisione di parametri o rappresentazioni, ma presenta problemi di incoerenza dei compiti
Fusione di Caratteristiche: Utilizza il comportamento del dominio sorgente come caratteristica di input, ma ignora la scarsità di relazioni causali
L'articolo cita 76 lavori correlati, coprendo molteplici aree come raccomandazione cross-domain, inferenza causale e meccanismi di attenzione, fornendo una solida base teorica per la progettazione del metodo.
Valutazione Complessiva: Questo è un articolo di importante significato innovativo nel campo della raccomandazione cross-domain, che introduce sistematicamente l'inferenza causale in questo ambito, proponendo una soluzione teoricamente garantita ed efficace nella pratica. I contributi teorici, la verifica sperimentale e la distribuzione pratica dell'articolo riflettono un elevato valore accademico e pratico.