2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic

Miglioramento della Causalità per la Raccomandazione Cross-Domain

Informazioni Fondamentali

  • ID Articolo: 2510.14641
  • Titolo: Causality Enhancement for Cross-Domain Recommendation
  • Autori: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
  • Classificazione: cs.IR cs.AI
  • Conferenza di Pubblicazione: Acronimo Conferenza 'XX (secondo il contenuto del PDF, sembra essere un modello di conferenza)
  • Link Articolo: https://arxiv.org/abs/2510.14641

Riassunto

La raccomandazione cross-domain rappresenta una componente essenziale dei sistemi di raccomandazione, migliorando le raccomandazioni nel dominio target attraverso informazioni ausiliarie da compiti o caratteristiche del dominio sorgente. Tuttavia, l'introduzione di compiti del dominio sorgente incoerenti può portare a una modellazione cross-domain insufficiente o a trasferimento negativo, mentre l'introduzione di caratteristiche del dominio sorgente senza considerare le relazioni causali potenziali può limitare il loro contributo alla previsione finale. Questo articolo propone un framework di miglioramento causale CE-CDR, che innanzitutto riformula la raccomandazione cross-domain come grafo causale, quindi costruisce euristicamente un dataset consapevole della causalità e deriva una funzione di perdita causale con etichette parziali teoricamente imparziale, per generalizzare a modelli cross-domain non osservati. Il metodo è stato distribuito in ambiente di produzione, dimostrando il suo valore di applicazione pratica.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

I sistemi tradizionali di raccomandazione cross-domain affrontano due sfide principali:

  1. Incoerenza dei Compiti: i metodi di apprendimento multi-task promuovono il trasferimento di conoscenze cross-domain attraverso la condivisione di parametri o rappresentazioni, ma a causa dell'incoerenza dei compiti tra i domini, potrebbero non catturare informazioni cross-domain preziose, causando persino trasferimento negativo
  2. Scarsità di Relazioni Causali: i metodi che utilizzano il comportamento del dominio sorgente come caratteristica di input aggiuntiva ignorano la scarsità di relazioni causali tra il dominio sorgente e quello target; le preferenze dell'utente nel dominio target non sono necessariamente influenzate dal comportamento nel dominio sorgente

Motivazione della Ricerca

I metodi esistenti apprendono sia la funzione L→S e L→T (apprendimento multi-task) sia la funzione (L,S)→T (fusione di caratteristiche), ma nessuno modella direttamente le relazioni causali cross-domain. Questo articolo propone di addestrare direttamente le rappresentazioni cross-domain su dataset annotati causalmente, apprendendo la funzione (L,S)→I→T, dove I rappresenta informazioni cross-domain trasferibili di valore.

Sfide e Innovazioni

La sfida principale è identificare etichette causali vere imparziali in scenari reali, il che è estremamente difficile. Questo articolo affronta questo problema costruendo euristicamente un dataset consapevole della causalità e progettando una funzione di perdita teoricamente imparziale.

Contributi Fondamentali

  1. Ricostruzione del Grafo Causale: riformula per la prima volta il compito di raccomandazione cross-domain come grafo causale, fornendo una guida metodologica principiata per la progettazione del metodo
  2. Framework di Miglioramento Causale: propone il framework CE-CDR, che modella direttamente le relazioni causali cross-domain da prospettive di dati e modello
  3. Innovazione Teorica: deriva la perdita causale con etichette parziali (PLCL) teoricamente imparziale, in grado di generalizzare a modelli causali non osservati
  4. Verifica Pratica: come plugin model-agnostic possiede applicabilità universale ed è stato distribuito in ambiente di produzione con effetti significativi

Spiegazione Dettagliata del Metodo

Definizione del Compito

Si consideri uno scenario di raccomandazione cross-domain contenente un dominio sorgente s e un dominio target t, con i due domini che condividono l'insieme di utenti U. Ogni dominio ha il proprio insieme di elementi: Is per il dominio sorgente e It per il dominio target. L'utente u ha sequenze di interazione in entrambi i domini Ss^u e St^u. L'obiettivo è utilizzare la conoscenza del dominio sorgente per migliorare l'accuratezza della raccomandazione nel dominio target.

Architettura del Modello

Il framework CE-CDR contiene tre moduli fondamentali:

1. Modulo di Annotazione Causale (CLM)

Ipotesi Fondamentale: Ipotesi di Allineamento Similarità-Causalità

Per un dato utente, la sua preferenza per un elemento is nel dominio sorgente influenza causalmente la sua preferenza per elementi simili it nel dominio target

Metodo di Implementazione:

  • Utilizza due misure di similarità: similarità di contenuto e similarità comportamentale
  • Gli embedding di contenuto vengono appresi attraverso un compito di classificazione di categoria condiviso cross-domain
  • Gli embedding comportamentali vengono generati da un codificatore grafico dell'interazione globale utente-elemento
  • Formula di calcolo della similarità:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
  • La similarità complessiva viene calcolata prendendo il massimo dopo la calibrazione CDF:
sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. Modulo di Modellazione Causale Diretta (DCMM)

Modello Backbone: Basato su meccanismo di attenzione SASRec

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

Perdita Causale con Etichette Parziali (PLCL): L'innovazione fondamentale risiede nel trattamento del problema dell'annotazione parziale. Poiché l'alta similarità non è una condizione necessaria per la causalità, l'addestramento diretto sul dataset costruito da CLM produrrebbe distorsione.

Proposizione 1: Dato il vero punteggio di propensione e(x), il modello causale f(x) può apprendere stime di probabilità causale teoricamente imparziali attraverso l'ottimizzazione della seguente perdita:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

dove l'etichetta corretta è:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

Proposizione 2: Il modello di propensione e(x) viene ottimizzato attraverso la seguente perdita:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. Modulo di Miglioramento Causale (CEM)

Auto-Attenzione Cross-Domain: Tratta le rappresentazioni del dominio sorgente e target come una sequenza di lunghezza 2

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

Attenzione Gated Cross-Domain: Fusione adattiva basata su caratteristiche dell'utente

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

Punti di Innovazione Tecnica

  1. Prospettiva Causale: Riesamina sistematicamente per la prima volta il problema della raccomandazione cross-domain dal punto di vista dell'inferenza causale
  2. Apprendimento con Etichette Parziali: Introduce innovativamente l'apprendimento con etichette parziali nella modellazione causale, risolvendo il problema della distorsione di annotazione
  3. Garanzie Teoriche: Fornisce una funzione di perdita teoricamente imparziale, garantendo la capacità di generalizzazione del modello
  4. Fusione Adattiva: Meccanismo di gating dinamico che regola il contributo di informazioni cross-domain in base alle caratteristiche dell'utente

Configurazione Sperimentale

Dataset

  1. Douban: Contiene due domini Book e Music, con 1.736 utenti condivisi
  2. Amazon: Domini Movies and TV e CDs and Vinyl, 18.547 utenti condivisi
  3. Industry: Dataset su larga scala da Xiaohongshu, domini Note e Video, 167.766.638 utenti condivisi

Metriche di Valutazione

  • HR@K: Se i primi K elementi raccomandati contengono elementi rilevanti
  • NDCG@K: Guadagno cumulativo scontato normalizzato considerando la posizione di ranking
  • Valori di K: 15 per Douban e Amazon, 150 per Industry

Metodi di Confronto

  • Modello Base: Modello a doppia torre di base
  • Metodi di Apprendimento Multi-Task: CoNet, MAN, DiCUR
  • Metodi di Fusione di Caratteristiche: MiNet, TrineCDR
  • Versioni Migliorate: Ciascun metodo di base + plugin CE

Dettagli di Implementazione

  • Dimensione embedding: 32 per Douban e Amazon, 64 per Industry
  • Soglia di similarità τ: 0,9 per Douban e Amazon, 0,85 per Industry
  • Ottimizzatore: Adam con impostazioni predefinite

Risultati Sperimentali

Risultati Principali

CE-CDR supera i metodi di base su tutti i dataset e le metriche di valutazione:

Prestazioni Dataset Douban:

  • Dominio Book: HR@15 raggiunge 0,5023 (vs miglior baseline 0,4586), NDCG@15 raggiunge 0,3711 (vs 0,3436)
  • Dominio Music: HR@15 raggiunge 0,4983, NDCG@15 raggiunge 0,3600

Prestazioni Dataset Industry:

  • Dominio Note: HR@150 è 0,2733, NDCG@150 è 0,0933
  • Dominio Video: HR@150 è 0,3645, NDCG@150 è 0,0992

Esperimenti di Ablazione

Analisi del contributo di ciascun componente:

  • Modulo CLM: La rimozione porta a un calo significativo delle prestazioni, verificando l'importanza di campioni positivi causali di alta qualità
  • Perdita Causale: L'uso diretto di D+ come insieme causale vero causa un calo delle prestazioni
  • Auto-Attenzione: La rimozione dell'auto-attenzione cross-domain influisce sull'efficacia dello scambio di informazioni
  • Meccanismo Gated: La semplice concatenazione al posto dell'attenzione gated riduce l'efficacia della fusione personalizzata
  • Strategia di Cache: Quasi nessuna perdita di prestazioni ma elimina l'aumento della latenza

Analisi Approfondita

Verifica della Capacità di Generalizzazione: Escludendo un tipo di similarità nella costruzione del dataset, si scopre che DCMM può identificare modelli causali non osservati, provando la capacità di generalizzazione del modello oltre la strategia di annotazione.

Analisi del Contributo di Caratteristiche: Gli esperimenti di mascheramento di caratteristiche mostrano che l'attivazione di caratteristiche cross-domain di CE-CDR ha una varianza molto maggiore rispetto ai metodi di base, provando un utilizzo più efficace di informazioni cross-domain.

Interpretazione del Gating Dinamico: Gli utenti con informazioni ricche nel dominio sorgente hanno valori di gating più elevati, verificando l'efficacia del meccanismo di fusione adattiva.

Esperimenti Online

Test A/B in Ambiente di Produzione (Piattaforma Xiaohongshu):

  • Scenario Video: Click +0,33%, CTR +0,37%, Diversità +0,12%
  • Scenario Note: Click +0,28%, CTR +0,43%, Diversità +0,16%
  • Distribuito online ad aprile 2025

Lavori Correlati

Raccomandazione Cross-Domain

I metodi esistenti si dividono principalmente in due categorie:

  1. Apprendimento Multi-Task: Promuove il trasferimento di conoscenze attraverso la condivisione di parametri o rappresentazioni, ma presenta problemi di incoerenza dei compiti
  2. Fusione di Caratteristiche: Utilizza il comportamento del dominio sorgente come caratteristica di input, ma ignora la scarsità di relazioni causali

Raccomandazione Causale

Affronta principalmente tre classi di problemi:

  1. Distorsione dei Dati: Distorsione di esposizione, distorsione di popolarità, distorsione di conformità
  2. Dati Mancanti: Impossibilità di catturare le preferenze complete dell'utente
  3. Interpretabilità: Miglioramento dell'interpretabilità, diversità e equità della raccomandazione

Questo articolo applica per la prima volta l'inferenza causale alla modellazione diretta di relazioni causali nella raccomandazione cross-domain.

Conclusioni e Discussione

Conclusioni Principali

  1. Efficacia: CE-CDR supera significativamente i metodi esistenti su più dataset
  2. Universalità: Come plugin model-agnostic può migliorare le prestazioni di vari metodi di base
  3. Praticità: Distribuito con successo in ambiente di produzione su larga scala
  4. Teoricità: Fornisce un framework di modellazione causale con garanzie teoriche

Limitazioni

  1. Dipendenza da Ipotesi: L'ipotesi di allineamento similarità-causalità potrebbe non essere applicabile a tutti gli scenari
  2. Qualità di Annotazione: L'annotazione causale euristica potrebbe introdurre rumore
  3. Sovraccarico Computazionale: Richiede addestramento e inferenza aggiuntivi del modello causale

Direzioni Future

  1. Ottimizzazione di Ipotesi: Esplorare metodi più precisi per l'identificazione di relazioni causali
  2. Estensione Multi-Dominio: Estendere a modellazione causale con più domini sorgente
  3. Causalità Dinamica: Considerare l'evoluzione di relazioni causali nel tempo

Valutazione Approfondita

Punti di Forza

  1. Forte Innovatività: Introduce sistematicamente per la prima volta l'inferenza causale nella raccomandazione cross-domain
  2. Solida Base Teorica: Fornisce derivazioni matematiche rigorose e garanzie teoriche
  3. Esperimenti Completi: Verifica su più dataset, esperimenti di ablazione, test A/B online completi
  4. Alto Valore Pratico: Distribuito in ambiente di produzione con effetti significativi
  5. Applicabilità Universale: La progettazione di plugin model-agnostic aumenta l'applicabilità

Insufficienze

  1. Limitazioni di Ipotesi: L'ipotesi di allineamento similarità-causalità potrebbe semplificare eccessivamente le relazioni causali reali
  2. Distorsione di Annotazione: Il metodo di annotazione causale euristico potrebbe ancora introdurre distorsioni sistematiche
  3. Aumento di Complessità: L'introduzione di moduli aggiuntivi aumenta la complessità del sistema
  4. Specificità di Dominio: Alcuni design potrebbero essere specializzati per piattaforme di contenuto, con generalizzabilità da verificare

Impatto

  1. Contributo Accademico: Fornisce un nuovo paradigma di modellazione causale per il campo della raccomandazione cross-domain
  2. Valore Pratico: La distribuzione di successo in ambiente di produzione dimostra il valore commerciale
  3. Ispirazione di Ricerca: Potrebbe ispirare più applicazioni di inferenza causale nei sistemi di raccomandazione

Scenari Applicabili

  1. Piattaforme Multi-Dominio: Scenari come piattaforme di condivisione di contenuti, piattaforme di e-commerce e altri con più domini di business
  2. Problemi di Cold Start: Scenari di raccomandazione per nuovi utenti o nuovi elementi
  3. Raccomandazione Cross-Piattaforma: Scenari che richiedono trasferimento di comportamento utente tra piattaforme

Riferimenti Bibliografici

L'articolo cita 76 lavori correlati, coprendo molteplici aree come raccomandazione cross-domain, inferenza causale e meccanismi di attenzione, fornendo una solida base teorica per la progettazione del metodo.


Valutazione Complessiva: Questo è un articolo di importante significato innovativo nel campo della raccomandazione cross-domain, che introduce sistematicamente l'inferenza causale in questo ambito, proponendo una soluzione teoricamente garantita ed efficace nella pratica. I contributi teorici, la verifica sperimentale e la distribuzione pratica dell'articolo riflettono un elevato valore accademico e pratico.