2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.

Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.

academic

Kausalitätsverstärkung für domänenübergreifende Empfehlungen

Grundlegende Informationen

Paper-ID: 2510.14641
Titel: Causality Enhancement for Cross-Domain Recommendation
Autoren: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
Klassifizierung: cs.IR cs.AI
Veröffentlichungskonferenz: Konferenzakronym 'XX (basierend auf PDF-Inhalt, scheint eine Konferenzvorlage zu sein)
Paper-Link: https://arxiv.org/abs/2510.14641

Zusammenfassung

Die domänenübergreifende Empfehlung ist ein wichtiger Bestandteil von Empfehlungssystemen und verbessert die Zieldomänen-Empfehlungen durch Hilfsinformationen aus Quelldomänen-Aufgaben oder -Merkmalen. Allerdings können inkonsistente Quelldomänen-Aufgaben zu unzureichender domänenübergreifender Modellierung oder negativem Transfer führen, während die Einführung von Quelldomänen-Merkmalen ohne Berücksichtigung potenzieller Kausalbeziehungen deren Beitrag zur endgültigen Vorhersage einschränken kann. Dieses Paper präsentiert ein Kausalitätsverstärkungs-Framework CE-CDR, das zunächst die domänenübergreifende Empfehlung als Kausaldiagramm reformuliert, dann heuristisch einen kausalitätsbewussten Datensatz konstruiert und eine theoretisch unverzerrte Partial-Label-Kausalverlustfunktion ableitet, um auf ungesehene domänenübergreifende Muster zu verallgemeinern. Die Methode wurde in einer Produktionsumgebung eingesetzt und zeigt ihren praktischen Anwendungswert.

Forschungshintergrund und Motivation

Kernprobleme

Traditionelle domänenübergreifende Empfehlungssysteme stehen zwei Hauptherausforderungen gegenüber:

Aufgabeninkonsistenz: Multi-Task-Learning-Methoden fördern den Wissenstransfer zwischen Domänen durch gemeinsame Parameter oder Darstellungen, können aber aufgrund von Aufgabeninkonsistenzen zwischen Domänen möglicherweise keine wertvollen domänenübergreifenden Informationen erfassen und können sogar negativen Transfer verursachen
Kausalitätsspärlichkeit: Methoden, die Quelldomänen-Verhalten als zusätzliche Eingabemerkmale verwenden, ignorieren die Kausalitätsspärlichkeit zwischen Quell- und Zieldomäne. Die Vorlieben eines Benutzers in der Zieldomäne werden nicht unbedingt durch das Verhalten in der Quelldomäne beeinflusst

Forschungsmotivation

Bestehende Methoden lernen entweder Funktionen L→S und L→T (Multi-Task-Learning) oder Funktionen (L,S)→T (Merkmalsfusion), aber keine modelliert direkt domänenübergreifende Kausalbeziehungen. Dieses Paper schlägt vor, domänenübergreifende Darstellungen direkt auf kausal annotierten Datensätzen zu trainieren und die Funktion (L,S)→I→T zu lernen, wobei I wertvolle domänenübergreifend übertragbare Informationen darstellt.

Herausforderungen und Innovationen

Die Hauptherausforderung besteht darin, unverzerrte echte Kausaletiketten in realen Szenarien zu identifizieren, was äußerst schwierig ist. Dieses Paper löst dieses Problem durch heuristische Konstruktion eines kausalitätsbewussten Datensatzes und Entwurf einer theoretisch unverzerrten Verlustfunktion.

Kernbeiträge

Kausaldiagramm-Rekonstruktion: Erste Reformulierung der domänenübergreifenden Empfehlungsaufgabe als Kausaldiagramm, das prinzipiengesteuerte Anleitung für Methodendesign bietet
Kausalitätsverstärkungs-Framework: Präsentation des CE-CDR-Frameworks, das domänenübergreifende Kausalbeziehungen direkt aus Daten- und Modellperspektive modelliert
Theoretische Innovation: Ableitung einer theoretisch unverzerrten Partial-Label-Kausalverlustfunktion (PLCL), die auf ungesehene Kausalitätsmuster verallgemeinern kann
Praktische Validierung: Als modellunabhängiges Plugin mit universeller Anwendbarkeit, bereits in der Produktionsumgebung eingesetzt mit signifikanten Ergebnissen

Methodische Details

Aufgabendefinition

Betrachten Sie ein domänenübergreifendes Empfehlungsszenario mit Quelldomäne s und Zieldomäne t, wobei beide Domänen eine gemeinsame Benutzermenge U teilen. Jede Domäne hat ihre eigene Itemsammlung: Quelldomäne Is und Zieldomäne It. Benutzer u haben Interaktionssequenzen Ss^u und St^u in beiden Domänen. Das Ziel ist, Quelldomänenwissen zu nutzen, um die Empfehlungsgenauigkeit der Zieldomäne zu verbessern.

Modellarchitektur

Das CE-CDR-Framework enthält drei Kernmodule:

1. Kausalitäts-Annotationsmodul (CLM)

Kernhypothese: Ähnlichkeits-Kausalitäts-Ausrichtungshypothese

Für einen bestimmten Benutzer beeinflusst seine Vorliebe für ein Item is in der Quelldomäne kausal seine Vorliebe für ähnliche Items it in der Zieldomäne

Implementierungsmethode:

Verwendung von zwei Ähnlichkeitsmessungen: Inhaltsähnlichkeit und Verhaltensähnlichkeit
Inhalts-Embeddings werden durch domänenübergreifende gemeinsame Kategorienklassifizierungsaufgaben gelernt
Verhaltens-Embeddings werden durch Graph-Encoder des globalen Benutzer-Item-Interaktionsgraphen generiert
Ähnlichkeitsberechnungsformel:

sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}

Gesamtähnlichkeit durch CDF-Kalibrierung und Maximumwertbildung:

sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. Direktes Kausalitäts-Modellierungsmodul (DCMM)

Backbone-Modell: Basierend auf SASRec mit Aufmerksamkeitsmechanismus

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

Partial-Label-Kausalverlust (PLCL): Die Kerninnnovation liegt in der Behandlung des Partial-Label-Problems. Da hohe Ähnlichkeit keine notwendige Bedingung für Kausalität ist, führt direktes Training auf dem vom CLM konstruierten Datensatz zu Verzerrungen.

Proposition 1: Gegeben ein echtes Propensity-Score e(x) kann das Kausalitätsmodell f(x) durch folgende Verlustoptimierung theoretisch unverzerrte Kausalitätswahrscheinlichkeitsschätzungen lernen:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

mit korrigiertem Label:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

Proposition 2: Das Propensity-Modell e(x) wird durch folgende Verlustoptimierung trainiert:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. Kausalitätsverstärkungs-Modul (CEM)

Domänenübergreifende Selbstaufmerksamkeit: Behandlung von Quell- und Zieldomänen-Darstellungen als Sequenz der Länge 2

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

Domänenübergreifende Gate-Aufmerksamkeit: Adaptive Fusion basierend auf Benutzermerkmalen

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

Technische Innovationspunkte

Kausalitätsperspektive: Erste systematische Überprüfung des domänenübergreifenden Empfehlungsproblems aus der Perspektive der Kausalinferenz
Partial-Label-Lernen: Innovative Einführung von Partial-Label-Lernen in die Kausalitätsmodellierung zur Lösung des Annotationsverzerrungsproblems
Theoretische Garantie: Bereitstellung theoretisch unverzerrter Verlustfunktionen zur Gewährleistung der Modellverallgemeinerungsfähigkeit
Adaptive Fusion: Dynamischer Gate-Mechanismus, der die Beitrag domänenübergreifender Informationen basierend auf Benutzermerkmalen reguliert

Experimentelle Einrichtung

Datensätze

Douban: Enthält Book- und Music-Domänen mit insgesamt 1.736 gemeinsamen Benutzern
Amazon: Movies and TV sowie CDs and Vinyl-Domänen mit 18.547 gemeinsamen Benutzern
Industry: Großflächiger Datensatz von Xiaohongshu, Note- und Video-Domänen mit 167.766.638 gemeinsamen Benutzern

Bewertungsmetriken

HR@K: Ob die Top-K-Empfehlungen relevante Items enthalten
NDCG@K: Kumulativer Gewinn unter Berücksichtigung der Rangposition
K-Werte: 15 für Douban und Amazon, 150 für Industry

Vergleichsmethoden

Base Model: Grundlegendes Dual-Tower-Modell
Multi-Task-Learning-Methoden: CoNet, MAN, DiCUR
Merkmalsfusions-Methoden: MiNet, TrineCDR
Erweiterte Versionen: Verschiedene Baseline-Methoden + CE-Plugin

Implementierungsdetails

Embedding-Dimension: 32 für Douban und Amazon, 64 für Industry
Ähnlichkeitsschwelle τ: 0,9 für Douban und Amazon, 0,85 für Industry
Optimierer: Adam mit Standardeinstellungen

Experimentelle Ergebnisse

Hauptergebnisse

CE-CDR übertrifft Baseline-Methoden bei allen Datensätzen und Bewertungsmetriken:

Douban-Datensatz-Leistung:

Book-Domäne: HR@15 verbessert sich auf 0,5023 (vs. beste Baseline 0,4586), NDCG@15 verbessert sich auf 0,3711 (vs. 0,3436)
Music-Domäne: HR@15 erreicht 0,4983, NDCG@15 erreicht 0,3600

Industry-Datensatz-Leistung:

Note-Domäne: HR@150 beträgt 0,2733, NDCG@150 beträgt 0,0933
Video-Domäne: HR@150 beträgt 0,3645, NDCG@150 beträgt 0,0992

Ablationsstudien

Beitragsanalyse der einzelnen Komponenten:

CLM-Modul: Entfernung führt zu signifikantem Leistungsabfall und validiert die Wichtigkeit hochqualitativer positiver Kausalitätsmuster
Kausalverlust: Direkte Verwendung von D+ als echte Kausalitätsmenge führt zu Leistungsabfall
Selbstaufmerksamkeit: Entfernung der domänenübergreifenden Selbstaufmerksamkeit beeinträchtigt den Informationsaustausch
Gate-Mechanismus: Einfache Verkettung statt Gate-Aufmerksamkeit reduziert die Effektivität der personalisierten Fusion
Caching-Strategie: Nahezu kein Leistungsverlust, eliminiert aber die Latenzerhöhung

Tiefenanalyse

Validierung der Verallgemeinerungsfähigkeit: Durch Ausschluss einer Ähnlichkeitskonstruktionsmethode beim Datensatzkonstruktion zeigt sich, dass DCMM ungesehene Kausalitätsmuster identifizieren kann, was die Verallgemeinerungsfähigkeit des Modells über die Annotationsstrategie hinaus beweist.

Merkmalsbeitragsanalyse: Merkmals-Masking-Experimente zeigen, dass die Aktivierungsdifferenzen domänenübergreifender Merkmale in CE-CDR deutlich größer sind als in Baseline-Methoden, was eine effektivere Nutzung domänenübergreifender Informationen beweist.

Dynamische Gate-Erklärung: Benutzer mit reichhaltigen Quelldomänen-Informationen haben höhere Gate-Werte, was die Effektivität des adaptiven Fusionsmechanismus validiert.

Online-Experimente

A/B-Test in der Produktionsumgebung (Xiaohongshu-Plattform):

Video-Szenario: Klicks +0,33%, CTR +0,37%, Vielfalt +0,12%
Note-Szenario: Klicks +0,28%, CTR +0,43%, Vielfalt +0,16%
Bereits im April 2025 in Produktion gegangen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Effektivität: CE-CDR zeigt signifikante Verbesserungen gegenüber bestehenden Methoden auf mehreren Datensätzen
Universalität: Als modellunabhängiges Plugin kann es die Leistung verschiedener Baseline-Methoden verbessern
Praktikabilität: Erfolgreich in großflächiger Produktionsumgebung eingesetzt
Theoretische Fundierung: Bietet theoretisch garantiertes Kausalitätsmodellierungs-Framework

Einschränkungen

Hypothesenabhängigkeit: Die Ähnlichkeits-Kausalitäts-Ausrichtungshypothese ist möglicherweise nicht auf alle Szenarien anwendbar
Annotationsqualität: Heuristische Kausalitäts-Annotation kann Rauschen einführen
Rechenkomplexität: Erfordert zusätzliches Kausalitätsmodell-Training und -Inferenz

Zukünftige Richtungen

Hypothesenoptimierung: Erforschung präziserer Kausalitäts-Identifizierungsmethoden
Multi-Domain-Erweiterung: Erweiterung auf Kausalitätsmodellierung mit mehreren Quelldomänen
Dynamische Kausalität: Berücksichtigung zeitlicher Dynamik der Kausalitätsentwicklung

Tiefenanalyse

Stärken

Hohe Innovativität: Erste systematische Einführung von Kausalinferenz in die domänenübergreifende Empfehlung
Solide Theorie: Strenge mathematische Herleitung und theoretische Garantien
Umfassende Experimente: Validierung über mehrere Datensätze, Ablationsstudien, Online-A/B-Tests
Hoher praktischer Wert: Erfolgreich in der Produktionsumgebung eingesetzt mit signifikanten Ergebnissen
Universelle Anwendbarkeit: Modellunabhängiges Plugin-Design erhöht die Anwendbarkeit

Schwächen

Hypothesenlimitierungen: Die Ähnlichkeits-Kausalitäts-Ausrichtungshypothese könnte echte Kausalbeziehungen zu stark vereinfachen
Annotationsverzerrung: Heuristische Kausalitäts-Annotationsmethode kann immer noch systematische Verzerrungen einführen
Erhöhte Komplexität: Einführung zusätzlicher Module erhöht die Systemkomplexität
Domänenspezifität: Einige Designs könnten für Content-Plattformen spezialisiert sein, Verallgemeinerbarkeit bedarf weiterer Validierung

Auswirkungen

Akademischer Beitrag: Bietet ein neues Kausalitätsmodellierungs-Paradigma für die domänenübergreifende Empfehlungsforschung
Praktischer Wert: Erfolgreiche Produktionseinführung beweist kommerziellen Wert
Forschungsinspiration: Könnte mehr Anwendungen von Kausalinferenz in Empfehlungssystemen inspirieren

Anwendungsszenarien

Multi-Domain-Plattformen: Wie Content-Sharing-Plattformen, E-Commerce-Plattformen und andere Szenarien mit mehreren Geschäftsbereichen
Cold-Start-Probleme: Empfehlungsszenarien für neue Benutzer oder neue Items
Plattformübergreifende Empfehlungen: Szenarien, die Benutzerverhaltensmigration über Plattformen hinweg erfordern

Literaturverzeichnis

Das Paper zitiert 76 verwandte Arbeiten, die domänenübergreifende Empfehlungen, Kausalinferenz, Aufmerksamkeitsmechanismen und andere Bereiche abdecken und eine solide theoretische Grundlage für das Methodendesign bieten.

Gesamtbewertung: Dies ist ein Paper mit bedeutender Innovationskraft im Bereich der domänenübergreifenden Empfehlung, das Kausalinferenz systematisch in dieses Feld einführt und eine theoretisch garantierte sowie praktisch wirksame Lösung bietet. Die theoretischen Beiträge, experimentellen Validierungen und praktischen Implementierungen des Papers zeigen hohen akademischen und praktischen Wert.

Causality Enhancement for Cross-Domain Recommendation

Kausalitätsverstärkung für domänenübergreifende Empfehlungen

Grundlegende Informationen

Zusammenfassung

Forschungshintergrund und Motivation

Kernprobleme

Forschungsmotivation

Herausforderungen und Innovationen

Kernbeiträge

Methodische Details

Aufgabendefinition

Modellarchitektur

1. Kausalitäts-Annotationsmodul (CLM)

2. Direktes Kausalitäts-Modellierungsmodul (DCMM)

3. Kausalitätsverstärkungs-Modul (CEM)

Technische Innovationspunkte

Experimentelle Einrichtung

Datensätze

Bewertungsmetriken

Vergleichsmethoden

Implementierungsdetails

Experimentelle Ergebnisse

Hauptergebnisse

Ablationsstudien

Tiefenanalyse

Online-Experimente

Verwandte Arbeiten

Domänenübergreifende Empfehlung

Kausale Empfehlung

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Einschränkungen

Zukünftige Richtungen

Tiefenanalyse

Stärken

Schwächen

Auswirkungen

Anwendungsszenarien

Literaturverzeichnis