2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic

Kausalitätsverstärkung für domänenübergreifende Empfehlungen

Grundlegende Informationen

  • Paper-ID: 2510.14641
  • Titel: Causality Enhancement for Cross-Domain Recommendation
  • Autoren: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
  • Klassifizierung: cs.IR cs.AI
  • Veröffentlichungskonferenz: Konferenzakronym 'XX (basierend auf PDF-Inhalt, scheint eine Konferenzvorlage zu sein)
  • Paper-Link: https://arxiv.org/abs/2510.14641

Zusammenfassung

Die domänenübergreifende Empfehlung ist ein wichtiger Bestandteil von Empfehlungssystemen und verbessert die Zieldomänen-Empfehlungen durch Hilfsinformationen aus Quelldomänen-Aufgaben oder -Merkmalen. Allerdings können inkonsistente Quelldomänen-Aufgaben zu unzureichender domänenübergreifender Modellierung oder negativem Transfer führen, während die Einführung von Quelldomänen-Merkmalen ohne Berücksichtigung potenzieller Kausalbeziehungen deren Beitrag zur endgültigen Vorhersage einschränken kann. Dieses Paper präsentiert ein Kausalitätsverstärkungs-Framework CE-CDR, das zunächst die domänenübergreifende Empfehlung als Kausaldiagramm reformuliert, dann heuristisch einen kausalitätsbewussten Datensatz konstruiert und eine theoretisch unverzerrte Partial-Label-Kausalverlustfunktion ableitet, um auf ungesehene domänenübergreifende Muster zu verallgemeinern. Die Methode wurde in einer Produktionsumgebung eingesetzt und zeigt ihren praktischen Anwendungswert.

Forschungshintergrund und Motivation

Kernprobleme

Traditionelle domänenübergreifende Empfehlungssysteme stehen zwei Hauptherausforderungen gegenüber:

  1. Aufgabeninkonsistenz: Multi-Task-Learning-Methoden fördern den Wissenstransfer zwischen Domänen durch gemeinsame Parameter oder Darstellungen, können aber aufgrund von Aufgabeninkonsistenzen zwischen Domänen möglicherweise keine wertvollen domänenübergreifenden Informationen erfassen und können sogar negativen Transfer verursachen
  2. Kausalitätsspärlichkeit: Methoden, die Quelldomänen-Verhalten als zusätzliche Eingabemerkmale verwenden, ignorieren die Kausalitätsspärlichkeit zwischen Quell- und Zieldomäne. Die Vorlieben eines Benutzers in der Zieldomäne werden nicht unbedingt durch das Verhalten in der Quelldomäne beeinflusst

Forschungsmotivation

Bestehende Methoden lernen entweder Funktionen L→S und L→T (Multi-Task-Learning) oder Funktionen (L,S)→T (Merkmalsfusion), aber keine modelliert direkt domänenübergreifende Kausalbeziehungen. Dieses Paper schlägt vor, domänenübergreifende Darstellungen direkt auf kausal annotierten Datensätzen zu trainieren und die Funktion (L,S)→I→T zu lernen, wobei I wertvolle domänenübergreifend übertragbare Informationen darstellt.

Herausforderungen und Innovationen

Die Hauptherausforderung besteht darin, unverzerrte echte Kausaletiketten in realen Szenarien zu identifizieren, was äußerst schwierig ist. Dieses Paper löst dieses Problem durch heuristische Konstruktion eines kausalitätsbewussten Datensatzes und Entwurf einer theoretisch unverzerrten Verlustfunktion.

Kernbeiträge

  1. Kausaldiagramm-Rekonstruktion: Erste Reformulierung der domänenübergreifenden Empfehlungsaufgabe als Kausaldiagramm, das prinzipiengesteuerte Anleitung für Methodendesign bietet
  2. Kausalitätsverstärkungs-Framework: Präsentation des CE-CDR-Frameworks, das domänenübergreifende Kausalbeziehungen direkt aus Daten- und Modellperspektive modelliert
  3. Theoretische Innovation: Ableitung einer theoretisch unverzerrten Partial-Label-Kausalverlustfunktion (PLCL), die auf ungesehene Kausalitätsmuster verallgemeinern kann
  4. Praktische Validierung: Als modellunabhängiges Plugin mit universeller Anwendbarkeit, bereits in der Produktionsumgebung eingesetzt mit signifikanten Ergebnissen

Methodische Details

Aufgabendefinition

Betrachten Sie ein domänenübergreifendes Empfehlungsszenario mit Quelldomäne s und Zieldomäne t, wobei beide Domänen eine gemeinsame Benutzermenge U teilen. Jede Domäne hat ihre eigene Itemsammlung: Quelldomäne Is und Zieldomäne It. Benutzer u haben Interaktionssequenzen Ss^u und St^u in beiden Domänen. Das Ziel ist, Quelldomänenwissen zu nutzen, um die Empfehlungsgenauigkeit der Zieldomäne zu verbessern.

Modellarchitektur

Das CE-CDR-Framework enthält drei Kernmodule:

1. Kausalitäts-Annotationsmodul (CLM)

Kernhypothese: Ähnlichkeits-Kausalitäts-Ausrichtungshypothese

Für einen bestimmten Benutzer beeinflusst seine Vorliebe für ein Item is in der Quelldomäne kausal seine Vorliebe für ähnliche Items it in der Zieldomäne

Implementierungsmethode:

  • Verwendung von zwei Ähnlichkeitsmessungen: Inhaltsähnlichkeit und Verhaltensähnlichkeit
  • Inhalts-Embeddings werden durch domänenübergreifende gemeinsame Kategorienklassifizierungsaufgaben gelernt
  • Verhaltens-Embeddings werden durch Graph-Encoder des globalen Benutzer-Item-Interaktionsgraphen generiert
  • Ähnlichkeitsberechnungsformel:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
  • Gesamtähnlichkeit durch CDF-Kalibrierung und Maximumwertbildung:
sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. Direktes Kausalitäts-Modellierungsmodul (DCMM)

Backbone-Modell: Basierend auf SASRec mit Aufmerksamkeitsmechanismus

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

Partial-Label-Kausalverlust (PLCL): Die Kerninnnovation liegt in der Behandlung des Partial-Label-Problems. Da hohe Ähnlichkeit keine notwendige Bedingung für Kausalität ist, führt direktes Training auf dem vom CLM konstruierten Datensatz zu Verzerrungen.

Proposition 1: Gegeben ein echtes Propensity-Score e(x) kann das Kausalitätsmodell f(x) durch folgende Verlustoptimierung theoretisch unverzerrte Kausalitätswahrscheinlichkeitsschätzungen lernen:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

mit korrigiertem Label:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

Proposition 2: Das Propensity-Modell e(x) wird durch folgende Verlustoptimierung trainiert:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. Kausalitätsverstärkungs-Modul (CEM)

Domänenübergreifende Selbstaufmerksamkeit: Behandlung von Quell- und Zieldomänen-Darstellungen als Sequenz der Länge 2

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

Domänenübergreifende Gate-Aufmerksamkeit: Adaptive Fusion basierend auf Benutzermerkmalen

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

Technische Innovationspunkte

  1. Kausalitätsperspektive: Erste systematische Überprüfung des domänenübergreifenden Empfehlungsproblems aus der Perspektive der Kausalinferenz
  2. Partial-Label-Lernen: Innovative Einführung von Partial-Label-Lernen in die Kausalitätsmodellierung zur Lösung des Annotationsverzerrungsproblems
  3. Theoretische Garantie: Bereitstellung theoretisch unverzerrter Verlustfunktionen zur Gewährleistung der Modellverallgemeinerungsfähigkeit
  4. Adaptive Fusion: Dynamischer Gate-Mechanismus, der die Beitrag domänenübergreifender Informationen basierend auf Benutzermerkmalen reguliert

Experimentelle Einrichtung

Datensätze

  1. Douban: Enthält Book- und Music-Domänen mit insgesamt 1.736 gemeinsamen Benutzern
  2. Amazon: Movies and TV sowie CDs and Vinyl-Domänen mit 18.547 gemeinsamen Benutzern
  3. Industry: Großflächiger Datensatz von Xiaohongshu, Note- und Video-Domänen mit 167.766.638 gemeinsamen Benutzern

Bewertungsmetriken

  • HR@K: Ob die Top-K-Empfehlungen relevante Items enthalten
  • NDCG@K: Kumulativer Gewinn unter Berücksichtigung der Rangposition
  • K-Werte: 15 für Douban und Amazon, 150 für Industry

Vergleichsmethoden

  • Base Model: Grundlegendes Dual-Tower-Modell
  • Multi-Task-Learning-Methoden: CoNet, MAN, DiCUR
  • Merkmalsfusions-Methoden: MiNet, TrineCDR
  • Erweiterte Versionen: Verschiedene Baseline-Methoden + CE-Plugin

Implementierungsdetails

  • Embedding-Dimension: 32 für Douban und Amazon, 64 für Industry
  • Ähnlichkeitsschwelle τ: 0,9 für Douban und Amazon, 0,85 für Industry
  • Optimierer: Adam mit Standardeinstellungen

Experimentelle Ergebnisse

Hauptergebnisse

CE-CDR übertrifft Baseline-Methoden bei allen Datensätzen und Bewertungsmetriken:

Douban-Datensatz-Leistung:

  • Book-Domäne: HR@15 verbessert sich auf 0,5023 (vs. beste Baseline 0,4586), NDCG@15 verbessert sich auf 0,3711 (vs. 0,3436)
  • Music-Domäne: HR@15 erreicht 0,4983, NDCG@15 erreicht 0,3600

Industry-Datensatz-Leistung:

  • Note-Domäne: HR@150 beträgt 0,2733, NDCG@150 beträgt 0,0933
  • Video-Domäne: HR@150 beträgt 0,3645, NDCG@150 beträgt 0,0992

Ablationsstudien

Beitragsanalyse der einzelnen Komponenten:

  • CLM-Modul: Entfernung führt zu signifikantem Leistungsabfall und validiert die Wichtigkeit hochqualitativer positiver Kausalitätsmuster
  • Kausalverlust: Direkte Verwendung von D+ als echte Kausalitätsmenge führt zu Leistungsabfall
  • Selbstaufmerksamkeit: Entfernung der domänenübergreifenden Selbstaufmerksamkeit beeinträchtigt den Informationsaustausch
  • Gate-Mechanismus: Einfache Verkettung statt Gate-Aufmerksamkeit reduziert die Effektivität der personalisierten Fusion
  • Caching-Strategie: Nahezu kein Leistungsverlust, eliminiert aber die Latenzerhöhung

Tiefenanalyse

Validierung der Verallgemeinerungsfähigkeit: Durch Ausschluss einer Ähnlichkeitskonstruktionsmethode beim Datensatzkonstruktion zeigt sich, dass DCMM ungesehene Kausalitätsmuster identifizieren kann, was die Verallgemeinerungsfähigkeit des Modells über die Annotationsstrategie hinaus beweist.

Merkmalsbeitragsanalyse: Merkmals-Masking-Experimente zeigen, dass die Aktivierungsdifferenzen domänenübergreifender Merkmale in CE-CDR deutlich größer sind als in Baseline-Methoden, was eine effektivere Nutzung domänenübergreifender Informationen beweist.

Dynamische Gate-Erklärung: Benutzer mit reichhaltigen Quelldomänen-Informationen haben höhere Gate-Werte, was die Effektivität des adaptiven Fusionsmechanismus validiert.

Online-Experimente

A/B-Test in der Produktionsumgebung (Xiaohongshu-Plattform):

  • Video-Szenario: Klicks +0,33%, CTR +0,37%, Vielfalt +0,12%
  • Note-Szenario: Klicks +0,28%, CTR +0,43%, Vielfalt +0,16%
  • Bereits im April 2025 in Produktion gegangen

Verwandte Arbeiten

Domänenübergreifende Empfehlung

Bestehende Methoden lassen sich hauptsächlich in zwei Kategorien einteilen:

  1. Multi-Task-Learning: Förderung des Wissenstransfers durch gemeinsame Parameter oder Darstellungen, aber mit Aufgabeninkonsistenzproblemen
  2. Merkmalsfusion: Verwendung von Quelldomänen-Verhalten als Eingabemerkmale, aber Ignorieren der Kausalitätsspärlichkeit

Kausale Empfehlung

Hauptsächlich zur Lösung von drei Problemklassen:

  1. Datensatzverzerrung: Expositionsverzerrung, Popularitätsverzerrung, Konformitätsverzerrung
  2. Fehlende Daten: Unfähigkeit, umfassende Benutzerpräferenzen zu erfassen
  3. Interpretierbarkeit: Verbesserung der Empfehlungsinterpretierbarkeit, Vielfalt und Fairness

Dieses Paper wendet Kausalinferenz erstmals auf die direkte Kausalitätsmodellierung in der domänenübergreifenden Empfehlung an.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Effektivität: CE-CDR zeigt signifikante Verbesserungen gegenüber bestehenden Methoden auf mehreren Datensätzen
  2. Universalität: Als modellunabhängiges Plugin kann es die Leistung verschiedener Baseline-Methoden verbessern
  3. Praktikabilität: Erfolgreich in großflächiger Produktionsumgebung eingesetzt
  4. Theoretische Fundierung: Bietet theoretisch garantiertes Kausalitätsmodellierungs-Framework

Einschränkungen

  1. Hypothesenabhängigkeit: Die Ähnlichkeits-Kausalitäts-Ausrichtungshypothese ist möglicherweise nicht auf alle Szenarien anwendbar
  2. Annotationsqualität: Heuristische Kausalitäts-Annotation kann Rauschen einführen
  3. Rechenkomplexität: Erfordert zusätzliches Kausalitätsmodell-Training und -Inferenz

Zukünftige Richtungen

  1. Hypothesenoptimierung: Erforschung präziserer Kausalitäts-Identifizierungsmethoden
  2. Multi-Domain-Erweiterung: Erweiterung auf Kausalitätsmodellierung mit mehreren Quelldomänen
  3. Dynamische Kausalität: Berücksichtigung zeitlicher Dynamik der Kausalitätsentwicklung

Tiefenanalyse

Stärken

  1. Hohe Innovativität: Erste systematische Einführung von Kausalinferenz in die domänenübergreifende Empfehlung
  2. Solide Theorie: Strenge mathematische Herleitung und theoretische Garantien
  3. Umfassende Experimente: Validierung über mehrere Datensätze, Ablationsstudien, Online-A/B-Tests
  4. Hoher praktischer Wert: Erfolgreich in der Produktionsumgebung eingesetzt mit signifikanten Ergebnissen
  5. Universelle Anwendbarkeit: Modellunabhängiges Plugin-Design erhöht die Anwendbarkeit

Schwächen

  1. Hypothesenlimitierungen: Die Ähnlichkeits-Kausalitäts-Ausrichtungshypothese könnte echte Kausalbeziehungen zu stark vereinfachen
  2. Annotationsverzerrung: Heuristische Kausalitäts-Annotationsmethode kann immer noch systematische Verzerrungen einführen
  3. Erhöhte Komplexität: Einführung zusätzlicher Module erhöht die Systemkomplexität
  4. Domänenspezifität: Einige Designs könnten für Content-Plattformen spezialisiert sein, Verallgemeinerbarkeit bedarf weiterer Validierung

Auswirkungen

  1. Akademischer Beitrag: Bietet ein neues Kausalitätsmodellierungs-Paradigma für die domänenübergreifende Empfehlungsforschung
  2. Praktischer Wert: Erfolgreiche Produktionseinführung beweist kommerziellen Wert
  3. Forschungsinspiration: Könnte mehr Anwendungen von Kausalinferenz in Empfehlungssystemen inspirieren

Anwendungsszenarien

  1. Multi-Domain-Plattformen: Wie Content-Sharing-Plattformen, E-Commerce-Plattformen und andere Szenarien mit mehreren Geschäftsbereichen
  2. Cold-Start-Probleme: Empfehlungsszenarien für neue Benutzer oder neue Items
  3. Plattformübergreifende Empfehlungen: Szenarien, die Benutzerverhaltensmigration über Plattformen hinweg erfordern

Literaturverzeichnis

Das Paper zitiert 76 verwandte Arbeiten, die domänenübergreifende Empfehlungen, Kausalinferenz, Aufmerksamkeitsmechanismen und andere Bereiche abdecken und eine solide theoretische Grundlage für das Methodendesign bieten.


Gesamtbewertung: Dies ist ein Paper mit bedeutender Innovationskraft im Bereich der domänenübergreifenden Empfehlung, das Kausalinferenz systematisch in dieses Feld einführt und eine theoretisch garantierte sowie praktisch wirksame Lösung bietet. Die theoretischen Beiträge, experimentellen Validierungen und praktischen Implementierungen des Papers zeigen hohen akademischen und praktischen Wert.