Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic
Kausalitätsverstärkung für domänenübergreifende Empfehlungen
Die domänenübergreifende Empfehlung ist ein wichtiger Bestandteil von Empfehlungssystemen und verbessert die Zieldomänen-Empfehlungen durch Hilfsinformationen aus Quelldomänen-Aufgaben oder -Merkmalen. Allerdings können inkonsistente Quelldomänen-Aufgaben zu unzureichender domänenübergreifender Modellierung oder negativem Transfer führen, während die Einführung von Quelldomänen-Merkmalen ohne Berücksichtigung potenzieller Kausalbeziehungen deren Beitrag zur endgültigen Vorhersage einschränken kann. Dieses Paper präsentiert ein Kausalitätsverstärkungs-Framework CE-CDR, das zunächst die domänenübergreifende Empfehlung als Kausaldiagramm reformuliert, dann heuristisch einen kausalitätsbewussten Datensatz konstruiert und eine theoretisch unverzerrte Partial-Label-Kausalverlustfunktion ableitet, um auf ungesehene domänenübergreifende Muster zu verallgemeinern. Die Methode wurde in einer Produktionsumgebung eingesetzt und zeigt ihren praktischen Anwendungswert.
Traditionelle domänenübergreifende Empfehlungssysteme stehen zwei Hauptherausforderungen gegenüber:
Aufgabeninkonsistenz: Multi-Task-Learning-Methoden fördern den Wissenstransfer zwischen Domänen durch gemeinsame Parameter oder Darstellungen, können aber aufgrund von Aufgabeninkonsistenzen zwischen Domänen möglicherweise keine wertvollen domänenübergreifenden Informationen erfassen und können sogar negativen Transfer verursachen
Kausalitätsspärlichkeit: Methoden, die Quelldomänen-Verhalten als zusätzliche Eingabemerkmale verwenden, ignorieren die Kausalitätsspärlichkeit zwischen Quell- und Zieldomäne. Die Vorlieben eines Benutzers in der Zieldomäne werden nicht unbedingt durch das Verhalten in der Quelldomäne beeinflusst
Bestehende Methoden lernen entweder Funktionen L→S und L→T (Multi-Task-Learning) oder Funktionen (L,S)→T (Merkmalsfusion), aber keine modelliert direkt domänenübergreifende Kausalbeziehungen. Dieses Paper schlägt vor, domänenübergreifende Darstellungen direkt auf kausal annotierten Datensätzen zu trainieren und die Funktion (L,S)→I→T zu lernen, wobei I wertvolle domänenübergreifend übertragbare Informationen darstellt.
Die Hauptherausforderung besteht darin, unverzerrte echte Kausaletiketten in realen Szenarien zu identifizieren, was äußerst schwierig ist. Dieses Paper löst dieses Problem durch heuristische Konstruktion eines kausalitätsbewussten Datensatzes und Entwurf einer theoretisch unverzerrten Verlustfunktion.
Kausaldiagramm-Rekonstruktion: Erste Reformulierung der domänenübergreifenden Empfehlungsaufgabe als Kausaldiagramm, das prinzipiengesteuerte Anleitung für Methodendesign bietet
Kausalitätsverstärkungs-Framework: Präsentation des CE-CDR-Frameworks, das domänenübergreifende Kausalbeziehungen direkt aus Daten- und Modellperspektive modelliert
Theoretische Innovation: Ableitung einer theoretisch unverzerrten Partial-Label-Kausalverlustfunktion (PLCL), die auf ungesehene Kausalitätsmuster verallgemeinern kann
Praktische Validierung: Als modellunabhängiges Plugin mit universeller Anwendbarkeit, bereits in der Produktionsumgebung eingesetzt mit signifikanten Ergebnissen
Betrachten Sie ein domänenübergreifendes Empfehlungsszenario mit Quelldomäne s und Zieldomäne t, wobei beide Domänen eine gemeinsame Benutzermenge U teilen. Jede Domäne hat ihre eigene Itemsammlung: Quelldomäne Is und Zieldomäne It. Benutzer u haben Interaktionssequenzen Ss^u und St^u in beiden Domänen. Das Ziel ist, Quelldomänenwissen zu nutzen, um die Empfehlungsgenauigkeit der Zieldomäne zu verbessern.
Für einen bestimmten Benutzer beeinflusst seine Vorliebe für ein Item is in der Quelldomäne kausal seine Vorliebe für ähnliche Items it in der Zieldomäne
Implementierungsmethode:
Verwendung von zwei Ähnlichkeitsmessungen: Inhaltsähnlichkeit und Verhaltensähnlichkeit
Inhalts-Embeddings werden durch domänenübergreifende gemeinsame Kategorienklassifizierungsaufgaben gelernt
Verhaltens-Embeddings werden durch Graph-Encoder des globalen Benutzer-Item-Interaktionsgraphen generiert
Ähnlichkeitsberechnungsformel:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
Gesamtähnlichkeit durch CDF-Kalibrierung und Maximumwertbildung:
Partial-Label-Kausalverlust (PLCL):
Die Kerninnnovation liegt in der Behandlung des Partial-Label-Problems. Da hohe Ähnlichkeit keine notwendige Bedingung für Kausalität ist, führt direktes Training auf dem vom CLM konstruierten Datensatz zu Verzerrungen.
Proposition 1: Gegeben ein echtes Propensity-Score e(x) kann das Kausalitätsmodell f(x) durch folgende Verlustoptimierung theoretisch unverzerrte Kausalitätswahrscheinlichkeitsschätzungen lernen:
L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]
mit korrigiertem Label:
h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]
Proposition 2: Das Propensity-Modell e(x) wird durch folgende Verlustoptimierung trainiert:
Validierung der Verallgemeinerungsfähigkeit:
Durch Ausschluss einer Ähnlichkeitskonstruktionsmethode beim Datensatzkonstruktion zeigt sich, dass DCMM ungesehene Kausalitätsmuster identifizieren kann, was die Verallgemeinerungsfähigkeit des Modells über die Annotationsstrategie hinaus beweist.
Merkmalsbeitragsanalyse:
Merkmals-Masking-Experimente zeigen, dass die Aktivierungsdifferenzen domänenübergreifender Merkmale in CE-CDR deutlich größer sind als in Baseline-Methoden, was eine effektivere Nutzung domänenübergreifender Informationen beweist.
Dynamische Gate-Erklärung:
Benutzer mit reichhaltigen Quelldomänen-Informationen haben höhere Gate-Werte, was die Effektivität des adaptiven Fusionsmechanismus validiert.
Das Paper zitiert 76 verwandte Arbeiten, die domänenübergreifende Empfehlungen, Kausalinferenz, Aufmerksamkeitsmechanismen und andere Bereiche abdecken und eine solide theoretische Grundlage für das Methodendesign bieten.
Gesamtbewertung: Dies ist ein Paper mit bedeutender Innovationskraft im Bereich der domänenübergreifenden Empfehlung, das Kausalinferenz systematisch in dieses Feld einführt und eine theoretisch garantierte sowie praktisch wirksame Lösung bietet. Die theoretischen Beiträge, experimentellen Validierungen und praktischen Implementierungen des Papers zeigen hohen akademischen und praktischen Wert.