2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.

Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.

academic

クロスドメイン推薦のための因果性強化

基本情報

論文ID: 2510.14641
タイトル: Causality Enhancement for Cross-Domain Recommendation
著者: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (小紅書Co., Ltd)
分類: cs.IR cs.AI
発表会議: 会議テンプレート（PDFコンテンツに基づく）
論文リンク: https://arxiv.org/abs/2510.14641

要約

クロスドメイン推薦は推薦システムの重要な構成要素であり、ソースドメインのタスクまたは特徴の補助情報を通じてターゲットドメイン推薦を強化します。しかし、矛盾したソースドメインタスクを導入すると、クロスドメインモデリングの不足または負の転移が生じる可能性があり、潜在的な因果関係を考慮せずにソースドメイン特徴を導入すると、最終予測への寄与が制限される可能性があります。本論文は因果性強化フレームワークCE-CDRを提案し、まずクロスドメイン推薦を因果グラフとして再定式化し、次に発見的に因果認識データセットを構築し、未見のクロスドメインパターンに一般化する理論的に不偏な部分ラベル因果損失関数を導出します。本手法は本番環境に展開され、その実用的価値が実証されています。

研究背景と動機

コア問題

従来のクロスドメイン推薦システムは2つの主要な課題に直面しています：

タスク不一致性：マルチタスク学習手法はパラメータまたは表現の共有を通じてクロスドメイン知識の転移を促進しますが、ドメイン間タスクの不一致性のため、価値あるクロスドメイン情報をキャプチャできず、負の転移さえ引き起こす可能性があります
因果関係の疎性：ソースドメイン行動を追加入力特徴として使用する手法は、ソースドメインとターゲットドメイン間の因果関係の疎性を無視しており、ターゲットドメインにおけるユーザーの嗜好は必ずしもソースドメイン行動の影響を受けません

研究動機

既存手法は関数L→SおよびL→T（マルチタスク学習）、または関数(L,S)→T（特徴融合）のいずれかを学習していますが、クロスドメイン因果関係を直接モデル化していません。本論文は、因果注釈付きデータセット上で直接クロスドメイン表現を訓練し、関数(L,S)→I→Tを学習することを提案します。ここでIは価値あるクロスドメイン転移可能情報を表します。

課題と革新

主な課題は、実際のシナリオにおいて不偏の真の因果ラベルを識別することが極めて困難であることです。本論文は発見的に因果認識データセットを構築し、理論的に不偏の損失関数を設計することでこの問題を解決します。

コア貢献

因果グラフ再構成：クロスドメイン推薦タスクを因果グラフとして初めて再定式化し、手法設計に原則的なガイダンスを提供します
因果性強化フレームワーク：CE-CDRフレームワークを提案し、データとモデルの両面からクロスドメイン因果関係を直接モデル化します
理論的革新：理論的に不偏な部分ラベル因果損失（PLCL）を導出し、未見の因果パターンに一般化できます
実用性検証：モデル非依存のプラグインとして汎用適用性を持ち、本番環境に展開され顕著な効果を達成しています

方法の詳細

タスク定義

ソースドメインsとターゲットドメインtを含むクロスドメイン推薦シナリオを考えます。両ドメインはユーザー集合Uを共有します。各ドメインは独自の物品集合を持ちます：ソースドメインI_sおよびターゲットドメインI_t。ユーザーuは両ドメインで相互作用シーケンスS_s^uおよびS_t^uを持ちます。目標はソースドメイン知識を利用してターゲットドメイン推薦精度を改善することです。

モデルアーキテクチャ

CE-CDRフレームワークは3つのコアモジュールで構成されています：

1. 因果注釈モジュール（CLM）

コア仮説：類似性-因果性整合仮説

与えられたユーザーについて、ソースドメイン物品i_sに対する嗜好は、ターゲットドメイン類似物品i_tに対する嗜好に因果的に影響します

実装方法：

コンテンツ類似性と行動類似性の2つの測度を使用
コンテンツ埋め込みはクロスドメイン共有カテゴリ分類タスクを通じて学習
行動埋め込みはグローバルユーザー-物品相互作用グラフのグラフエンコーダにより生成
類似性計算式：

sim^{c,b}(i_s, i_t) = (S^{c,b}_{i_s})^T S^{c,b}_{i_t}

全体的な類似性はCDF校正後に最大値を取ります：

sim(i_s, i_t) = max(F_c(sim^c(i_s, i_t)), F_b(sim^b(i_s, i_t)))

2. 直接因果モデリングモジュール（DCMM）

バックボーンモデル：SASRecベースの注意機構

f(u, S^u_s, i_t) = σ([f_{se}(f_{fe}(u), f_{em}(i^u,1_s), f_{em}(i^u,2_s), ...)]^T f_{em}(i_t))

部分ラベル因果損失（PLCL）：コア革新は部分注釈問題の処理にあります。高い類似性は因果関係の必要条件ではないため、CLMが構築したデータセット上で直接訓練するとバイアスが生じます。

命題1：真の傾向スコアe(x)が与えられた場合、因果モデルf(x)は以下の損失を通じて最適化することで、理論的に不偏な因果確率推定を学習できます：

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

ここで校正ラベルは：

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

命題2：傾向モデルe(x)は以下の損失を通じて最適化されます：

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. 因果性強化モジュール（CEM）

クロスドメイン自己注意：ソースドメインとターゲットドメイン表現を長さ2のシーケンスとして処理

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

クロスドメインゲート付き注意：ユーザー特徴に基づく適応的融合

g^u = σ(LeakyReLU(Q^u W^{g,1} + b^{g,1})W^{g,2} + b^{g,2})
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

技術的革新点

因果的観点：因果推論の観点からクロスドメイン推薦問題を初めて体系的に再検討
部分ラベル学習：部分ラベル学習を因果モデリングに革新的に導入し、注釈バイアス問題を解決
理論的保証：理論的に不偏の損失関数を提供し、モデルの一般化能力を確保
適応的融合：動的ゲート機構がユーザー特徴に基づいてクロスドメイン情報の寄与を調整

実験設定

データセット

Douban：BookおよびMusic 2つのドメイン、1,736個の共有ユーザー
Amazon：Movies and TVおよびCDs and Vinylドメイン、18,547個の共有ユーザー
Industry：小紅書からの大規模データセット、NoteおよびVideoドメイン、167,766,638個の共有ユーザー

評価指標

HR@K：上位K推薦に関連物品が含まれるかどうか
NDCG@K：ランキング位置を考慮した累積ゲイン
K値設定：DoubanおよびAmazonは15、Industryは150

比較手法

ベースモデル：基本的なデュアルタワーモデル
マルチタスク学習手法：CoNet、MAN、DiCUR
特徴融合手法：MiNet、TrineCDR
強化版：各ベースライン手法+CEプラグイン

実装詳細

埋め込み次元：DoubanおよびAmazonは32、Industryは64
類似性閾値τ：DoubanおよびAmazonは0.9、Industryは0.85
オプティマイザ：デフォルト設定のAdam

実験結果

主要結果

CE-CDRはすべてのデータセットと評価指標において基線手法を上回ります：

Doubanデータセット性能：

Bookドメイン：HR@15は0.5023に向上（最良基線0.4586対比）、NDCG@15は0.3711に向上（0.3436対比）
Musicドメイン：HR@15は0.4983、NDCG@15は0.3600

Industryデータセット性能：

Noteドメイン：HR@150は0.2733、NDCG@150は0.0933
Videoドメイン：HR@150は0.3645、NDCG@150は0.0992

アブレーション実験

各コンポーネントの寄与分析：

CLMモジュール：削除後に性能が大幅に低下し、高品質因果正サンプルの重要性を検証
因果損失：D+を真の因果集合として直接使用すると性能が低下
自己注意：クロスドメイン自己注意を削除すると情報交換効果に影響
ゲート機構：単純な連結でゲート付き注意を置き換えると個性化融合効果が低下
キャッシング戦略：ほぼ性能損失なしで遅延増加を排除

深度分析

一般化能力検証： 1つの類似性構築データセットを除外することで、DCMMが未見の因果パターンを識別でき、モデルが注釈戦略を超える一般化能力を持つことを証明します。

特徴寄与分析：特徴マスク実験はCE-CDRのクロスドメイン特徴活性化差異が基線手法をはるかに上回ることを示し、より効果的なクロスドメイン情報利用を証明します。

動的ゲート解釈：ソースドメイン情報が豊富なユーザーはより高いゲート値を持ち、適応的融合機構の有効性を検証します。

オンライン実験

本番環境A/Bテスト（小紅書プラットフォーム）：

Videoシナリオ：クリック+0.33%、CTR+0.37%、多様性+0.12%
Noteシナリオ：クリック+0.28%、CTR+0.43%、多様性+0.16%
2025年4月にオンライン展開済み

結論と考察

主要結論

有効性：CE-CDRは複数のデータセットで既存手法を大幅に上回ります
汎用性：モデル非依存プラグインとして様々なベースライン手法の性能を向上
実用性：大規模本番環境で成功裏に展開
理論性：理論的保証を備えた因果モデリングフレームワークを提供

制限事項

仮説依存：類似性-因果性整合仮説はすべてのシナリオに適用できない可能性
注釈品質：発見的因果注釈がノイズを導入する可能性
計算オーバーヘッド：追加の因果モデル訓練と推論が必要

今後の方向

仮説最適化：より正確な因果関係識別方法の探索
マルチドメイン拡張：複数ソースドメインの因果モデリングへの拡張
動的因果：時間動的な因果関係進化の考慮

深度評価

利点

革新性が強い：因果推論をクロスドメイン推薦に初めて体系的に導入
理論が堅実：厳密な数学的導出と理論的保証を提供
実験が充分：複数データセット検証、アブレーション実験、オンラインA/Bテストが包括的
実用価値が高い：本番環境展開で顕著な効果を達成
汎用適用：モデル非依存プラグイン設計で適用性を強化

不足

仮説の限界：類似性-因果性整合仮説は実際の因果関係を過度に単純化する可能性
注釈バイアス：発見的因果注釈方法は依然として体系的バイアスを導入する可能性
複雑度増加：追加モジュール導入がシステム複雑度を増加
領域特定：某些設計はコンテンツプラットフォーム向けに特化し、一般化性は検証待ち

影響力

学術貢献：クロスドメイン推薦領域に新しい因果モデリングパラダイムを提供
実践価値：本番環境での成功展開が商業的価値を証明
研究啓発：推薦システムにおける因果推論の応用をさらに促進する可能性

適用シーン

マルチドメインプラットフォーム：コンテンツ共有プラットフォーム、電子商取引プラットフォームなど複数ビジネスドメインを持つシーン
コールドスタート問題：新規ユーザーまたは新規物品推薦シーン
クロスプラットフォーム推薦：プラットフォーム間ユーザー行動転移が必要なシーン

参考文献

論文は76篇の関連文献を引用しており、クロスドメイン推薦、因果推論、注意機構など複数領域の重要な研究をカバーし、手法設計に堅実な理論基礎を提供しています。

総合評価：これはクロスドメイン推薦領域において重要な革新的意義を持つ論文であり、因果推論を体系的にこの領域に導入し、理論的に保証され実践的に有効な解決策を提案しています。論文の理論的貢献、実験検証、実際の展開はすべて高い学術的および実用的価値を体現しています。