Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic
Улучшение причинности для кросс-доменной рекомендации
Кросс-доменная рекомендация является важной составляющей систем рекомендации, которая улучшает рекомендации целевого домена с помощью вспомогательной информации из задач или признаков исходного домена. Однако введение несогласованных задач исходного домена может привести к недостаточному кросс-доменному моделированию или отрицательной передаче знаний, а введение признаков исходного домена без учёта потенциальных причинных связей может ограничить их вклад в окончательное предсказание. В данной работе предлагается фреймворк причинного улучшения CE-CDR, который сначала переформулирует кросс-доменную рекомендацию как причинный граф, затем эвристически конструирует набор данных, осведомлённый о причинности, и выводит теоретически несмещённую функцию потерь причинности с частичными метками для обобщения на невидимые кросс-доменные закономерности. Метод был развёрнут в производственной среде, демонстрируя его практическую ценность.
Традиционные системы кросс-доменной рекомендации сталкиваются с двумя основными вызовами:
Несогласованность задач: методы многозадачного обучения способствуют передаче знаний между доменами через совместное использование параметров или представлений, но могут не захватить ценную информацию о кросс-доменных связях из-за несогласованности задач между доменами, вызывая даже отрицательную передачу
Разреженность причинных связей: методы, использующие поведение исходного домена в качестве дополнительных входных признаков, игнорируют разреженность причинных связей между исходным и целевым доменами; предпочтения пользователя в целевом домене не обязательно зависят от поведения в исходном домене
Существующие методы либо изучают функции L→S и L→T (многозадачное обучение), либо изучают функции (L,S)→T (слияние признаков), но ни один из них не моделирует напрямую причинные связи между доменами. В данной работе предлагается обучение кросс-доменного представления непосредственно на наборе данных с причинными аннотациями, изучение функции (L,S)→I→T, где I представляет ценную информацию о кросс-доменной передаче.
Основной вызов заключается в том, что идентификация несмещённых истинных причинных меток в реальных сценариях чрезвычайно сложна. В данной работе эта проблема решается путём эвристического конструирования набора данных, осведомлённого о причинности, и разработки теоретически несмещённой функции потерь.
Реконструкция причинного графа: впервые переформулирует задачу кросс-доменной рекомендации как причинный граф, обеспечивая принципиальное руководство для разработки метода
Фреймворк причинного улучшения: предлагает фреймворк CE-CDR, который моделирует причинные связи между доменами с точек зрения данных и модели
Теоретическая инновация: выводит теоретически несмещённую функцию потерь причинности с частичными метками (PLCL), способную обобщаться на невидимые причинные закономерности
Проверка практичности: как модель-агностичный плагин обладает универсальной применимостью, уже развёрнут в производственной среде с значительными результатами
Рассмотрим сценарий кросс-доменной рекомендации, содержащий исходный домен s и целевой домен t, с общим набором пользователей U в обоих доменах. Каждый домен имеет собственный набор элементов: исходный домен Is и целевой домен It. Пользователь u имеет последовательности взаимодействий Ss^u и St^u в обоих доменах. Цель состоит в использовании знаний исходного домена для улучшения точности рекомендации целевого домена.
Функция потерь причинности с частичными метками (PLCL):
Ключевая инновация заключается в обработке проблемы частичной аннотации. Поскольку высокое сходство не является необходимым условием для причинной связи, прямое обучение на наборе данных, построенном CLM, вызовет смещение.
Предложение 1: при наличии истинной оценки склонности e(x), причинная модель f(x) может изучить теоретически несмещённую оценку причинной вероятности путём оптимизации следующей функции потерь:
L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]
где скорректированная метка:
h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]
Предложение 2: модель склонности e(x) оптимизируется следующей функцией потерь:
Проверка способности к обобщению:
Путём исключения одного типа сходства при конструировании набора данных обнаружено, что DCMM может идентифицировать невидимые причинные закономерности, доказывая способность модели к обобщению за пределами стратегии аннотации.
Анализ вклада признаков:
Эксперименты с маскированием признаков показывают, что активация кросс-доменных признаков в CE-CDR значительно больше отличается от базовых методов, доказывая более эффективное использование кросс-доменной информации.
Интерпретация динамического вентиля:
Пользователи с богатой информацией в исходном домене имеют более высокие значения вентиля, подтверждая эффективность механизма адаптивного слияния.
Многозадачное обучение: способствует передаче знаний через совместное использование параметров или представлений, но имеет проблему несогласованности задач
Слияние признаков: использует поведение исходного домена в качестве входных признаков, но игнорирует разреженность причинных связей
Статья цитирует 76 связанных работ, охватывающих кросс-доменную рекомендацию, причинный вывод, механизмы внимания и другие области, обеспечивая прочную теоретическую базу для разработки метода.
Общая оценка: Это статья с важным инновационным значением в области кросс-доменной рекомендации, систематически вводящая причинный вывод в эту область и предлагающая решение с теоретическими гарантиями и практической эффективностью. Теоретические вклады, экспериментальная проверка и практическое развёртывание статьи отражают высокую академическую и практическую ценность.