2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic

Улучшение причинности для кросс-доменной рекомендации

Основная информация

  • ID статьи: 2510.14641
  • Название: Causality Enhancement for Cross-Domain Recommendation
  • Авторы: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
  • Классификация: cs.IR cs.AI
  • Конференция: Conference acronym 'XX (согласно содержанию PDF, похоже на шаблон конференции)
  • Ссылка на статью: https://arxiv.org/abs/2510.14641

Аннотация

Кросс-доменная рекомендация является важной составляющей систем рекомендации, которая улучшает рекомендации целевого домена с помощью вспомогательной информации из задач или признаков исходного домена. Однако введение несогласованных задач исходного домена может привести к недостаточному кросс-доменному моделированию или отрицательной передаче знаний, а введение признаков исходного домена без учёта потенциальных причинных связей может ограничить их вклад в окончательное предсказание. В данной работе предлагается фреймворк причинного улучшения CE-CDR, который сначала переформулирует кросс-доменную рекомендацию как причинный граф, затем эвристически конструирует набор данных, осведомлённый о причинности, и выводит теоретически несмещённую функцию потерь причинности с частичными метками для обобщения на невидимые кросс-доменные закономерности. Метод был развёрнут в производственной среде, демонстрируя его практическую ценность.

Исследовательский контекст и мотивация

Основные проблемы

Традиционные системы кросс-доменной рекомендации сталкиваются с двумя основными вызовами:

  1. Несогласованность задач: методы многозадачного обучения способствуют передаче знаний между доменами через совместное использование параметров или представлений, но могут не захватить ценную информацию о кросс-доменных связях из-за несогласованности задач между доменами, вызывая даже отрицательную передачу
  2. Разреженность причинных связей: методы, использующие поведение исходного домена в качестве дополнительных входных признаков, игнорируют разреженность причинных связей между исходным и целевым доменами; предпочтения пользователя в целевом домене не обязательно зависят от поведения в исходном домене

Исследовательская мотивация

Существующие методы либо изучают функции L→S и L→T (многозадачное обучение), либо изучают функции (L,S)→T (слияние признаков), но ни один из них не моделирует напрямую причинные связи между доменами. В данной работе предлагается обучение кросс-доменного представления непосредственно на наборе данных с причинными аннотациями, изучение функции (L,S)→I→T, где I представляет ценную информацию о кросс-доменной передаче.

Вызовы и инновации

Основной вызов заключается в том, что идентификация несмещённых истинных причинных меток в реальных сценариях чрезвычайно сложна. В данной работе эта проблема решается путём эвристического конструирования набора данных, осведомлённого о причинности, и разработки теоретически несмещённой функции потерь.

Основные вклады

  1. Реконструкция причинного графа: впервые переформулирует задачу кросс-доменной рекомендации как причинный граф, обеспечивая принципиальное руководство для разработки метода
  2. Фреймворк причинного улучшения: предлагает фреймворк CE-CDR, который моделирует причинные связи между доменами с точек зрения данных и модели
  3. Теоретическая инновация: выводит теоретически несмещённую функцию потерь причинности с частичными метками (PLCL), способную обобщаться на невидимые причинные закономерности
  4. Проверка практичности: как модель-агностичный плагин обладает универсальной применимостью, уже развёрнут в производственной среде с значительными результатами

Подробное описание метода

Определение задачи

Рассмотрим сценарий кросс-доменной рекомендации, содержащий исходный домен s и целевой домен t, с общим набором пользователей U в обоих доменах. Каждый домен имеет собственный набор элементов: исходный домен Is и целевой домен It. Пользователь u имеет последовательности взаимодействий Ss^u и St^u в обоих доменах. Цель состоит в использовании знаний исходного домена для улучшения точности рекомендации целевого домена.

Архитектура модели

Фреймворк CE-CDR содержит три основных модуля:

1. Модуль причинной аннотации (CLM)

Основное предположение: гипотеза выравнивания сходства и причинности

Для данного пользователя его предпочтение элемента is в исходном домене причинно влияет на его предпочтение похожего элемента it в целевом домене

Метод реализации:

  • Использование двух мер сходства: сходство содержания и сходство поведения
  • Встраивание содержания изучается через задачу классификации категорий, совместно используемую между доменами
  • Встраивание поведения генерируется кодировщиком графа глобального графа взаимодействия пользователь-элемент
  • Формула расчёта сходства:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
  • Общее сходство вычисляется путём калибровки CDF и выбора максимума:
sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. Модуль прямого причинного моделирования (DCMM)

Основная модель: механизм внимания на основе SASRec

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

Функция потерь причинности с частичными метками (PLCL): Ключевая инновация заключается в обработке проблемы частичной аннотации. Поскольку высокое сходство не является необходимым условием для причинной связи, прямое обучение на наборе данных, построенном CLM, вызовет смещение.

Предложение 1: при наличии истинной оценки склонности e(x), причинная модель f(x) может изучить теоретически несмещённую оценку причинной вероятности путём оптимизации следующей функции потерь:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

где скорректированная метка:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

Предложение 2: модель склонности e(x) оптимизируется следующей функцией потерь:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. Модуль причинного улучшения (CEM)

Кросс-доменное самовнимание: представления исходного и целевого доменов обрабатываются как последовательность длины 2

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

Кросс-доменное вентильное внимание: адаптивное слияние на основе признаков пользователя

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

Ключевые технические инновации

  1. Причинная перспектива: впервые переосмысливает задачу кросс-доменной рекомендации с точки зрения причинного вывода
  2. Обучение с частичными метками: инновационно вводит обучение с частичными метками в причинное моделирование, решая проблему смещения аннотаций
  3. Теоретические гарантии: предоставляет теоретически несмещённую функцию потерь, обеспечивающую способность модели к обобщению
  4. Адаптивное слияние: динамический механизм вентиля регулирует вклад кросс-доменной информации в зависимости от признаков пользователя

Экспериментальная установка

Наборы данных

  1. Douban: содержит два домена Book и Music с 1 736 общими пользователями
  2. Amazon: домены Movies and TV и CDs and Vinyl с 18 547 общими пользователями
  3. Industry: крупномасштабный набор данных от Xiaohongshu, домены Note и Video с 167 766 638 общими пользователями

Метрики оценки

  • HR@K: наличие релевантного элемента в топ-K рекомендациях
  • NDCG@K: кумулятивный прирост с учётом позиции в рейтинге
  • Значения K: 15 для Douban и Amazon, 150 для Industry

Методы сравнения

  • Базовая модель: базовая двухбашенная модель
  • Методы многозадачного обучения: CoNet, MAN, DiCUR
  • Методы слияния признаков: MiNet, TrineCDR
  • Улучшенные версии: каждый базовый метод + плагин CE

Детали реализации

  • Размерность встраивания: 32 для Douban и Amazon, 64 для Industry
  • Порог сходства τ: 0.9 для Douban и Amazon, 0.85 для Industry
  • Оптимизатор: Adam с параметрами по умолчанию

Результаты экспериментов

Основные результаты

CE-CDR превосходит базовые методы на всех наборах данных и метриках оценки:

Результаты на наборе данных Douban:

  • Домен Book: HR@15 повышается до 0.5023 (против 0.4586 лучшего базового метода), NDCG@15 повышается до 0.3711 (против 0.3436)
  • Домен Music: HR@15 достигает 0.4983, NDCG@15 достигает 0.3600

Результаты на наборе данных Industry:

  • Домен Note: HR@150 составляет 0.2733, NDCG@150 составляет 0.0933
  • Домен Video: HR@150 составляет 0.3645, NDCG@150 составляет 0.0992

Абляционные эксперименты

Анализ вклада каждого компонента:

  • Модуль CLM: удаление приводит к значительному снижению производительности, подтверждая важность высококачественных положительных причинных примеров
  • Причинная функция потерь: прямое использование D+ в качестве истинного причинного набора приводит к снижению производительности
  • Самовнимание: удаление кросс-доменного самовнимания влияет на эффективность обмена информацией
  • Механизм вентиля: замена вентильного внимания простой конкатенацией снижает эффект персонализированного слияния
  • Стратегия кэширования: практически без потери производительности, но устраняет увеличение задержки

Глубокий анализ

Проверка способности к обобщению: Путём исключения одного типа сходства при конструировании набора данных обнаружено, что DCMM может идентифицировать невидимые причинные закономерности, доказывая способность модели к обобщению за пределами стратегии аннотации.

Анализ вклада признаков: Эксперименты с маскированием признаков показывают, что активация кросс-доменных признаков в CE-CDR значительно больше отличается от базовых методов, доказывая более эффективное использование кросс-доменной информации.

Интерпретация динамического вентиля: Пользователи с богатой информацией в исходном домене имеют более высокие значения вентиля, подтверждая эффективность механизма адаптивного слияния.

Онлайн-эксперименты

A/B-тестирование в производственной среде (платформа Xiaohongshu):

  • Сценарий Video: клики +0.33%, CTR +0.37%, разнообразие +0.12%
  • Сценарий Note: клики +0.28%, CTR +0.43%, разнообразие +0.16%
  • Развёрнут в апреле 2025 года

Связанные работы

Кросс-доменная рекомендация

Существующие методы делятся на две категории:

  1. Многозадачное обучение: способствует передаче знаний через совместное использование параметров или представлений, но имеет проблему несогласованности задач
  2. Слияние признаков: использует поведение исходного домена в качестве входных признаков, но игнорирует разреженность причинных связей

Причинная рекомендация

Основные решаемые проблемы:

  1. Смещение данных: смещение экспозиции, смещение популярности, смещение конформизма
  2. Отсутствующие данные: невозможность захватить полные предпочтения пользователя
  3. Интерпретируемость: повышение интерпретируемости, разнообразия и справедливости рекомендаций

Данная работа впервые применяет причинный вывод к прямому моделированию причинных связей в кросс-доменной рекомендации.

Заключение и обсуждение

Основные выводы

  1. Эффективность: CE-CDR значительно превосходит существующие методы на нескольких наборах данных
  2. Универсальность: как модель-агностичный плагин может улучшить производительность различных базовых методов
  3. Практичность: успешно развёрнут в крупномасштабной производственной среде
  4. Теоретичность: предоставляет фреймворк причинного моделирования с теоретическими гарантиями

Ограничения

  1. Зависимость от предположений: гипотеза выравнивания сходства и причинности может быть неприменима ко всем сценариям
  2. Качество аннотаций: эвристический метод причинной аннотации может вносить шум
  3. Вычислительные затраты: требует дополнительного обучения и вывода причинной модели

Направления будущих исследований

  1. Оптимизация предположений: исследование более точных методов идентификации причинных связей
  2. Расширение на несколько доменов: расширение причинного моделирования на несколько исходных доменов
  3. Динамическая причинность: учёт эволюции причинных связей во времени

Глубокая оценка

Преимущества

  1. Высокая инновационность: впервые систематически вводит причинный вывод в кросс-доменную рекомендацию
  2. Прочная теория: предоставляет строгие математические выводы и теоретические гарантии
  3. Полные эксперименты: комплексная проверка на нескольких наборах данных, абляционные эксперименты, онлайн A/B-тестирование
  4. Высокая практическая ценность: развёрнут в производственной среде с значительными результатами
  5. Универсальная применимость: дизайн модель-агностичного плагина повышает применимость

Недостатки

  1. Ограничения предположений: гипотеза выравнивания сходства и причинности может чрезмерно упростить реальные причинные связи
  2. Смещение аннотаций: эвристический метод причинной аннотации может вносить систематическое смещение
  3. Увеличение сложности: введение дополнительных модулей увеличивает сложность системы
  4. Специфичность для области: некоторые дизайнерские решения могут быть специализированы для платформ контента, требуя проверки обобщаемости

Влияние

  1. Академический вклад: предоставляет новую парадигму причинного моделирования для области кросс-доменной рекомендации
  2. Практическая ценность: успешное развёртывание в производственной среде доказывает коммерческую ценность
  3. Исследовательское вдохновение: может вдохновить больше приложений причинного вывода в системах рекомендации

Применимые сценарии

  1. Многодоменные платформы: сценарии контент-платформ, электронной коммерции и других с несколькими бизнес-доменами
  2. Проблема холодного старта: сценарии рекомендации новых пользователей или новых элементов
  3. Кросс-платформная рекомендация: сценарии, требующие передачи поведения пользователя между платформами

Библиография

Статья цитирует 76 связанных работ, охватывающих кросс-доменную рекомендацию, причинный вывод, механизмы внимания и другие области, обеспечивая прочную теоретическую базу для разработки метода.


Общая оценка: Это статья с важным инновационным значением в области кросс-доменной рекомендации, систематически вводящая причинный вывод в эту область и предлагающая решение с теоретическими гарантиями и практической эффективностью. Теоретические вклады, экспериментальная проверка и практическое развёртывание статьи отражают высокую академическую и практическую ценность.