2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic

Mejora de Causalidad para Recomendación Multidominio

Información Básica

  • ID del Artículo: 2510.14641
  • Título: Causality Enhancement for Cross-Domain Recommendation
  • Autores: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
  • Clasificación: cs.IR cs.AI
  • Conferencia de Publicación: Plantilla de conferencia XX (según contenido del PDF)
  • Enlace del Artículo: https://arxiv.org/abs/2510.14641

Resumen

La recomendación multidominio es un componente importante de los sistemas de recomendación, que mejora la recomendación en el dominio objetivo mediante información auxiliar de tareas o características del dominio fuente. Sin embargo, la introducción de tareas de dominio fuente inconsistentes puede conducir a un modelado multidominio insuficiente o transferencia negativa, mientras que la introducción de características del dominio fuente sin considerar relaciones causales potenciales puede limitar su contribución a la predicción final. Este artículo propone un marco de mejora causal CE-CDR, que primero reformula la recomendación multidominio como un gráfico causal, luego construye heurísticamente un conjunto de datos consciente de causalidad, y deriva una función de pérdida causal de etiqueta parcial teóricamente insesgada para generalizar a patrones multidominios no vistos. El método ha sido implementado en un entorno de producción, demostrando su valor de aplicación práctica.

Antecedentes de Investigación y Motivación

Problemas Centrales

Los sistemas tradicionales de recomendación multidominio enfrentan dos desafíos principales:

  1. Inconsistencia de Tareas: Los métodos de aprendizaje multitarea promueven la transferencia de conocimiento multidominio mediante parámetros compartidos o representaciones, pero pueden no capturar información valiosa entre dominios debido a la inconsistencia de tareas entre dominios, e incluso causar transferencia negativa
  2. Escasez de Relaciones Causales: Los métodos que utilizan comportamiento del dominio fuente como características de entrada adicionales ignoran la escasez de relaciones causales entre dominios fuente y objetivo; las preferencias de un usuario en el dominio objetivo no necesariamente están influenciadas por el comportamiento en el dominio fuente

Motivación de Investigación

Los métodos existentes aprenden funciones L→S y L→T (aprendizaje multitarea) o aprenden funciones (L,S)→T (fusión de características), pero ninguno modela directamente las relaciones causales multidominios. Este artículo propone entrenar directamente representaciones multidominios en conjuntos de datos anotados causalmente, aprendiendo la función (L,S)→I→T, donde I representa información valiosa transferible entre dominios.

Desafíos e Innovación

El desafío principal es que identificar etiquetas causales verdaderas e insesgadas en escenarios reales es extremadamente difícil. Este artículo aborda este problema mediante la construcción heurística de un conjunto de datos consciente de causalidad y el diseño de una función de pérdida teóricamente insesgada.

Contribuciones Principales

  1. Reconstrucción de Gráfico Causal: Reformula por primera vez la tarea de recomendación multidominio como un gráfico causal, proporcionando orientación principista para el diseño de métodos
  2. Marco de Mejora Causal: Propone el marco CE-CDR que modela directamente las relaciones causales multidominios desde perspectivas de datos y modelos
  3. Innovación Teórica: Deriva la pérdida causal de etiqueta parcial (PLCL) teóricamente insesgada, capaz de generalizar a patrones causales no vistos
  4. Verificación Práctica: Como complemento agnóstico del modelo con aplicabilidad universal, ha sido implementado en entorno de producción con efectos significativos

Explicación Detallada del Método

Definición de Tarea

Se considera un escenario de recomendación multidominio que contiene dominio fuente s y dominio objetivo t, compartiendo conjunto de usuarios U entre ambos dominios. Cada dominio tiene su propio conjunto de elementos: Is para dominio fuente e It para dominio objetivo. El usuario u tiene secuencias de interacción Ss^u y St^u en ambos dominios. El objetivo es utilizar conocimiento del dominio fuente para mejorar la precisión de recomendación en el dominio objetivo.

Arquitectura del Modelo

El marco CE-CDR contiene tres módulos principales:

1. Módulo de Anotación Causal (CLM)

Suposición Central: Hipótesis de Alineación Similitud-Causalidad

Para un usuario dado, su preferencia por un elemento is en el dominio fuente causalmente influye en su preferencia por elementos similares it en el dominio objetivo

Método de Implementación:

  • Utiliza dos medidas de similitud: similitud de contenido y similitud de comportamiento
  • Las incrustaciones de contenido se aprenden mediante tarea de clasificación de categorías compartidas entre dominios
  • Las incrustaciones de comportamiento se generan mediante codificador de gráficos de la gráfica global de interacción usuario-elemento
  • Fórmula de cálculo de similitud:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
  • La similitud general se calibra mediante CDF y se toma el máximo:
sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. Módulo de Modelado Causal Directo (DCMM)

Modelo Base: Mecanismo de atención basado en SASRec

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

Pérdida Causal de Etiqueta Parcial (PLCL): La innovación central radica en abordar el problema de anotación parcial. Dado que la alta similitud no es una condición necesaria para causalidad, entrenar directamente en el conjunto de datos construido por CLM produce sesgo.

Proposición 1: Dado la puntuación de propensión verdadera e(x), el modelo causal f(x) optimizado mediante la siguiente pérdida puede aprender estimaciones de probabilidad causal teóricamente insesgadas:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

donde la etiqueta corregida:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

Proposición 2: El modelo de propensión e(x) se optimiza mediante la siguiente pérdida:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. Módulo de Mejora Causal (CEM)

Autoatención Multidominio: Trata representaciones de dominio fuente y objetivo como secuencia de longitud 2

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

Atención de Compuerta Multidominio: Fusión adaptativa basada en características de usuario

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

Puntos de Innovación Técnica

  1. Perspectiva Causal: Primera aplicación sistemática de inferencia causal a recomendación multidominio
  2. Aprendizaje de Etiqueta Parcial: Introducción innovadora del aprendizaje de etiqueta parcial en modelado causal, resolviendo problema de sesgo de anotación
  3. Garantía Teórica: Proporciona función de pérdida teóricamente insesgada, asegurando capacidad de generalización del modelo
  4. Fusión Adaptativa: Mecanismo de compuerta dinámica que ajusta contribución de información multidominio según características de usuario

Configuración Experimental

Conjuntos de Datos

  1. Douban: Contiene dominios Book y Music, con 1,736 usuarios compartidos
  2. Amazon: Dominios Movies and TV y CDs and Vinyl, 18,547 usuarios compartidos
  3. Industry: Conjunto de datos a gran escala de Xiaohongshu, dominios Note y Video, 167,766,638 usuarios compartidos

Métricas de Evaluación

  • HR@K: Si los K principales recomendados contienen elementos relevantes
  • NDCG@K: Ganancia acumulada descontada considerando posición de clasificación
  • Valores de K: 15 para Douban y Amazon, 150 para Industry

Métodos de Comparación

  • Modelo Base: Modelo de dos torres básico
  • Métodos de Aprendizaje Multitarea: CoNet, MAN, DiCUR
  • Métodos de Fusión de Características: MiNet, TrineCDR
  • Versiones Mejoradas: Cada método base + complemento CE

Detalles de Implementación

  • Dimensión de incrustación: 32 para Douban y Amazon, 64 para Industry
  • Umbral de similitud τ: 0.9 para Douban y Amazon, 0.85 para Industry
  • Optimizador: Adam con configuración predeterminada

Resultados Experimentales

Resultados Principales

CE-CDR supera a los métodos base en todos los conjuntos de datos y métricas de evaluación:

Desempeño en Conjunto de Datos Douban:

  • Dominio Book: HR@15 mejora a 0.5023 (vs mejor base 0.4586), NDCG@15 mejora a 0.3711 (vs 0.3436)
  • Dominio Music: HR@15 alcanza 0.4983, NDCG@15 alcanza 0.3600

Desempeño en Conjunto de Datos Industry:

  • Dominio Note: HR@150 es 0.2733, NDCG@150 es 0.0933
  • Dominio Video: HR@150 es 0.3645, NDCG@150 es 0.0992

Experimentos de Ablación

Análisis de contribución de componentes:

  • Módulo CLM: La eliminación resulta en caída significativa de desempeño, validando importancia de muestras positivas causales de alta calidad
  • Pérdida Causal: El uso directo de D+ como conjunto causal verdadero causa caída de desempeño
  • Autoatención: La eliminación de autoatención multidominio afecta efectividad del intercambio de información
  • Mecanismo de Compuerta: Reemplazar atención de compuerta con concatenación simple reduce efectividad de fusión personalizada
  • Estrategia de Caché: Casi sin pérdida de desempeño pero elimina aumento de latencia

Análisis Profundo

Verificación de Capacidad de Generalización: Mediante exclusión de una estrategia de similitud en construcción de conjunto de datos, se encuentra que DCMM puede identificar patrones causales no vistos, probando capacidad de generalización del modelo más allá de estrategia de anotación.

Análisis de Contribución de Características: Experimentos de enmascaramiento de características muestran que activación de características multidominios de CE-CDR tiene varianza mucho mayor que métodos base, probando utilización más efectiva de información multidominio.

Interpretación de Compuerta Dinámica: Usuarios con información de dominio fuente abundante tienen valores de compuerta más altos, validando efectividad del mecanismo de fusión adaptativa.

Experimentos en Línea

Prueba A/B en Entorno de Producción (Plataforma Xiaohongshu):

  • Escenario Video: Clics +0.33%, CTR +0.37%, Diversidad +0.12%
  • Escenario Note: Clics +0.28%, CTR +0.43%, Diversidad +0.16%
  • Implementado en línea en abril de 2025

Trabajo Relacionado

Recomendación Multidominio

Los métodos existentes se dividen principalmente en dos categorías:

  1. Aprendizaje Multitarea: Promueve transferencia de conocimiento mediante parámetros compartidos o representaciones, pero existe problema de inconsistencia de tareas
  2. Fusión de Características: Utiliza comportamiento de dominio fuente como características de entrada, pero ignora escasez de relaciones causales

Recomendación Causal

Resuelve principalmente tres clases de problemas:

  1. Sesgo de Datos: Sesgo de exposición, sesgo de popularidad, sesgo de conformidad
  2. Datos Faltantes: Incapacidad de capturar preferencias de usuario completas
  3. Interpretabilidad: Mejora de interpretabilidad, diversidad y equidad de recomendación

Este artículo es el primero en aplicar inferencia causal al modelado directo de relaciones causales en recomendación multidominio.

Conclusiones y Discusión

Conclusiones Principales

  1. Efectividad: CE-CDR supera significativamente métodos existentes en múltiples conjuntos de datos
  2. Universalidad: Como complemento agnóstico del modelo puede mejorar desempeño de varios métodos base
  3. Practicidad: Ha sido implementado exitosamente en entorno de producción a gran escala
  4. Teoría: Proporciona marco de modelado causal con garantías teóricas

Limitaciones

  1. Dependencia de Suposiciones: La hipótesis de alineación similitud-causalidad puede no aplicarse a todos los escenarios
  2. Calidad de Anotación: La anotación causal heurística puede introducir ruido
  3. Costo Computacional: Requiere entrenamiento e inferencia adicionales de modelo causal

Direcciones Futuras

  1. Optimización de Suposiciones: Explorar métodos más precisos de identificación de relaciones causales
  2. Extensión Multidominio: Extender a modelado causal de múltiples dominios fuente
  3. Causalidad Dinámica: Considerar evolución de relaciones causales con dinámica temporal

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Primera aplicación sistemática de inferencia causal a recomendación multidominio
  2. Teoría Sólida: Proporciona derivación matemática rigurosa y garantías teóricas
  3. Experimentación Completa: Validación en múltiples conjuntos de datos, experimentos de ablación, pruebas A/B en línea integral
  4. Alto Valor Práctico: Implementación en entorno de producción con efectos significativos
  5. Aplicabilidad Universal: Diseño de complemento agnóstico del modelo mejora aplicabilidad

Insuficiencias

  1. Limitación de Suposiciones: La hipótesis de alineación similitud-causalidad puede simplificar excesivamente relaciones causales reales
  2. Sesgo de Anotación: El método de anotación causal heurística aún puede introducir sesgo sistemático
  3. Aumento de Complejidad: La introducción de módulos adicionales aumenta complejidad del sistema
  4. Especificidad de Dominio: Algunos diseños pueden estar especializados para plataformas de contenido, con generalización pendiente de verificación

Impacto

  1. Contribución Académica: Proporciona nuevo paradigma de modelado causal para campo de recomendación multidominio
  2. Valor Práctico: Implementación exitosa en entorno de producción demuestra valor comercial
  3. Inspiración de Investigación: Puede inspirar más aplicaciones de inferencia causal en sistemas de recomendación

Escenarios Aplicables

  1. Plataformas Multidominio: Escenarios como plataformas de compartición de contenido, plataformas de comercio electrónico con múltiples dominios de negocio
  2. Problema de Arranque en Frío: Escenarios de recomendación de usuarios nuevos o elementos nuevos
  3. Recomendación Multiplataforma: Escenarios que requieren transferencia de comportamiento de usuario entre plataformas

Referencias

El artículo cita 76 referencias relacionadas, cubriendo múltiples campos incluyendo recomendación multidominio, inferencia causal, mecanismos de atención y otros trabajos importantes, proporcionando base teórica sólida para diseño de método.


Evaluación General: Este es un artículo con significado innovador importante en el campo de recomendación multidominio, que aplica sistemáticamente inferencia causal a este campo, proponiendo solución con garantía teórica y efectiva en práctica. Las contribuciones teóricas, verificación experimental e implementación práctica del artículo reflejan valor académico y práctico considerable.