Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic
Mejora de Causalidad para Recomendación Multidominio
La recomendación multidominio es un componente importante de los sistemas de recomendación, que mejora la recomendación en el dominio objetivo mediante información auxiliar de tareas o características del dominio fuente. Sin embargo, la introducción de tareas de dominio fuente inconsistentes puede conducir a un modelado multidominio insuficiente o transferencia negativa, mientras que la introducción de características del dominio fuente sin considerar relaciones causales potenciales puede limitar su contribución a la predicción final. Este artículo propone un marco de mejora causal CE-CDR, que primero reformula la recomendación multidominio como un gráfico causal, luego construye heurísticamente un conjunto de datos consciente de causalidad, y deriva una función de pérdida causal de etiqueta parcial teóricamente insesgada para generalizar a patrones multidominios no vistos. El método ha sido implementado en un entorno de producción, demostrando su valor de aplicación práctica.
Los sistemas tradicionales de recomendación multidominio enfrentan dos desafíos principales:
Inconsistencia de Tareas: Los métodos de aprendizaje multitarea promueven la transferencia de conocimiento multidominio mediante parámetros compartidos o representaciones, pero pueden no capturar información valiosa entre dominios debido a la inconsistencia de tareas entre dominios, e incluso causar transferencia negativa
Escasez de Relaciones Causales: Los métodos que utilizan comportamiento del dominio fuente como características de entrada adicionales ignoran la escasez de relaciones causales entre dominios fuente y objetivo; las preferencias de un usuario en el dominio objetivo no necesariamente están influenciadas por el comportamiento en el dominio fuente
Los métodos existentes aprenden funciones L→S y L→T (aprendizaje multitarea) o aprenden funciones (L,S)→T (fusión de características), pero ninguno modela directamente las relaciones causales multidominios. Este artículo propone entrenar directamente representaciones multidominios en conjuntos de datos anotados causalmente, aprendiendo la función (L,S)→I→T, donde I representa información valiosa transferible entre dominios.
El desafío principal es que identificar etiquetas causales verdaderas e insesgadas en escenarios reales es extremadamente difícil. Este artículo aborda este problema mediante la construcción heurística de un conjunto de datos consciente de causalidad y el diseño de una función de pérdida teóricamente insesgada.
Reconstrucción de Gráfico Causal: Reformula por primera vez la tarea de recomendación multidominio como un gráfico causal, proporcionando orientación principista para el diseño de métodos
Marco de Mejora Causal: Propone el marco CE-CDR que modela directamente las relaciones causales multidominios desde perspectivas de datos y modelos
Innovación Teórica: Deriva la pérdida causal de etiqueta parcial (PLCL) teóricamente insesgada, capaz de generalizar a patrones causales no vistos
Verificación Práctica: Como complemento agnóstico del modelo con aplicabilidad universal, ha sido implementado en entorno de producción con efectos significativos
Se considera un escenario de recomendación multidominio que contiene dominio fuente s y dominio objetivo t, compartiendo conjunto de usuarios U entre ambos dominios. Cada dominio tiene su propio conjunto de elementos: Is para dominio fuente e It para dominio objetivo. El usuario u tiene secuencias de interacción Ss^u y St^u en ambos dominios. El objetivo es utilizar conocimiento del dominio fuente para mejorar la precisión de recomendación en el dominio objetivo.
Suposición Central: Hipótesis de Alineación Similitud-Causalidad
Para un usuario dado, su preferencia por un elemento is en el dominio fuente causalmente influye en su preferencia por elementos similares it en el dominio objetivo
Método de Implementación:
Utiliza dos medidas de similitud: similitud de contenido y similitud de comportamiento
Las incrustaciones de contenido se aprenden mediante tarea de clasificación de categorías compartidas entre dominios
Las incrustaciones de comportamiento se generan mediante codificador de gráficos de la gráfica global de interacción usuario-elemento
Fórmula de cálculo de similitud:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
La similitud general se calibra mediante CDF y se toma el máximo:
Pérdida Causal de Etiqueta Parcial (PLCL):
La innovación central radica en abordar el problema de anotación parcial. Dado que la alta similitud no es una condición necesaria para causalidad, entrenar directamente en el conjunto de datos construido por CLM produce sesgo.
Proposición 1: Dado la puntuación de propensión verdadera e(x), el modelo causal f(x) optimizado mediante la siguiente pérdida puede aprender estimaciones de probabilidad causal teóricamente insesgadas:
L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]
donde la etiqueta corregida:
h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]
Proposición 2: El modelo de propensión e(x) se optimiza mediante la siguiente pérdida:
Perspectiva Causal: Primera aplicación sistemática de inferencia causal a recomendación multidominio
Aprendizaje de Etiqueta Parcial: Introducción innovadora del aprendizaje de etiqueta parcial en modelado causal, resolviendo problema de sesgo de anotación
Garantía Teórica: Proporciona función de pérdida teóricamente insesgada, asegurando capacidad de generalización del modelo
Fusión Adaptativa: Mecanismo de compuerta dinámica que ajusta contribución de información multidominio según características de usuario
Verificación de Capacidad de Generalización:
Mediante exclusión de una estrategia de similitud en construcción de conjunto de datos, se encuentra que DCMM puede identificar patrones causales no vistos, probando capacidad de generalización del modelo más allá de estrategia de anotación.
Análisis de Contribución de Características:
Experimentos de enmascaramiento de características muestran que activación de características multidominios de CE-CDR tiene varianza mucho mayor que métodos base, probando utilización más efectiva de información multidominio.
Interpretación de Compuerta Dinámica:
Usuarios con información de dominio fuente abundante tienen valores de compuerta más altos, validando efectividad del mecanismo de fusión adaptativa.
Los métodos existentes se dividen principalmente en dos categorías:
Aprendizaje Multitarea: Promueve transferencia de conocimiento mediante parámetros compartidos o representaciones, pero existe problema de inconsistencia de tareas
Fusión de Características: Utiliza comportamiento de dominio fuente como características de entrada, pero ignora escasez de relaciones causales
Plataformas Multidominio: Escenarios como plataformas de compartición de contenido, plataformas de comercio electrónico con múltiples dominios de negocio
Problema de Arranque en Frío: Escenarios de recomendación de usuarios nuevos o elementos nuevos
Recomendación Multiplataforma: Escenarios que requieren transferencia de comportamiento de usuario entre plataformas
El artículo cita 76 referencias relacionadas, cubriendo múltiples campos incluyendo recomendación multidominio, inferencia causal, mecanismos de atención y otros trabajos importantes, proporcionando base teórica sólida para diseño de método.
Evaluación General: Este es un artículo con significado innovador importante en el campo de recomendación multidominio, que aplica sistemáticamente inferencia causal a este campo, proponiendo solución con garantía teórica y efectiva en práctica. Las contribuciones teóricas, verificación experimental e implementación práctica del artículo reflejan valor académico y práctico considerable.