Recommender systems is set up to address the issue of information overload in traditional information retrieval systems, which is focused on recommending information that is of most interest to users from massive information. Generally, there is a sequential nature and heterogeneity to the behavior of a person interacting with a system, leading to the proposal of multi-behavior sequential recommendation (MBSR). MBSR is a relatively new and worthy direction for in-depth research, which can achieve state-of-the-art recommendation through suitable modeling, and some related works have been proposed. This survey aims to shed light on the MBSR problem. Firstly, we introduce MBSR in detail, including its problem definition, application scenarios and challenges faced. Secondly, we detail the classification of MBSR, including neighborhood-based methods, matrix factorization-based methods and deep learning-based methods, where we further classify the deep learning-based methods into different learning architectures based on RNN, GNN, Transformer, and generic architectures as well as architectures that integrate hybrid techniques. In each method, we present related works based on the data perspective and the modeling perspective, as well as analyze the strengths, weaknesses and features of these works. Finally, we discuss some promising future research directions to address the challenges and improve the current status of MBSR.
- ID статьи: 2308.15701
- Название: A Survey on Multi-Behavior Sequential Recommendation
- Авторы: Xiaoqing Chen, Zhitao Li, Weike Pan, Zhong Ming
- Категория: cs.IR (Information Retrieval)
- Дата публикации: 30 августа 2023 г. (препринт arXiv)
- Ссылка на статью: https://arxiv.org/abs/2308.15701
- Журнал: IEEE Transactions on Knowledge and Data Engineering
Системы рекомендации направлены на решение проблемы информационной перегрузки в традиционных системах поиска информации, сосредоточиваясь на рекомендации пользователям наиболее интересующего их контента из огромного объема информации. Поведение пользователей при взаимодействии с системой обычно имеет последовательный и гетерогенный характер, что привело к появлению многоповеденческой последовательной рекомендации (MBSR). MBSR — это относительно новое и перспективное направление исследований, которое при надлежащем моделировании может достичь передовых результатов рекомендации. Данный обзор направлен на уточнение проблемы MBSR, подробное описание определения проблемы, сценариев применения и стоящих перед ней задач, а также классификацию методов MBSR, включая методы на основе соседства, методы матричной факторизации и методы глубокого обучения.
- Проблема информационной перегрузки: С взрывным ростом информации в интернете пользователи сталкиваются с проблемой быстрого получения необходимого контента из огромного объема информации
- Ограничения традиционных систем рекомендации:
- Рекомендация с одним поведением (SBR) учитывает только один тип обратной связи пользователя, что легко приводит к проблемам разреженности данных и холодного старта
- Статические методы рекомендации игнорируют временную последовательность и динамические изменения поведения пользователя
- Гетерогенность поведения: В реальных сценариях между пользователями и товарами существуют различные типы взаимодействия (просмотр, добавление в корзину, покупка и т.д.)
- Зависимость последовательности: Поведение пользователя имеет естественные временные характеристики, отражающие динамические изменения краткосрочных и долгосрочных предпочтений
- Потребности практического применения: Области электронной коммерции, видеорекомендации, новостных рекомендаций срочно нуждаются в алгоритмах рекомендации, более соответствующих реальному поведению пользователей
- Систематический обзор: Первый комплексный и систематический обзор области MBSR, заполняющий пробел в отсутствии соответствующих обзоров в этой новой области
- Многомерная система классификации: Предложена система классификации методов MBSR по трем измерениям: технология, данные и моделирование
- Глубокий технический анализ: Детальный анализ преимуществ и недостатков каждого класса методов, предоставляющий исследователям четкую техническую дорожную карту
- Руководство по будущим направлениям: Предложены пять перспективных направлений будущих исследований, обеспечивающих руководство развитием этой области
Проблема MBSR в основном сосредоточена на рекомендации следующего товара в последовательности гетерогенной обратной связи. Дано:
- Множество пользователей U
- Множество товаров I
- Множество поведений F
Входные данные представляют собой пары (пользователь, последовательность гетерогенного поведения): (u,Su), где:
Su={(iu1,fu1),...,(iut,fut),...,(iu∣Su∣,fu∣Su∣)}
Цель — предсказать предпочтение пользователя u к кандидату товара j в момент времени (t+1) r^u,t+1,j и сгенерировать список рекомендаций Top-K.
- Основная идея: Использование сходства между пользователями или товарами для рекомендации
- Представительные работы: BIS (Bidirectional Item Similarity)
- Преимущества: Легко поддерживать, высокая интерпретируемость
- Недостатки: Отсутствие транзитивности, сложность в захвате сложных предпочтений пользователя
- Основная идея: Разложение матрицы взаимодействия пользователь-товар на внутреннее произведение низкоранговых матриц
- Представительные работы: TransRec++
- Инновационные моменты: Введение векторов переходов поведения для захвата последовательных отношений и динамики поведения
- Ограничения: Сложность модели резко возрастает с увеличением типов поведения
Архитектура RNN
- RLBL: Комбинирование RNN и log-bilinear модели с использованием матриц переходов, специфичных для поведения
- RIB: Использование GRU и механизма внимания для моделирования микроповедения
- BINN: Проектирование CLSTM и Bi-CLSTM для обработки информации о многоповедении
- Преимущества: Подходит для моделирования последовательности, способен сохранять краткосрочную память
- Недостатки: Проблемы исчезающего/взрывающегося градиента, низкая вычислительная эффективность
Архитектура GNN
- MGNN-SPred: Построение глобального графа для захвата отношений переходов поведения
- DMBGN: Разработана для задачи прогнозирования коэффициента использования купонов
- GPG4HSR: Одновременное рассмотрение глобального и персонализированного графов
- BGNN: Различие между гомогенными и гетерогенными моделями переходов поведения
- Преимущества: Способность моделировать сложные отношения, высокая устойчивость к разреженности данных
- Недостатки: Сложность построения графа возрастает с увеличением типов поведения
- DMT: Использование MMoE для многозадачного обучения
- DFN: Обработка шума неявной обратной связи через сеть внимания
- NextIP: Моделирование проблемы как двойной задачи прогнозирования товара и покупки
- MB-STR: Разработка новой функции позиционного кодирования
- FLAG: Одновременное моделирование локальных предпочтений, глобальных предпочтений и локальных намерений
- Преимущества: Сильная способность параллельных вычислений, отличное моделирование долгосрочных зависимостей
- Недостатки: Относительно слабый захват локальной информации
Гибридная архитектура
- MKM-SR: Комбинирование GNN и GRU для отдельного моделирования последовательности товаров и последовательности поведения
- KHGT: Интеграция Transformer и GNN с учетом информации об отношениях товаров
- Преимущества: Синтез преимуществ нескольких технологий, значительное улучшение производительности
- Недостатки: Высокая сложность модели, сложность настройки параметров
- Рекомендация электронной коммерции: Прогнозирование поведения покупки пользователя с учетом вспомогательного поведения, такого как просмотр, добавление в корзину, сохранение
- Видеорекомендация: Использование поделиться как целевого поведения, просмотр как вспомогательного поведения
- Новостная рекомендация: Комбинирование явной обратной связи (не нравится) и неявной обратной связи (просмотр)
- Метрики точности: Hit Rate, NDCG, Recall, Precision
- Метрики разнообразия: Coverage, Diversity
- Метрики эффективности: время обучения, время вывода, потребление памяти
- Последовательность пар (товар, поведение): Наиболее распространенный формат входных данных
- Подпоследовательности, специфичные для поведения: Последовательности товаров, разделенные по типам поведения
- Последовательности товаров, независимые от поведения: Последовательности товаров, игнорирующие типы поведения
- Последовательности поведения: Чистые последовательности типов поведения
- Доминирование методов глубокого обучения: Из-за сложности проблемы MBSR большинство работ используют методы глубокого обучения
- Отличная производительность Transformer: Демонстрирует превосходную производительность по сравнению с RNN и GNN в нескольких задачах
- Огромный потенциал гибридных методов: Гибридные архитектуры, сочетающие несколько технологий, могут достичь лучших результатов рекомендации
- Важность механизма внимания: Почти все выдающиеся методы используют ту или иную форму механизма внимания
- От одиночного к гибридному: Технологическое развитие эволюционирует от одиночной архитектуры к гибридной архитектуре
- От локального к глобальному: Перспектива моделирования расширяется от локальной последовательности к глобальной структуре графа
- От простого к сложному: Моделирование поведения развивается от простого встраивания к сложным отношениям переходов
- Последовательная рекомендация (Sequential Recommendation): Основа MBSR, но учитывает только одно поведение
- Многоповеденческая рекомендация (Multi-behavior Recommendation): Учитывает гетерогенное поведение, но игнорирует последовательность
- Рекомендация на основе сеанса (Session-based Recommendation): Рекомендация краткосрочных интерактивных последовательностей
- Федеративная рекомендация (Federated Recommendation): Рекомендация с защитой конфиденциальности
Традиционная совместная фильтрация → Матричная факторизация → Глубокое обучение → Графовые нейронные сети → Transformer → Гибридная архитектура
- Моделирование последовательности гетерогенного поведения: Как эффективно моделировать последовательные отношения различных типов поведения
- Моделирование отношений между поведениями: Захват зависимостей и отношений переходов между поведениями
- Интеграция долгосрочных и краткосрочных предпочтений: Одновременное моделирование долгосрочных стабильных предпочтений пользователя и краткосрочных динамических потребностей
- Обработка шума и смещения: Обработка шума в неявной обратной связи и проблем выбора смещения
- Уровень данных: Решение проблем разреженности, дисбаланса, периодичности и шума данных
- Технологический уровень: Повышение вычислительной эффективности, улучшение способности обобщения модели, интеграция нескольких дополняющих технологий
- Цели оптимизации: Переход от одноцелевой оптимизации к многоцелевой совместной оптимизации
- Большие языковые модели: Изучение потенциала применения LLM в MBSR
- Надежность: Повышение интерпретируемости модели, защита конфиденциальности и безопасности пользователей
- Полнота: Первый систематический обзор области MBSR с широким охватом
- Четкая структура: Многомерная система классификации логична и понятна, облегчает понимание и применение
- Глубокий анализ: Тщательный анализ преимуществ и недостатков каждого класса методов
- Перспективность: Предложенные будущие направления имеют сильную ценность руководства
- Практичность: Предоставляет исследователям и инженерам практическую техническую дорожную карту
- Отсутствие экспериментального сравнения: Как обзорная статья, в ней отсутствуют сравнительные эксперименты методов на единой базе
- Недостаточный анализ наборов данных: Недостаточный анализ характеристик и ограничений существующих наборов данных
- Ограниченное обсуждение промышленного применения: Недостаточное обсуждение опыта практического развертывания в промышленности
- Слабый теоретический анализ: Отсутствие теоретического анализа сложности проблемы MBSR и способности к обучению
- Академический вклад: Установление систематической системы знаний для новой области MBSR
- Практическая ценность: Предоставление важного справочника для проектирования систем многоповеденческой рекомендации в промышленности
- Руководство исследованиям: Уточнение технологической эволюции и будущих направлений в этой области
- Установление стандартов: Содействие установлению стандартов оценки и эталонов для области MBSR
- Введение в исследования: Предоставление начинающим полный обзор знаний в области
- Выбор технологии: Руководство инженерам в выборе подходящих методов MBSR
- Академические исследования: Предоставление исследователям справочной информации для определения направлений и точек инноваций
- Промышленное применение: Предоставление предприятиям технологической дорожной карты для построения систем многоповеденческой рекомендации
Данная статья ссылается на 107 соответствующих работ, охватывающих важные работы в нескольких областях, включая системы рекомендации, глубокое обучение и графовые нейронные сети, обеспечивая прочную теоретическую основу и техническую поддержку для исследований MBSR.
Резюме: Это высококачественная обзорная статья, систематически обобщающая текущее состояние исследований в новой области многоповеденческой последовательной рекомендации, закладывающая важную основу для развития этой области. Статья имеет четкую структуру и глубокий анализ, обладая важной ценностью для продвижения как теоретического развития, так и практического применения области MBSR.