2025-11-18T04:46:12.048153

A Survey on Multi-Behavior Sequential Recommendation

Chen, Li, Pan et al.
Recommender systems is set up to address the issue of information overload in traditional information retrieval systems, which is focused on recommending information that is of most interest to users from massive information. Generally, there is a sequential nature and heterogeneity to the behavior of a person interacting with a system, leading to the proposal of multi-behavior sequential recommendation (MBSR). MBSR is a relatively new and worthy direction for in-depth research, which can achieve state-of-the-art recommendation through suitable modeling, and some related works have been proposed. This survey aims to shed light on the MBSR problem. Firstly, we introduce MBSR in detail, including its problem definition, application scenarios and challenges faced. Secondly, we detail the classification of MBSR, including neighborhood-based methods, matrix factorization-based methods and deep learning-based methods, where we further classify the deep learning-based methods into different learning architectures based on RNN, GNN, Transformer, and generic architectures as well as architectures that integrate hybrid techniques. In each method, we present related works based on the data perspective and the modeling perspective, as well as analyze the strengths, weaknesses and features of these works. Finally, we discuss some promising future research directions to address the challenges and improve the current status of MBSR.
academic

다중행동 순차 추천에 관한 조사

기본 정보

  • 논문 ID: 2308.15701
  • 제목: A Survey on Multi-Behavior Sequential Recommendation
  • 저자: Xiaoqing Chen, Zhitao Li, Weike Pan, Zhong Ming
  • 분류: cs.IR (정보 검색)
  • 발표 시간: 2023년 8월 30일 (arXiv 사전인쇄본)
  • 논문 링크: https://arxiv.org/abs/2308.15701
  • 저널: IEEE Transactions on Knowledge and Data Engineering

초록

추천 시스템은 전통적인 정보 검색 시스템의 정보 과부하 문제를 해결하기 위해 설계되었으며, 방대한 정보에서 사용자가 가장 관심 있는 콘텐츠를 추천하는 데 중점을 둡니다. 사용자와 시스템의 상호작용 행동은 일반적으로 순차성과 이질성의 특징을 가지고 있으며, 이는 다중행동 순차 추천(MBSR)의 제안을 촉발했습니다. MBSR은 상대적으로 새로운 분야이며 심층적인 연구의 가치가 있으며, 적절한 모델링을 통해 최첨단 추천 효과를 달성할 수 있습니다. 본 조사는 MBSR 문제를 명확히 하고, 문제 정의, 응용 시나리오 및 직면한 과제를 상세히 소개하며, 이웃 기반 방법, 행렬 분해 방법 및 심층 학습 방법을 포함한 MBSR 방법을 분류합니다.

연구 배경 및 동기

문제 배경

  1. 정보 과부하 문제: 인터넷 정보의 폭발적 증가로 사용자는 방대한 정보에서 필요한 콘텐츠를 빠르게 획득하는 과제에 직면
  2. 전통적 추천 시스템의 한계:
    • 단일행동 추천(SBR)은 단일 유형의 사용자 피드백만 고려하여 데이터 희소성 및 콜드 스타트 문제에 쉽게 직면
    • 정적 추천 방법은 사용자 행동의 시간 순서성과 동적 변화를 무시

연구 동기

  1. 행동 이질성: 실제 시나리오에서 사용자와 항목 간에는 다양한 상호작용 행동(조회, 장바구니 추가, 구매 등)이 존재
  2. 순차 의존성: 사용자 행동은 자연스러운 시간 순서 특징을 가지며, 단기 선호도와 장기 선호도의 동적 변화를 반영
  3. 실제 응용 수요: 전자상거래, 비디오 추천, 뉴스 추천 등 분야에서 실제 사용자 행동에 더 가까운 추천 알고리즘이 절실

핵심 기여

  1. 체계적 조사: MBSR 분야에 대한 최초의 포괄적이고 체계적인 조사로, 이 신흥 분야의 관련 조사 부재를 보완
  2. 다차원 분류 체계: 기술, 데이터 및 모델링 세 가지 차원을 기반으로 한 MBSR 방법 분류 프레임워크 제시
  3. 심층 기술 분석: 각 유형의 방법의 장단점을 상세히 분석하여 연구자에게 명확한 기술 로드맵 제공
  4. 향후 방향 지도: 다섯 가지 가치 있는 향후 연구 방향을 제시하여 해당 분야의 발전에 지도 제공

방법 상세 설명

작업 정의

MBSR 문제는 주로 이질적 피드백 순서에서 다음 항목 추천에 중점을 둡니다. 주어진:

  • 사용자 집합 U
  • 항목 집합 I
  • 행동 집합 F

입력은 (사용자, 이질적 행동 순서) 쌍: (u,Su)(u, S_u)이며, 여기서: Su={(iu1,fu1),...,(iut,fut),...,(iuSu,fuSu)}S_u = \{(i_u^1, f_u^1), ..., (i_u^t, f_u^t), ..., (i_u^{|S_u|}, f_u^{|S_u|})\}

목표는 사용자 u가 시간 (t+1)에 후보 항목 j에 대한 선호도 값 r^u,t+1,j\hat{r}_{u,t+1,j}를 예측하고 상위-K 추천 목록을 생성하는 것입니다.

분류 체계

1. 이웃 기반 방법

  • 핵심 개념: 사용자 또는 항목 간의 유사성을 활용한 추천
  • 대표 작업: BIS (양방향 항목 유사성)
  • 장점: 유지보수가 용이하고 해석 가능성이 높음
  • 단점: 전이성 부족, 복잡한 사용자 선호도 포착 어려움

2. 행렬 분해 기반 방법

  • 핵심 개념: 사용자-항목 상호작용 행렬을 저순위 행렬의 내적으로 분해
  • 대표 작업: TransRec++
  • 혁신점: 순차 관계와 행동 동적성을 포착하기 위해 행동 전이 벡터 도입
  • 한계: 행동 유형이 증가할 때 모델 복잡도가 급격히 상승

3. 심층 학습 기반 방법(주요 내용)

RNN 아키텍처
  • RLBL: RNN과 로그-쌍선형 모델을 결합하여 행동 특정 전이 행렬 사용
  • RIB: GRU와 주의 메커니즘을 활용한 미시적 행동 모델링
  • BINN: 다중행동 정보 처리를 위해 CLSTM 및 양방향 CLSTM 설계
  • 장점: 순차 모델링에 적합하며 단기 기억 저장 가능
  • 단점: 기울기 소실/폭발 문제, 계산 효율성 저하
GNN 아키텍처
  • MGNN-SPred: 행동 전이 관계를 포착하기 위해 전역 그래프 구성
  • DMBGN: 쿠폰 환전율 예측 작업을 위해 설계
  • GPG4HSR: 전역 그래프와 개인화된 그래프를 동시에 고려
  • BGNN: 동형 및 이형 행동 전이 패턴 구분
  • 장점: 복잡한 관계 모델링 가능, 데이터 희소성 처리 강함
  • 단점: 행동 유형 증가 시 그래프 구성 복잡도 상승
Transformer 아키텍처
  • DMT: 다중 작업 학습을 위해 MMoE 사용
  • DFN: 주의 네트워크를 통한 암묵적 피드백 노이즈 처리
  • NextIP: 항목 예측 및 구매 예측 이중 작업으로 문제 모델링
  • MB-STR: 새로운 위치 인코딩 함수 설계
  • FLAG: 지역 선호도, 전역 선호도 및 지역 의도를 동시에 모델링
  • 장점: 병렬 계산 능력이 강하고 장기 의존성 모델링 능력 우수
  • 단점: 지역 정보 포착이 상대적으로 약함
혼합 아키텍처
  • MKM-SR: GNN과 GRU를 결합하여 각각 항목 순서와 행동 순서 모델링
  • KHGT: Transformer와 GNN을 융합하여 항목 관계 정보 고려
  • 장점: 다양한 기술의 장점을 종합하여 성능 향상 현저
  • 단점: 모델 복잡도 높음, 하이퍼파라미터 튜닝 어려움

실험 설정

응용 시나리오

  1. 전자상거래 추천: 사용자 구매 행동 예측, 조회, 장바구니 추가, 찜하기 등 보조 행동 고려
  2. 비디오 추천: 공유를 목표 행동으로, 조회를 보조 행동으로 설정
  3. 뉴스 추천: 명시적 피드백(싫어함)과 암묵적 피드백(조회) 결합

평가 지표

  • 정확성 지표: Hit Rate, NDCG, Recall, Precision
  • 다양성 지표: Coverage, Diversity
  • 효율성 지표: 훈련 시간, 추론 시간, 메모리 소비

데이터 관점 분류

  1. (항목, 행동) 쌍 순서: 가장 일반적인 입력 형식
  2. 행동 특정 부분 순서: 행동 유형별로 분할된 항목 순서
  3. 행동 무관 항목 순서: 행동 유형을 무시한 항목 순서
  4. 행동 순서: 순수 행동 유형 순서

실험 결과

주요 발견

  1. 심층 학습 방법의 주도: MBSR 문제의 복잡성으로 인해 대부분의 작업이 심층 학습 방법 채택
  2. Transformer의 우수한 성능: 다양한 작업에서 RNN 및 GNN보다 우수한 성능 입증
  3. 혼합 방법의 거대한 잠재력: 다양한 기술을 결합한 혼합 아키텍처가 더 나은 추천 효과 달성
  4. 주의 메커니즘의 중요성: 거의 모든 우수한 방법이 어떤 형태의 주의 메커니즘 채택

기술 동향

  1. 단일에서 혼합으로: 기술 발전 추세가 단일 아키텍처에서 혼합 아키텍처로 진화
  2. 지역에서 전역으로: 모델링 관점이 지역 순서에서 전역 그래프 구조로 확대
  3. 단순에서 복잡으로: 행동 모델링이 단순 임베딩에서 복잡한 전이 관계로 발전

관련 연구

연관 연구 분야

  1. 순차 추천(Sequential Recommendation): MBSR의 기초이나 단일 행동만 고려
  2. 다중행동 추천(Multi-behavior Recommendation): 이질적 행동을 고려하나 순차성 무시
  3. 세션 기반 추천(Session-based Recommendation): 단기 상호작용 순서 추천
  4. 연합 추천(Federated Recommendation): 개인정보 보호 하의 추천

기술 진화 경로

전통적 협업 필터링 → 행렬 분해 → 심층 학습 → 그래프 신경망 → Transformer → 혼합 아키텍처

결론 및 토론

주요 과제

  1. 이질적 행동 순서 모델링: 다양한 유형의 행동 순서 관계를 효과적으로 모델링하는 방법
  2. 행동 간 관계 모델링: 행동 간의 의존성 및 전이 관계 포착
  3. 장단기 선호도 융합: 사용자의 장기 안정적 선호도와 단기 동적 수요를 동시에 모델링
  4. 노이즈 및 편향 처리: 암묵적 피드백의 노이즈 및 선택 편향 문제 처리

향후 방향

  1. 데이터 계층: 데이터 희소성, 불균형, 주기성 및 노이즈 문제 해결
  2. 기술 계층: 계산 효율성 향상, 모델 일반화 능력 강화, 다양한 상호보완적 기술 결합
  3. 최적화 목표: 단일 목표 최적화에서 다중 목표 결합 최적화로 전환
  4. 대규모 언어 모델: MBSR에서 LLM의 응용 잠재력 탐색
  5. 신뢰성: 모델 해석 가능성 향상, 사용자 개인정보 보호

심층 평가

장점

  1. 포괄성: MBSR 분야에 대한 최초의 체계적 조사로 광범위한 범위 커버
  2. 명확한 구조: 다차원 분류 프레임워크가 조리 있고 이해 및 응용에 편리
  3. 심층 분석: 각 유형의 방법의 장단점 분석이 심도 있고 철저
  4. 전망성: 제시된 향후 방향이 매우 강한 지도 가치 보유
  5. 실용성: 연구자 및 엔지니어에게 실용적인 기술 로드맵 제공

부족한 점

  1. 실험 비교 부재: 조사 논문으로서 통일된 기준 하의 방법 비교 실험 부족
  2. 데이터셋 분석 부족: 기존 데이터셋의 특징 및 한계에 대한 분석 미흡
  3. 산업 응용 논의 제한: 산업계의 실제 배포 경험에 대한 논의 불충분
  4. 이론 분석 약함: MBSR 문제의 복잡도 및 학습 가능성에 대한 이론 분석 부재

영향력

  1. 학술 기여: 신흥 MBSR 분야에 체계적인 지식 체계 구축
  2. 실용 가치: 산업계 다중행동 추천 시스템 설계에 중요한 참고 제공
  3. 연구 지도: 해당 분야의 기술 발전 맥락 및 향후 방향 명확화
  4. 표준 제정: MBSR 분야 평가 표준 및 기준 수립 추진에 기여

적용 시나리오

  1. 연구 입문: 초학자에게 포괄적인 분야 지식 개요 제공
  2. 기술 선택: 엔지니어가 적절한 MBSR 방법 선택에 지도 제공
  3. 학술 연구: 연구자가 연구 방향 및 혁신점 결정에 참고 제공
  4. 산업 응용: 기업이 다중행동 추천 시스템 구축에 기술 로드맵 제공

참고 문헌

본 논문은 107편의 관련 문헌을 참고하였으며, 추천 시스템, 심층 학습, 그래프 신경망 등 다양한 분야의 중요한 작업을 포함하여 MBSR 연구에 견고한 이론적 기초 및 기술 지원을 제공합니다.


요약: 이는 고품질의 조사 논문으로, 다중행동 순차 추천이라는 신흥 분야의 연구 현황을 체계적으로 정리하여 해당 분야의 발전에 중요한 기초를 마련했습니다. 논문의 구조가 명확하고 분석이 심도 있으며, MBSR 분야의 이론 발전 및 실제 응용 추진에 중요한 가치를 가집니다.