Sequential recommendation aims to predict the next item based on user interests in historical interaction sequences. Historical interaction sequences often contain irrelevant noisy items, which significantly hinders the performance of recommendation systems. Existing research employs unsupervised methods that indirectly identify item-granularity irrelevant noise by predicting the ground truth item. Since these methods lack explicit noise labels, they are prone to misidentify users' interested items as noise. Additionally, while these methods focus on removing item-granularity noise driven by the ground truth item, they overlook interest-granularity noise, limiting their ability to perform broader denoising based on user interests. To address these issues, we propose Multi-Granularity Sequence Denoising with Weakly Supervised Signal for Sequential Recommendation(MGSD-WSS). MGSD-WSS first introduces the Multiple Gaussian Kernel Perceptron module to map the original and enhance sequence into a common representation space and utilizes weakly supervised signals to accurately identify noisy items in the historical interaction sequence. Subsequently, it employs the item-granularity denoising module with noise-weighted contrastive learning to obtain denoised item representations. Then, it extracts target interest representations from the ground truth item and applies noise-weighted contrastive learning to obtain denoised interest representations. Finally, based on the denoised item and interest representations, MGSD-WSS predicts the next item. Extensive experiments on five datasets demonstrate that the proposed method significantly outperforms state-of-the-art sequence recommendation and denoising models. Our code is available at https://github.com/lalunex/MGSD-WSS.
- 논문 ID: 2510.10564
- 제목: Multi-Granularity Sequence Denoising with Weakly Supervised Signal for Sequential Recommendation
- 저자: Liang Li (충칭이공대학교), Zhou Yang (푸저우대학교), Xiaofei Zhu (충칭이공대학교)
- 분류: cs.IR (정보 검색)
- 발표 시간: 2025년 10월 12일 (arXiv 사전인쇄본)
- 논문 링크: https://arxiv.org/abs/2510.10564
- 코드 링크: https://github.com/lalunex/MGSD-WSS
순차 추천은 사용자의 과거 상호작용 시퀀스에서의 관심사를 기반으로 다음 아이템을 예측하는 것을 목표로 한다. 과거 상호작용 시퀀스는 일반적으로 무관한 노이즈 아이템을 포함하고 있으며, 이는 추천 시스템의 성능을 크게 저해한다. 기존 연구는 실제 아이템을 예측하여 간접적으로 아이템 입도의 무관한 노이즈를 식별하는 비감독 방법을 채택한다. 이러한 방법들은 명시적인 노이즈 레이블이 부족하여 사용자가 관심 있는 아이템을 노이즈로 오인식하기 쉽다. 또한 이러한 방법들은 실제 아이템에 의해 주도되는 아이템 입도 노이즈 제거에 중점을 두지만, 관심사 입도 노이즈를 간과하여 사용자 관심사를 기반으로 한 보다 광범위한 노이즈 제거 능력을 제한한다. 이러한 문제들을 해결하기 위해 본 논문은 약한 감독 신호를 이용한 다중 입도 시퀀스 노이즈 제거 순차 추천 방법(MGSD-WSS)을 제안한다.
순차 추천 시스템이 직면한 핵심 문제는 과거 상호작용 시퀀스에 의도하지 않은 클릭 및 악의적 허위 상호작용과 같은 노이즈 아이템이 존재하여 추천 시스템의 성능을 크게 저하시킨다는 것이다.
- 소프트 노이즈 제거 방법: 주의 메커니즘 또는 필터링 알고리즘을 통해 노이즈 아이템의 가중치를 조정하지만, 노이즈 영향을 완전히 제거할 수 없다.
- 하드 노이즈 제거 방법: 노이즈 검출 신호를 생성하여 노이즈 아이템을 명시적으로 제거하지만 다음과 같은 문제가 있다:
- 실제 노이즈 레이블이 아닌 실제 아이템을 사용하여 모델이 노이즈를 식별하도록 지도하므로 정확성이 제한적이다.
- 아이템 입도 노이즈 제거에만 집중하고 관심사 입도의 노이즈를 간과한다.
- 명시적인 노이즈 레이블의 부재로 인해 기존 비감독 방법이 사용자가 관심 있는 아이템을 오인식하기 쉽다.
- 사용자 상호작용은 특정 아이템 선호도뿐만 아니라 더 높은 수준의 관심사(예: "스포츠" 관심사는 축구, 운동화, 러닝머신 등을 포함)를 반영한다.
- 노이즈를 보다 포괄적으로 제거하기 위해 여러 입도에서 계층적 노이즈 제거가 필요하다.
- 약한 감독 신호의 최초 도입: 표시된 약한 감독 신호를 통해 모델을 직접 훈련하여 노이즈 식별을 수행하며, 기존 비감독 방법의 부정확성을 극복한다.
- 다중 입도 계층적 노이즈 제거: 아이템 입도 및 관심사 입도의 계층적 노이즈 제거 모듈을 제안하며, 노이즈 가중 대조 학습과 함께 제공한다.
- 혁신적인 아키텍처 설계:
- Multiple Gaussian Kernel Perceptron (MGP) 모듈
- Target-aware Sequence Encoding
- 노이즈 가중 대조 학습 프레임워크
- 현저한 성능 향상: 5개 데이터셋에서 최첨단 순차 추천 및 노이즈 제거 모델을 크게 능가한다.
사용자 집합 U={u1,u2,…,u∣U∣}와 아이템 집합 V={v1,v2,…,v∣V∣}가 주어졌을 때, 각 사용자 u∈U는 시간 순서로 정렬된 과거 상호작용 시퀀스 S=[s1,s2,…,sn]과 연관된다. 목표는 상호작용 시퀀스 S를 활용하여 사용자가 (n+1) 단계에서 가장 가능성 높게 상호작용할 아이템을 예측하는 것이다. 즉, p(sn+1∣s1:n)을 예측한다.
MGSD-WSS는 세 가지 핵심 구성 요소로 이루어진다:
시퀀스 데이터 증강:
- 원본 시퀀스에 삽입할 t개의 서로 다른 아이템을 무작위로 선택한다.
- 증강 시퀀스 Sˉ=[sˉ1,sˉ2,…,sˉn+t]를 구성한다.
- 노이즈 위치를 표시하는 감독 신호 Yˉ=[yˉ1,yˉ2,…,yˉn+t]를 획득한다.
Multiple Gaussian Kernel Perceptron (MGP):
- 목표 아이템과 시퀀스의 각 아이템 간 코사인 유사도를 계산한다:
αˉi=cos(hˉn+1,hˉi)
- k개의 가우시안 커널을 사용하여 관련성 점수를 변환한다:
rij=exp(−2σj2(αˉi−μj)2)h^i=∑j=1krijhˉi
- Transformer 인코더를 통해 풍부한 표현을 획득한다:
G=Transformer(H^+P)
공유된 아이템 수준 노이즈 판별기를 사용하여 증강 시퀀스의 노이즈 아이템을 검출한다:
βi=Softmax((ReLU(gˉiW1+b1))W2)
MSE 손실을 통해 노이즈 검출 신호와 감독 신호 간의 차이를 최소화한다:
MSE=n1∑i=1n(βi0−yˉi)2
아이템 입도 노이즈 제거:
- Gumbel-softmax를 사용하여 노이즈 검출 신호를 이진 하드 값으로 변환한다.
- 노이즈 아이템을 필터링하여 노이즈 제거 표현 행렬을 구성한다.
- 노이즈 가중 대조 학습을 적용한다:
ITSCL=−∣G+∣1∑gi∈G+log∑gj∈Gω(gj)⋅exp(sim(ese,gj)/τ)ω(gi)⋅exp(sim(ese,gi)/τ)
관심사 입도 노이즈 제거:
- 학습 가능한 관심사 표현 행렬 Q=[q1,q2,…,qm]을 도입한다.
- 아이템과 관심사 간의 관련성 점수를 계산한다.
- 목표 인식 관심사 주의를 사용하여 관심사 신뢰성을 평가한다.
- 관심사 입도 노이즈 가중 대조 학습을 적용한다.
- 약한 감독 신호 생성: 데이터 증강 전략을 통해 명시적인 노이즈 레이블을 생성하여 정확한 감독 신호를 제공한다.
- 다중 입도 노이즈 제거: 아이템 및 관심사 두 입도에서 동시에 노이즈 제거를 수행하여 시퀀스 노이즈를 보다 포괄적으로 처리한다.
- 노이즈 가중 대조 학습: 노이즈 정도에 따라 샘플에 가중치를 할당하여 기존의 동일 가중치 대조 학습을 능가한다.
- 가우시안 커널 인식기: 다양한 유사성 영역의 정보를 포착하여 시퀀스 표현을 강화한다.
5개의 공개 벤치마크 데이터셋을 사용한다:
| 데이터셋 | 시퀀스 수 | 사용자 수 | 아이템 수 | 평균 길이 | 희소성 |
|---|
| ML-100k | 99,287 | 944 | 1,350 | 105.29 | 92.21% |
| Beauty | 198,502 | 22,364 | 12,102 | 8.88 | 99.93% |
| Sports | 296,337 | 35,599 | 18,358 | 8.32 | 99.95% |
| Yelp | 316,354 | 30,432 | 20,034 | 10.40 | 99.95% |
| ML-1M | 999,611 | 6,041 | 3,417 | 165.50 | 95.16% |
- Hit Ratio (HR@{5, 10, 20})
- Normalized Discounted Cumulative Gain (NDCG@{5, 10, 20})
- Mean Reciprocal Rank (MRR@20)
순차 추천 기준선:
- GRU4Rec, NARM, STAMP, CASER, SASRec, BERT4Rec
노이즈 제거 기준선:
- DSAN, FMLP-Rec, HSD+BERT4Rec, AC-BERT4Rec, MSDCCL+BERT4Rec
- 임베딩 차원: 100
- 배치 크기: 256
- 학습률: 10^-3
- 가우시안 커널 수: 10개
- 온도 매개변수: τ = 0.5
순차 추천 기준선과의 비교:
MGSD-WSS를 다양한 주류 순차 추천 모델과 결합한 후, 모든 데이터셋에서 현저한 성능 향상을 달성했다. ML-100k 데이터셋에서 MGSD-WSS+BERT4Rec은 원본 BERT4Rec 대비 HR@20, NDCG@20, MRR@20에서 각각 167.43%, 195.87%, 235.67% 향상되었다.
노이즈 제거 기준선과의 비교:
대부분의 지표에서 MGSD-WSS+BERT4Rec이 다른 노이즈 제거 기준선을 능가하며, 특히 ML-100k 및 ML-1M 데이터셋에서 뛰어난 성능을 보인다. ML-1M 데이터셋에서 최강 기준선인 MSDCCL+BERT4Rec 대비 각 지표의 향상 폭은 30.80%-60.94%이다.
각 모듈 제거 후의 성능 저하 분석:
- w/o AND (보조 노이즈 판별 없음): 최대 성능 저하로 약한 감독 신호의 중요성을 입증한다.
- w/o InSD (관심사 입도 노이즈 제거 없음): Beauty, Sports, ML-1M 데이터셋에서 성능에 현저한 영향을 미친다.
- w/o ItSD (아이템 입도 노이즈 제거 없음): ML-100k 및 Yelp 데이터셋에서 최대 영향을 미친다.
- w/o MGP (다중 가우시안 커널 인식기 없음): 성능 저하를 초래하며 해당 모듈의 효과성을 검증한다.
기존 대조 학습과 비교하여, 노이즈 가중 대조 학습은 ML-100k 데이터셋에서 HR@20, NDCG@20, MRR@20을 각각 12.59%, 10.63%, 9.48% 향상시켜 정확한 가중치 할당의 효과성을 입증한다.
노이즈 아이템 수 t:
- 적절한 수의 노이즈 아이템은 모델이 실제 선호도와 노이즈를 구분하는 데 도움이 된다.
- 과도한 노이즈는 정보 신호를 희석시켜 성능 저하를 초래한다.
사용자 관심사 수 m:
- m=5일 때 최적 성능을 달성한다.
- 과도한 관심사는 무관한 정보를 도입하여 성능을 저하시킬 수 있다.
초기 마르코프 연쇄 방법에서 RNN, LSTM, CNN, 주의 메커니즘, 그래프 신경망 등의 심층 학습 방법으로 발전했다. 최근 연구는 외부 지식 그래프, 교차 도메인 정보 및 다중 모달 학습 프레임워크를 통합한다.
소프트 노이즈 제거(가중치 조정)와 하드 노이즈 제거(직접 제거) 두 가지로 분류된다. 기존 하드 노이즈 제거 방법은 주로 실제 아이템 지도에 의존하며, 실제 노이즈 레이블이 부족하고 아이템 입도에만 집중한다.
추천 시스템에서 고품질 표현을 추출하는 데 사용되지만, 기존 방법은 모든 샘플을 동등하게 취급하여 샘플 중요도 차이를 간과한다.
- 약한 감독 신호는 노이즈 식별 정확성을 크게 향상시킨다.
- 다중 입도 노이즈 제거는 단일 아이템 입도 노이즈 제거보다 더 효과적이다.
- 노이즈 가중 대조 학습은 기존 대조 학습을 능가한다.
- 모델은 다양한 시퀀스 길이에서 견고성을 유지한다.
- 단시간 시퀀스 데이터셋(Beauty, Sports, Yelp)에서 일부 지표 성능이 이상적이지 않다.
- 노이즈 도입은 단시간 시퀀스에 정보 오염을 초래할 수 있다.
- 사용자 관심사 수 등 초매개변수를 미리 설정해야 한다.
- 다양한 가우시안 커널 설정의 영향을 연구한다.
- 적대적 또는 휴리스틱 노이즈 생성 전략을 탐색한다.
- 관심사 구성에 대한 이론적 또는 데이터 기반의 합리성 분석을 제공한다.
- 높은 혁신성: 순차 추천에서 약한 감독 노이즈 제거를 최초로 적용하며, 다중 입도 노이즈 제거 프레임워크를 제안한다.
- 완전한 방법: 노이즈 검출에서 다중 입도 노이즈 제거까지의 완전한 솔루션이다.
- 충분한 실험: 5개 데이터셋, 다양한 기준선, 상세한 제거 실험 및 매개변수 분석이 있다.
- 합리적인 이론: 노이즈 가중 대조 학습은 명확한 이론적 동기를 가진다.
- 우수한 성능: 대부분의 지표에서 기존 방법을 현저히 능가한다.
- 적용성 제한: 단시간 시퀀스 데이터셋에서 성능이 불안정하다.
- 계산 복잡도: 다중 입도 노이즈 제거 및 대조 학습이 계산 오버헤드를 증가시킨다.
- 매개변수 민감도: 노이즈 수, 관심사 수 등 매개변수를 신중히 조정해야 한다.
- 노이즈 생성 전략: 무작위 노이즈 삽입이 충분히 현실적이지 않을 수 있다.
- 학술적 가치: 순차 추천 노이즈 제거에 새로운 연구 방향을 제공한다.
- 실용적 가치: 실제 추천 시스템에 적용하여 성능을 향상시킬 수 있다.
- 재현성: 상세한 구현 세부사항과 코드를 제공한다.
- 장시간 사용자 상호작용 데이터의 추천 시스템
- 노이즈가 많은 추천 시나리오(전자상거래, 비디오 플랫폼 등)
- 세밀한 사용자 관심사 모델링이 필요한 애플리케이션
논문은 순차 추천, 노이즈 제거 방법, 대조 학습 등 분야의 중요한 연구를 인용하며, 다음을 포함한다:
- 순차 추천 고전 방법: GRU4Rec, SASRec, BERT4Rec
- 노이즈 제거 관련 연구: HSD, MSDCCL 등
- 대조 학습 방법: CL4SRec, ICL 등
본 논문은 순차 추천의 노이즈 처리 문제에 대한 혁신적인 솔루션을 제공하며, 이론과 실무 모두에서 중요한 가치를 가진다.