Recommender systems is set up to address the issue of information overload in traditional information retrieval systems, which is focused on recommending information that is of most interest to users from massive information. Generally, there is a sequential nature and heterogeneity to the behavior of a person interacting with a system, leading to the proposal of multi-behavior sequential recommendation (MBSR). MBSR is a relatively new and worthy direction for in-depth research, which can achieve state-of-the-art recommendation through suitable modeling, and some related works have been proposed. This survey aims to shed light on the MBSR problem. Firstly, we introduce MBSR in detail, including its problem definition, application scenarios and challenges faced. Secondly, we detail the classification of MBSR, including neighborhood-based methods, matrix factorization-based methods and deep learning-based methods, where we further classify the deep learning-based methods into different learning architectures based on RNN, GNN, Transformer, and generic architectures as well as architectures that integrate hybrid techniques. In each method, we present related works based on the data perspective and the modeling perspective, as well as analyze the strengths, weaknesses and features of these works. Finally, we discuss some promising future research directions to address the challenges and improve the current status of MBSR.
Un Sondaggio sulla Raccomandazione Sequenziale Multi-Comportamento
- ID Articolo: 2308.15701
- Titolo: A Survey on Multi-Behavior Sequential Recommendation
- Autori: Xiaoqing Chen, Zhitao Li, Weike Pan, Zhong Ming
- Classificazione: cs.IR (Information Retrieval)
- Data di Pubblicazione: 30 agosto 2023 (preprint arXiv)
- Link Articolo: https://arxiv.org/abs/2308.15701
- Rivista: IEEE Transactions on Knowledge and Data Engineering
I sistemi di raccomandazione mirano a risolvere il problema del sovraccarico informativo nei sistemi tradizionali di recupero delle informazioni, concentrandosi sulla raccomandazione ai utenti dei contenuti di maggior interesse da una vasta quantità di informazioni. Le interazioni degli utenti con il sistema presentano tipicamente caratteristiche di sequenzialità ed eterogeneità, il che ha motivato la proposta della raccomandazione sequenziale multi-comportamento (MBSR). L'MBSR rappresenta una direzione relativamente nuova e meritevole di approfondimento, in grado di realizzare risultati di raccomandazione all'avanguardia attraverso una modellazione appropriata. Questo sondaggio mira a chiarire il problema dell'MBSR, descrivendo in dettaglio la sua definizione, scenari di applicazione e sfide affrontate, nonché classificare i metodi MBSR, inclusi metodi basati su vicinato, fattorizzazione matriciale e apprendimento profondo.
- Problema del sovraccarico informativo: Con la crescita esplosiva delle informazioni su Internet, gli utenti affrontano la sfida di ottenere rapidamente i contenuti necessari da una vasta quantità di informazioni
- Limitazioni dei sistemi di raccomandazione tradizionali:
- La raccomandazione a comportamento singolo (SBR) considera solo un singolo tipo di feedback dell'utente, incontrando facilmente problemi di scarsità dei dati e avvio a freddo
- I metodi di raccomandazione statici ignorano la natura temporale e i cambiamenti dinamici del comportamento dell'utente
- Eterogeneità comportamentale: Negli scenari reali, gli utenti e gli articoli presentano molteplici comportamenti di interazione (visualizzazione, aggiunta al carrello, acquisto, ecc.)
- Dipendenza sequenziale: Il comportamento dell'utente presenta caratteristiche temporali naturali, riflettendo i cambiamenti dinamici delle preferenze a breve e lungo termine
- Esigenze di applicazione pratica: Settori come l'e-commerce, la raccomandazione di video e la raccomandazione di notizie richiedono urgentemente algoritmi di raccomandazione più aderenti al comportamento reale dell'utente
- Sondaggio sistematico: Primo studio completo e sistematico del campo MBSR, colmando il vuoto della mancanza di sondaggi correlati in questo campo emergente
- Sistema di classificazione multidimensionale: Propone un framework di classificazione dei metodi MBSR basato su tre dimensioni: tecnologia, dati e modellazione
- Analisi tecnica approfondita: Analizza in dettaglio i vantaggi e gli svantaggi di ciascuna classe di metodi, fornendo ai ricercatori una chiara roadmap tecnica
- Guida alle direzioni future: Propone cinque direzioni di ricerca future di valore, fornendo orientamento per lo sviluppo del campo
Il problema MBSR si concentra principalmente sulla raccomandazione dell'articolo successivo in sequenze di feedback eterogeneo. Dato:
- Insieme di utenti U
- Insieme di articoli I
- Insieme di comportamenti F
L'input è costituito da coppie (utente, sequenza di comportamento eterogeneo): (u,Su), dove:
Su={(iu1,fu1),...,(iut,fut),...,(iu∣Su∣,fu∣Su∣)}
L'obiettivo è prevedere il valore di preferenza dell'utente u verso l'articolo candidato j al momento (t+1) r^u,t+1,j e generare un elenco di raccomandazioni Top-K.
- Idea centrale: Utilizza la similarità tra utenti o articoli per la raccomandazione
- Lavori rappresentativi: BIS (Bidirectional Item Similarity)
- Vantaggi: Facili da mantenere, forte interpretabilità
- Svantaggi: Mancanza di transitività, difficoltà nel catturare preferenze utente complesse
- Idea centrale: Fattorizza la matrice di interazione utente-articolo nel prodotto interno di matrici a basso rango
- Lavori rappresentativi: TransRec++
- Punti innovativi: Introduce vettori di transizione comportamentale per catturare relazioni sequenziali e dinamica comportamentale
- Limitazioni: La complessità del modello aumenta drasticamente con l'aumento dei tipi di comportamento
Architettura RNN
- RLBL: Combina RNN e modello log-bilineare, utilizzando matrici di transizione specifiche per comportamento
- RIB: Utilizza GRU e meccanismo di attenzione per modellare comportamenti microscopici
- BINN: Progetta CLSTM e Bi-CLSTM per elaborare informazioni multi-comportamento
- Vantaggi: Adatto per modellazione sequenziale, in grado di memorizzare memoria a breve termine
- Svantaggi: Problemi di scomparsa/esplosione del gradiente, bassa efficienza computazionale
Architettura GNN
- MGNN-SPred: Costruisce un grafo globale per catturare relazioni di transizione comportamentale
- DMBGN: Progettato per il compito di previsione del tasso di riscatto dei coupon
- GPG4HSR: Considera contemporaneamente grafo globale e grafo personalizzato
- BGNN: Distingue i modelli di transizione comportamentale omogenei e eterogenei
- Vantaggi: Può modellare relazioni complesse, forte nella gestione della scarsità dei dati
- Svantaggi: La complessità della costruzione del grafo aumenta con l'aumento dei tipi di comportamento
- DMT: Utilizza MMoE per l'apprendimento multi-task
- DFN: Elabora il rumore del feedback implicito attraverso reti di attenzione
- NextIP: Modella il problema come doppio compito di previsione articolo e previsione acquisto
- MB-STR: Progetta una funzione di codifica posizionale innovativa
- FLAG: Modella contemporaneamente preferenza locale, preferenza globale e intenzione locale
- Vantaggi: Forte capacità di calcolo parallelo, eccellente capacità di modellazione delle dipendenze a lungo termine
- Svantaggi: Cattura relativamente debole delle informazioni locali
Architettura Ibrida
- MKM-SR: Combina GNN e GRU per modellare rispettivamente sequenze di articoli e sequenze di comportamento
- KHGT: Fonde Transformer e GNN, considerando informazioni di relazione tra articoli
- Vantaggi: Sintetizza i vantaggi di più tecniche, miglioramento significativo delle prestazioni
- Svantaggi: Alta complessità del modello, difficile sintonizzazione dei parametri
- Raccomandazione e-commerce: Previsione del comportamento di acquisto dell'utente, considerando comportamenti ausiliari come visualizzazione, aggiunta al carrello, preferiti
- Raccomandazione video: Con condivisione come comportamento target e visualizzazione come comportamento ausiliario
- Raccomandazione notizie: Combinazione di feedback esplicito (non mi piace) e feedback implicito (visualizzazione)
- Metriche di accuratezza: Hit Rate, NDCG, Recall, Precision
- Metriche di diversità: Coverage, Diversity
- Metriche di efficienza: Tempo di addestramento, tempo di inferenza, consumo di memoria
- Sequenza di coppie (articolo, comportamento): Formato di input più comune
- Sottosequenze specifiche per comportamento: Sequenze di articoli segmentate per tipo di comportamento
- Sequenza di articoli indipendente dal comportamento: Sequenza di articoli ignorando il tipo di comportamento
- Sequenza di comportamento: Sequenza di puri tipi di comportamento
- Predominanza dei metodi di apprendimento profondo: A causa della complessità del problema MBSR, la maggior parte dei lavori adotta metodi di apprendimento profondo
- Prestazioni eccellenti di Transformer: Dimostra prestazioni superiori a RNN e GNN su più compiti
- Enorme potenziale dei metodi ibridi: Le architetture ibride che combinano più tecniche possono ottenere migliori risultati di raccomandazione
- Importanza del meccanismo di attenzione: Quasi tutti i metodi eccellenti adottano qualche forma di meccanismo di attenzione
- Da singolo a ibrido: L'evoluzione tecnologica procede da architetture singole verso architetture ibride
- Da locale a globale: La prospettiva di modellazione si estende da sequenze locali a strutture grafiche globali
- Da semplice a complesso: La modellazione comportamentale si sviluppa da embedding semplici a relazioni di transizione complesse
- Raccomandazione Sequenziale (Sequential Recommendation): Base dell'MBSR, ma considera solo comportamento singolo
- Raccomandazione Multi-Comportamento (Multi-behavior Recommendation): Considera comportamenti eterogenei ma ignora la sequenzialità
- Raccomandazione Basata su Sessione (Session-based Recommendation): Raccomandazione di sequenze di interazione a breve termine
- Raccomandazione Federata (Federated Recommendation): Raccomandazione sotto protezione della privacy
Filtraggio collaborativo tradizionale → Fattorizzazione matriciale → Apprendimento profondo → Reti neurali grafiche → Transformer → Architettura ibrida
- Modellazione di sequenze di comportamento eterogeneo: Come modellare efficacemente le relazioni sequenziali di diversi tipi di comportamento
- Modellazione delle relazioni tra comportamenti: Catturare le dipendenze e le relazioni di transizione tra comportamenti
- Fusione di preferenze a breve e lungo termine: Modellare contemporaneamente le preferenze stabili a lungo termine dell'utente e le esigenze dinamiche a breve termine
- Gestione del rumore e della distorsione: Affrontare il rumore nel feedback implicito e i problemi di distorsione di selezione
- Livello dei dati: Risolvere i problemi di scarsità, squilibrio, periodicità e rumore dei dati
- Livello tecnico: Migliorare l'efficienza computazionale, aumentare la capacità di generalizzazione del modello, combinare tecniche complementari
- Obiettivo di ottimizzazione: Passare dall'ottimizzazione a singolo obiettivo all'ottimizzazione congiunta multi-obiettivo
- Modelli di linguaggio di grandi dimensioni: Esplorare il potenziale di applicazione dei LLM nell'MBSR
- Affidabilità: Migliorare l'interpretabilità del modello, proteggere la privacy e la sicurezza degli utenti
- Completezza: Primo sondaggio sistematico del campo MBSR, con copertura ampia
- Struttura chiara: Il framework di classificazione multidimensionale è ben organizzato e facile da comprendere e applicare
- Analisi approfondita: L'analisi dei vantaggi e degli svantaggi di ciascuna classe di metodi è profonda e penetrante
- Prospettiva futura: Le direzioni future proposte hanno un forte valore guida
- Praticità: Fornisce ai ricercatori e agli ingegneri una roadmap tecnica pratica
- Mancanza di confronti sperimentali: Come articolo di sondaggio, mancano esperimenti di confronto dei metodi sotto benchmark unificati
- Analisi insufficiente dei dataset: Analisi limitata delle caratteristiche e delle limitazioni dei dataset esistenti
- Discussione limitata sulle applicazioni industriali: Discussione insufficiente sull'esperienza di distribuzione pratica nell'industria
- Analisi teorica debole: Manca l'analisi della complessità del problema MBSR e dell'apprendibilità
- Contributo accademico: Stabilisce un sistema di conoscenze sistematico per il campo emergente dell'MBSR
- Valore pratico: Fornisce riferimenti importanti per la progettazione di sistemi di raccomandazione multi-comportamento nell'industria
- Guida della ricerca: Chiarisce il percorso di sviluppo tecnologico e le direzioni future del campo
- Definizione di standard: Aiuta a promuovere l'istituzione di standard di valutazione e benchmark nel campo dell'MBSR
- Introduzione alla ricerca: Fornisce una panoramica completa della conoscenza del dominio per i principianti
- Selezione tecnologica: Fornisce orientamento agli ingegneri nella scelta di metodi MBSR appropriati
- Ricerca accademica: Fornisce riferimenti ai ricercatori per determinare direzioni di ricerca e punti di innovazione
- Applicazione industriale: Fornisce roadmap tecnologiche alle aziende per costruire sistemi di raccomandazione multi-comportamento
Questo articolo fa riferimento a 107 articoli correlati, che coprono importanti lavori in più campi inclusi sistemi di raccomandazione, apprendimento profondo e reti neurali grafiche, fornendo una base teorica solida e supporto tecnico per la ricerca MBSR.
Riepilogo: Questo è un articolo di sondaggio di alta qualità che sistematicamente esamina lo stato attuale della ricerca nel campo emergente della raccomandazione sequenziale multi-comportamento, gettando le basi importanti per lo sviluppo del campo. La struttura dell'articolo è chiara, l'analisi è profonda e ha un valore importante nel promuovere lo sviluppo teorico e l'applicazione pratica del campo MBSR.