ReMindRAG: Low-Cost LLM-Guided Knowledge Graph Traversal for Efficient RAG
Hu, Zhu, Tang et al.
Knowledge graphs (KGs), with their structured representation capabilities, offer promising avenue for enhancing Retrieval Augmented Generation (RAG) systems, leading to the development of KG-RAG systems. Nevertheless, existing methods often struggle to achieve effective synergy between system effectiveness and cost efficiency, leading to neither unsatisfying performance nor excessive LLM prompt tokens and inference time. To this end, this paper proposes REMINDRAG, which employs an LLM-guided graph traversal featuring node exploration, node exploitation, and, most notably, memory replay, to improve both system effectiveness and cost efficiency. Specifically, REMINDRAG memorizes traversal experience within KG edge embeddings, mirroring the way LLMs "memorize" world knowledge within their parameters, but in a train-free manner. We theoretically and experimentally confirm the effectiveness of REMINDRAG, demonstrating its superiority over existing baselines across various benchmark datasets and LLM backbones. Our code is available at https://github.com/kilgrims/ReMindRAG.
academic
ReMindRAG: Attraversamento di Grafi di Conoscenza Guidato da LLM a Basso Costo per RAG Efficiente
I grafi di conoscenza (KG), grazie alla loro capacità di rappresentazione strutturata, forniscono un percorso promettente per potenziare i sistemi di generazione aumentata da recupero (RAG), promuovendo lo sviluppo di sistemi KG-RAG. Tuttavia, i metodi esistenti spesso faticano a raggiungere una sinergia efficace tra l'efficacia del sistema e l'efficienza dei costi, portando a prestazioni scadenti o a un eccessivo consumo di token di prompt LLM e tempo di inferenza. A tal fine, questo articolo propone REMINDRAG, che adotta l'attraversamento di grafi guidato da LLM, includendo l'esplorazione di nodi, lo sfruttamento di nodi e, soprattutto, un meccanismo di riproduzione della memoria per migliorare l'efficacia del sistema e l'efficienza dei costi. Nello specifico, REMINDRAG memorizza l'esperienza di attraversamento negli embedding dei bordi KG, in modo simile a come gli LLM "memorizzano" la conoscenza del mondo nei loro parametri, ma adottando un approccio senza addestramento. Abbiamo confermato l'efficacia di REMINDRAG sia da una prospettiva teorica che sperimentale, dimostrando la sua superiorità rispetto ai metodi di base esistenti su vari set di dati di benchmark e backbone LLM.
I metodi RAG tradizionali si basano principalmente sul recupero di vettori densi per identificare segmenti di testo rilevanti, ma mostrano prestazioni limitate in compiti complessi che richiedono ragionamento multi-hop o cattura di dipendenze a lungo raggio. I grafi di conoscenza, con la loro rappresentazione strutturata di entità e relazioni, forniscono un nuovo percorso per affrontare questo problema.
Algoritmi di ricerca su grafi tradizionali: come PageRank e metodi GNN, faticano a catturare relazioni semantiche raffinate nel grafo, portando a un'efficacia del sistema insufficiente
Metodi di attraversamento di grafi guidati da LLM: sebbene mostrino prestazioni eccellenti, richiedono numerose chiamate LLM, aumentando significativamente i costi e il tempo di inferenza
Compromesso tra efficienza ed efficacia: i sistemi KG-RAG esistenti faticano a trovare un equilibrio efficace tra l'efficacia del sistema e l'efficienza dei costi
Questo articolo mira ad affrontare il problema dell'ottimizzazione sinergica tra l'efficacia del sistema e l'efficienza dei costi nei sistemi KG-RAG, che rappresenta una sfida principale per la distribuzione pratica e la scalabilità.
Identificazione delle sfide critiche: evidenzia chiaramente la sfida dell'ottimizzazione sinergica tra l'efficacia del sistema e l'efficienza dei costi nei sistemi KG-RAG
Proposta del framework REMINDRAG: adotta l'attraversamento KG guidato da LLM, includendo esplorazione di nodi, sfruttamento di nodi e meccanismo di riproduzione della memoria
Analisi teorica: dimostra teoricamente l'efficacia della riproduzione della memoria nell'attraversamento di grafi
Verifica sperimentale: valida la superiorità di REMINDRAG su più set di dati di benchmark e backbone LLM
Dato un insieme di documenti di testo non strutturato e una query dell'utente, l'obiettivo è costruire un grafo di conoscenza e recuperare informazioni rilevanti attraverso un meccanismo di attraversamento del grafo efficiente, generando risposte accurate, minimizzando al contempo i costi di chiamata LLM.
Meccanismo di memoria senza addestramento: memorizza l'esperienza di attraversamento negli embedding dei bordi, senza richiedere addestramento aggiuntivo
Equilibrio tra esplorazione e sfruttamento: combina strategie di esplorazione e sfruttamento di nodi, realizzando ricerca di ottimi globali e locali
Aggiornamento dei pesi adattivi: strategia di aggiornamento adattiva basata sulla norma del vettore, bilanciando l'apprendimento rapido e la stabilità a lungo termine
Per un insieme di query con una certa somiglianza semantica, quando la dimensione dell'embedding d è sufficientemente grande, l'embedding del bordo può memorizzare efficacemente le informazioni della query, con la condizione:
θ ≤ lim[d→∞] [2 arcsin(√(1/2 sin(arccos(λ))))]
dove θ è l'angolo massimo tra le coppie di embedding di query, e λ è la soglia di connessione forte.
Costo di attraversamento iniziale: il primo attraversamento richiede ancora numerose chiamate LLM
Elaborazione di documenti su larga scala: la costruzione del grafo di conoscenza richiede tempo e risorse computazionali significativi
Limitazioni della capacità di memoria: l'analisi teorica si basa sull'assunzione di dimensione infinita, che potrebbe essere limitata nelle applicazioni pratiche
Questo articolo cita importanti lavori da più campi, inclusi RAG, grafi di conoscenza, reti neurali su grafi, ecc., tra cui:
Lewis et al. (2020): Retrieval-augmented generation for knowledge-intensive NLP tasks
Edge et al. (2024): GraphRAG approach to query-focused summarization
Guo et al. (2024): LightRAG simple and fast retrieval-augmented generation
E altri 55 lavori correlati
Valutazione Complessiva: REMINDRAG è un lavoro di ricerca di alta qualità che propone una soluzione innovativa nel campo KG-RAG. Il metodo non solo rappresenta un progresso tecnico, ma affronta soprattutto un problema critico nelle applicazioni pratiche: l'equilibrio tra efficacia ed efficienza. L'analisi teorica è rigorosa, la progettazione sperimentale è razionale e i risultati sono convincenti. Sebbene esistano alcune limitazioni, i suoi contributi sono significativi e hanno un'importanza considerevole nel promuovere l'applicazione pratica della tecnologia KG-RAG.