ReMindRAG: Low-Cost LLM-Guided Knowledge Graph Traversal for Efficient RAG
Hu, Zhu, Tang et al.
Knowledge graphs (KGs), with their structured representation capabilities, offer promising avenue for enhancing Retrieval Augmented Generation (RAG) systems, leading to the development of KG-RAG systems. Nevertheless, existing methods often struggle to achieve effective synergy between system effectiveness and cost efficiency, leading to neither unsatisfying performance nor excessive LLM prompt tokens and inference time. To this end, this paper proposes REMINDRAG, which employs an LLM-guided graph traversal featuring node exploration, node exploitation, and, most notably, memory replay, to improve both system effectiveness and cost efficiency. Specifically, REMINDRAG memorizes traversal experience within KG edge embeddings, mirroring the way LLMs "memorize" world knowledge within their parameters, but in a train-free manner. We theoretically and experimentally confirm the effectiveness of REMINDRAG, demonstrating its superiority over existing baselines across various benchmark datasets and LLM backbones. Our code is available at https://github.com/kilgrims/ReMindRAG.
academic
ReMindRAG: Traversal de Grafos de Conocimiento Guiado por LLM de Bajo Costo para RAG Eficiente
Los grafos de conocimiento (GC) ofrecen un camino prometedor para mejorar sistemas de generación aumentada por recuperación (RAG) mediante su capacidad de representación estructurada, lo que ha impulsado el desarrollo de sistemas KG-RAG. Sin embargo, los métodos existentes a menudo tienen dificultades para lograr una sinergia efectiva entre la efectividad del sistema y la eficiencia de costos, resultando en un rendimiento deficiente o un consumo excesivo de tokens de indicación de LLM y tiempo de inferencia. Para abordar esto, este artículo propone REMINDRAG, que adopta traversal de grafos guiado por LLM, que incluye exploración de nodos, explotación de nodos y, lo más importante, un mecanismo de reproducción de memoria para mejorar la efectividad del sistema y la eficiencia de costos. Específicamente, REMINDRAG memoriza experiencias de traversal en incrustaciones de bordes de GC, de manera similar a cómo los LLM "memorizan" conocimiento mundial en sus parámetros, pero de forma sin entrenamiento. Confirmamos la efectividad de REMINDRAG tanto teórica como experimentalmente, demostrando su superioridad sobre líneas base existentes en varios conjuntos de datos de referencia y redes troncales de LLM.
Los métodos RAG tradicionales dependen principalmente de la recuperación de vectores densos para identificar segmentos de texto relevantes, pero muestran limitaciones en tareas complejas que requieren razonamiento de múltiples saltos o captura de dependencias a largo plazo. Los grafos de conocimiento, con su representación estructurada de entidades y relaciones, ofrecen un nuevo camino para resolver este problema.
Algoritmos de búsqueda en grafos tradicionales: Como PageRank y métodos GNN, tienen dificultades para capturar relaciones semánticas sutiles en el grafo, resultando en efectividad insuficiente del sistema
Métodos de traversal de grafos guiados por LLM: Aunque muestran un desempeño excelente, requieren numerosas invocaciones de LLM, aumentando significativamente los costos y el tiempo de inferencia
Compensación entre eficiencia y efectividad: Los sistemas KG-RAG existentes tienen dificultades para encontrar un equilibrio efectivo entre la efectividad del sistema y la eficiencia de costos
Este artículo tiene como objetivo abordar el problema de optimización sinérgica entre la efectividad del sistema y la eficiencia de costos en sistemas KG-RAG, que es un desafío principal para la implementación práctica y la escalabilidad.
Identificación de Desafíos Clave: Señala explícitamente el desafío de optimización sinérgica entre la efectividad del sistema y la eficiencia de costos en sistemas KG-RAG
Propuesta del Marco REMINDRAG: Adopta traversal de GC guiado por LLM, que incluye exploración de nodos, explotación de nodos y mecanismo de reproducción de memoria
Análisis Teórico: Demuestra teóricamente la efectividad de la reproducción de memoria en traversal de grafos
Verificación Experimental: Valida la superioridad de REMINDRAG en múltiples conjuntos de datos de referencia y redes troncales de LLM
Dado un conjunto de documentos de texto no estructurado y una consulta del usuario, el objetivo es construir un grafo de conocimiento y recuperar información relevante mediante un mecanismo de traversal de grafos eficiente, generando respuestas precisas mientras se minimiza el costo de invocaciones de LLM.
Caminos efectivos: Caminos que conducen a respuestas correctas (refuerzo positivo)
Caminos inefectivos: Caminos que no conducen a respuestas (refuerzo negativo)
Método de Memoria:
Actualización de incrustaciones de bordes mediante ecuación de forma cerrada:
Función de peso: δ(x) = (2/π)cos(π||x||₂/2)
Mejorar caminos efectivos: v̂ = v + δ(v) · q/||q||₂
Penalizar caminos inefectivos: v̂ = v - δ(v·q/||q||₂) · v·q/||q||₂
Despertar Rápido y Actualización Amortiguada:
Despertar rápido: Cuando la norma de la incrustación de borde v es pequeña, la función δ produce actualizaciones direccionales grandes
Actualización amortiguada: Cuando la norma de la incrustación de borde v es grande, la función δ solo produce actualizaciones pequeñas, manteniendo la estabilidad
Mecanismo de Memoria sin Entrenamiento: Memoriza experiencias de traversal mediante incrustaciones de bordes sin requerir entrenamiento adicional
Equilibrio entre Exploración y Explotación: Combina estrategias de exploración y explotación de nodos para lograr búsqueda óptima global y local
Actualización de Peso Adaptativo: Estrategia de actualización adaptativa basada en la norma de vectores, equilibrando aprendizaje rápido y estabilidad a largo plazo
Para un conjunto de consultas con cierta similitud semántica, cuando la dimensión de incrustación d es suficientemente grande, las incrustaciones de bordes pueden memorizar efectivamente información de consultas, con la condición:
θ ≤ lim[d→∞] [2 arcsin(√(1/2 sin(arccos(λ))))]
donde θ es el ángulo máximo entre pares de incrustaciones de consultas, y λ es el umbral de conexión fuerte.
Costo de Traversal Inicial: El primer traversal aún requiere múltiples invocaciones de LLM
Procesamiento de Documentos a Gran Escala: La construcción del grafo de conocimiento requiere tiempo y recursos computacionales significativos
Límites de Capacidad de Memoria: El análisis teórico se basa en suposiciones de dimensión infinita, que pueden estar limitadas en aplicaciones prácticas
Este artículo cita trabajos importantes de múltiples campos incluyendo RAG, grafos de conocimiento, redes neuronales de grafos, etc., incluyendo:
Lewis et al. (2020): Retrieval-augmented generation for knowledge-intensive NLP tasks
Edge et al. (2024): GraphRAG approach to query-focused summarization
Guo et al. (2024): LightRAG simple and fast retrieval-augmented generation
Y 55 referencias relacionadas adicionales
Evaluación General: REMINDRAG es un trabajo de investigación de alta calidad que propone una solución innovadora en el campo KG-RAG. El método no solo representa un avance técnico, sino que más importantemente aborda el problema clave en aplicaciones prácticas: el equilibrio entre efectividad y eficiencia. El análisis teórico es riguroso, el diseño experimental es razonable y los resultados son convincentes. Aunque existen algunas limitaciones, sus contribuciones son significativas y tienen importancia considerable para promover la practicidad de la tecnología KG-RAG.