ReMindRAG: Low-Cost LLM-Guided Knowledge Graph Traversal for Efficient RAG
Hu, Zhu, Tang et al.
Knowledge graphs (KGs), with their structured representation capabilities, offer promising avenue for enhancing Retrieval Augmented Generation (RAG) systems, leading to the development of KG-RAG systems. Nevertheless, existing methods often struggle to achieve effective synergy between system effectiveness and cost efficiency, leading to neither unsatisfying performance nor excessive LLM prompt tokens and inference time. To this end, this paper proposes REMINDRAG, which employs an LLM-guided graph traversal featuring node exploration, node exploitation, and, most notably, memory replay, to improve both system effectiveness and cost efficiency. Specifically, REMINDRAG memorizes traversal experience within KG edge embeddings, mirroring the way LLMs "memorize" world knowledge within their parameters, but in a train-free manner. We theoretically and experimentally confirm the effectiveness of REMINDRAG, demonstrating its superiority over existing baselines across various benchmark datasets and LLM backbones. Our code is available at https://github.com/kilgrims/ReMindRAG.
academic
ReMindRAG: Низкозатратный обход графа знаний с направлением LLM для эффективного RAG
Графы знаний (KG) благодаря своей структурированной репрезентации предоставляют перспективный подход для улучшения систем поиска с дополнением поколением (RAG), что привело к развитию систем KG-RAG. Однако существующие методы часто не достигают эффективного синергизма между эффективностью системы и экономической целесообразностью, что приводит к низкой производительности или чрезмерному использованию токенов подсказок LLM и времени вывода. Для решения этой проблемы в данной работе предлагается REMINDRAG, использующий направленный LLM обход графа, включающий исследование узлов, использование узлов и, что наиболее важно, механизм воспроизведения памяти для повышения эффективности системы и экономической целесообразности. В частности, REMINDRAG запоминает опыт обхода в вложениях рёбер KG, аналогично тому, как LLM "запоминает" мировые знания в своих параметрах, но без обучения. Мы подтверждаем эффективность REMINDRAG как теоретически, так и экспериментально, демонстрируя её превосходство над существующими базовыми методами на различных наборах данных и архитектурах LLM.
Традиционные методы RAG в основном полагаются на плотный векторный поиск для выявления релевантных текстовых фрагментов, но показывают ограниченную производительность в сложных задачах, требующих многошагового рассуждения или захвата долгосрочных зависимостей. Графы знаний со своим структурированным представлением сущностей и отношений предоставляют новый путь для решения этой проблемы.
Традиционные алгоритмы поиска по графам: такие как PageRank и методы GNN, испытывают трудности при захвате тонких семантических отношений в графе, что приводит к недостаточной эффективности системы
Методы обхода графа с направлением LLM: хотя и показывают отличные результаты, требуют большого количества вызовов LLM, что значительно увеличивает затраты и время вывода
Компромисс между эффективностью и результативностью: существующие системы KG-RAG испытывают трудности при поиске эффективного баланса между эффективностью системы и экономической целесообразностью
Данная работа направлена на решение проблемы синергетической оптимизации эффективности системы и экономической целесообразности в системах KG-RAG, что является основной проблемой для практического развёртывания и масштабируемости.
Выявление ключевых вызовов: чётко определены проблемы синергетической оптимизации эффективности системы и экономической целесообразности в системах KG-RAG
Предложение фреймворка REMINDRAG: использует направленный LLM обход KG, включающий исследование узлов, использование узлов и механизм воспроизведения памяти
Теоретический анализ: теоретически доказана эффективность воспроизведения памяти при обходе графа
Экспериментальная проверка: подтверждена превосходство REMINDRAG на нескольких наборах данных и архитектурах LLM
Учитывая неструктурированные текстовые документы и запрос пользователя, целью является построение графа знаний и эффективное извлечение релевантной информации через механизм обхода графа для генерации точных ответов при минимизации затрат на вызовы LLM.
Для набора запросов с определённой семантической схожестью, когда размерность вложения d достаточно велика, вложения рёбер могут эффективно запоминать информацию о запросах при условии:
θ ≤ lim[d→∞] [2 arcsin(√(1/2 sin(arccos(λ))))]
где θ — максимальный угол между парами вложений запросов, λ — порог сильной связи.
Начальные затраты на обход: первоначальный обход всё ещё требует множественных вызовов LLM
Обработка крупномасштабных документов: построение графа знаний требует значительных временных и вычислительных ресурсов
Ограничения ёмкости памяти: теоретический анализ основан на предположении бесконечной размерности, что может быть ограничено в практических приложениях
Инициализация предварительно обученной памяти: использование предварительной инициализации памяти на основе часто задаваемых вопросов в конкретной области
Распределённое построение графов: оптимизация эффективности построения графов для крупномасштабных документов
Динамическое управление памятью: исследование механизмов забывания и обновления долгосрочной памяти
В данной работе цитируются важные работы из нескольких областей, включая RAG, графы знаний, графические нейронные сети и др., всего 55 связанных источников, включая:
Lewis et al. (2020): Retrieval-augmented generation for knowledge-intensive NLP tasks
Edge et al. (2024): GraphRAG approach to query-focused summarization
Guo et al. (2024): LightRAG simple and fast retrieval-augmented generation
и другие
Общая оценка: REMINDRAG является высококачественной исследовательской работой, предлагающей инновационное решение в области KG-RAG. Этот метод не только представляет технический прорыв, но, что более важно, решает ключевую проблему практического применения — баланс между эффективностью и результативностью. Теоретический анализ строг, экспериментальный дизайн обоснован, результаты убедительны. Несмотря на некоторые ограничения, его вклад значителен и имеет важное значение для продвижения практического применения технологии KG-RAG.