ReMindRAG: Low-Cost LLM-Guided Knowledge Graph Traversal for Efficient RAG
Hu, Zhu, Tang et al.
Knowledge graphs (KGs), with their structured representation capabilities, offer promising avenue for enhancing Retrieval Augmented Generation (RAG) systems, leading to the development of KG-RAG systems. Nevertheless, existing methods often struggle to achieve effective synergy between system effectiveness and cost efficiency, leading to neither unsatisfying performance nor excessive LLM prompt tokens and inference time. To this end, this paper proposes REMINDRAG, which employs an LLM-guided graph traversal featuring node exploration, node exploitation, and, most notably, memory replay, to improve both system effectiveness and cost efficiency. Specifically, REMINDRAG memorizes traversal experience within KG edge embeddings, mirroring the way LLMs "memorize" world knowledge within their parameters, but in a train-free manner. We theoretically and experimentally confirm the effectiveness of REMINDRAG, demonstrating its superiority over existing baselines across various benchmark datasets and LLM backbones. Our code is available at https://github.com/kilgrims/ReMindRAG.
academic
ReMindRAG: कुशल RAG के लिए कम-लागत LLM-निर्देशित ज्ञान ग्राफ ट्रैवर्सल
ज्ञान ग्राफ (KG) अपनी संरचित प्रतिनिधित्व क्षमता के कारण, संवर्धित पुनः प्राप्ति पीढ़ी (RAG) प्रणालियों को बेहतर बनाने के लिए एक आशाजनक मार्ग प्रदान करता है, जिससे KG-RAG प्रणालियों का विकास हुआ है। हालांकि, मौजूदा विधियां अक्सर प्रणाली प्रभावशीलता और लागत दक्षता के बीच प्रभावी सहयोग प्राप्त करने में विफल रहती हैं, जिससे खराब प्रदर्शन या अत्यधिक LLM प्रॉम्प्ट टोकन और अनुमान समय होता है। इसके लिए, यह पेपर REMINDRAG प्रस्तावित करता है, जो LLM-निर्देशित ग्राफ ट्रैवर्सल को नियोजित करता है, जिसमें नोड अन्वेषण, नोड दोहन, और सबसे महत्वपूर्ण रूप से स्मृति पुनरावृत्ति तंत्र शामिल है, प्रणाली प्रभावशीलता और लागत दक्षता में सुधार के लिए। विशेष रूप से, REMINDRAG KG किनारे एम्बेडिंग में ट्रैवर्सल अनुभव को स्मृति में रखता है, जैसे LLM अपने पैरामीटर में विश्व ज्ञान को "याद" करता है, लेकिन प्रशिक्षण-मुक्त तरीके को नियोजित करता है। हम सैद्धांतिक और प्रायोगिक दोनों पहलुओं से REMINDRAG की प्रभावशीलता की पुष्टि करते हैं, विभिन्न बेंचमार्क डेटासेट और LLM बैकबोन पर मौजूदा आधारभूत विधियों से इसकी श्रेष्ठता को प्रमाणित करते हैं।
पारंपरिक RAG विधियां मुख्य रूप से प्रासंगिक पाठ खंडों की पहचान करने के लिए घनी वेक्टर पुनः प्राप्ति पर निर्भर करती हैं, लेकिन बहु-हॉप तर्क या लंबी दूरी की निर्भरता को पकड़ने की आवश्यकता वाले जटिल कार्यों में सीमित प्रदर्शन करती हैं। ज्ञान ग्राफ अपने संरचित इकाई और संबंध प्रतिनिधित्व के साथ इस समस्या को हल करने के लिए एक नया मार्ग प्रदान करता है।
पारंपरिक ग्राफ खोज एल्गोरिदम: जैसे PageRank और GNN विधियां, ग्राफ में सूक्ष्म शब्दार्थ संबंधों को पकड़ने में कठिनाई करती हैं, जिससे प्रणाली प्रभावशीलता अपर्याप्त होती है
LLM-निर्देशित ग्राफ ट्रैवर्सल विधियां: हालांकि उत्कृष्ट प्रदर्शन दिखाती हैं, लेकिन बड़ी संख्या में LLM कॉल की आवश्यकता होती है, जिससे लागत और अनुमान समय में उल्लेखनीय वृद्धि होती है
दक्षता और प्रभावशीलता का व्यापार: मौजूदा KG-RAG प्रणालियां प्रणाली प्रभावशीलता और लागत दक्षता के बीच प्रभावी संतुलन खोजने में कठिनाई करती हैं
यह पेपर KG-RAG प्रणालियों में प्रणाली प्रभावशीलता और लागत दक्षता के सहयोगी अनुकूलन की समस्या को हल करने का लक्ष्य रखता है, जो व्यावहारिक तैनाती और स्केलेबिलिटी की मुख्य चुनौती है।
गैर-संरचित पाठ दस्तावेज़ और उपयोगकर्ता क्वेरी दिए गए, लक्ष्य एक ज्ञान ग्राफ का निर्माण करना और कुशल ग्राफ ट्रैवर्सल तंत्र के माध्यम से प्रासंगिक जानकारी को पुनः प्राप्त करना है, सटीक उत्तर उत्पन्न करना, जबकि LLM कॉल लागत को कम करना है।
प्रभावी पथ: सही उत्तर की ओर ले जाने वाले पथ (सकारात्मक सुदृढीकरण)
अप्रभावी पथ: उत्तर की ओर नहीं ले जाने वाले पथ (नकारात्मक सुदृढीकरण)
स्मृति विधि:
बंद-रूप समीकरण का उपयोग करके किनारे एम्बेडिंग को अपडेट करता है:
भार फलन: δ(x) = (2/π)cos(π||x||₂/2)
प्रभावी पथ को बढ़ाता है: v̂ = v + δ(v) · q/||q||₂
अप्रभावी पथ को दंडित करता है: v̂ = v - δ(v·q/||q||₂) · v·q/||q||₂
तीव्र जागरण और अवमंदन अपडेट:
तीव्र जागरण: जब किनारे एम्बेडिंग v का मानदंड छोटा होता है, δ फलन बड़े दिशात्मक अपडेट का उत्पादन करता है
अवमंदन अपडेट: जब किनारे एम्बेडिंग v मानदंड बड़ा होता है, δ फलन केवल छोटे अपडेट का उत्पादन करता है, स्थिरता बनाए रखता है
एक निश्चित शब्दार्थ समानता वाली क्वेरी के सेट के लिए, जब एम्बेडिंग आयाम d पर्याप्त रूप से बड़ा हो, तो किनारे एम्बेडिंग प्रभावी रूप से क्वेरी जानकारी को स्मृति में रख सकता है, शर्त यह है:
θ ≤ lim[d→∞] [2 arcsin(√(1/2 sin(arccos(λ))))]
जहां θ क्वेरी एम्बेडिंग जोड़ी के बीच अधिकतम कोण है, λ मजबूत कनेक्शन थ्रेशोल्ड है।
यह पेपर RAG, ज्ञान ग्राफ, ग्राफ तंत्रिका नेटवर्क आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को उद्धृत करता है, जिसमें शामिल हैं:
Lewis et al. (2020): Retrieval-augmented generation for knowledge-intensive NLP tasks
Edge et al. (2024): GraphRAG approach to query-focused summarization
Guo et al. (2024): LightRAG simple and fast retrieval-augmented generation
और 55 संबंधित संदर्भ
समग्र मूल्यांकन: REMINDRAG एक उच्च-गुणवत्ता वाला अनुसंधान कार्य है, जो KG-RAG क्षेत्र में एक नवीन समाधान प्रस्तावित करता है। यह विधि न केवल तकनीकी रूप से सफलता दिखाती है, बल्कि अधिक महत्वपूर्ण रूप से व्यावहारिक अनुप्रयोग में मुख्य समस्या को हल करती है - प्रभाव और दक्षता का संतुलन। सैद्धांतिक विश्लेषण कठोर है, प्रायोगिक डिजाइन तर्कसंगत है, परिणाम विश्वास्पद हैं। हालांकि कुछ सीमाएं हैं, लेकिन इसका योगदान महत्वपूर्ण है, KG-RAG प्रौद्योगिकी के व्यावहारिकीकरण को आगे बढ़ाने में महत्वपूर्ण महत्व रखता है।