PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic
PRoH: ज्ञान हाइपरग्राफ पर गतिशील योजना और तर्क के माध्यम से पुनर्प्राप्ति-संवर्धित पीढ़ी
ज्ञान हाइपरग्राफ (Knowledge Hypergraphs, KHs) पुनर्प्राप्ति-संवर्धित पीढ़ी (RAG) के लिए एक उभरता हुआ ज्ञान प्रतिनिधित्व रूप है, जो बहु-इकाई संबंधों को संरचित रूप में मॉडल करने का एक प्रतिमान प्रदान करता है। हालांकि, KH-आधारित RAG के मौजूदा तरीकों में तीन मुख्य सीमाएं हैं: स्थिर पुनर्प्राप्ति योजना, गैर-अनुकूली पुनर्प्राप्ति निष्पादन और KH संरचना शब्दार्थ का उथला उपयोग, जो प्रभावी बहु-हॉप प्रश्नोत्तर करने की क्षमता को सीमित करता है। इन सीमाओं को दूर करने के लिए, यह पेपर PRoH प्रस्तावित करता है—एक गतिशील ज्ञान हाइपरग्राफ योजना और तर्क ढांचा। PRoH में तीन मुख्य नवाचार शामिल हैं: (1) संदर्भ-जागरूक योजना मॉड्यूल, जो स्थानीय KH पड़ोस को रेखांकित करके संरचित तर्क योजना पीढ़ी का मार्गदर्शन करता है; (2) संरचित प्रश्न विघटन प्रक्रिया, जो उप-प्रश्नों को गतिशील रूप से विकसित होने वाले निर्देशित अचक्रीय ग्राफ (DAG) में संगठित करता है; (3) इकाई-भारित ओवरलैप (EWO) निर्देशित तर्क पथ पुनर्प्राप्ति एल्गोरिथ्म, जो शब्दार्थ रूप से सुसंगत हाइपरएज ट्रैवर्सल को प्राथमिकता देता है।
पारंपरिक RAG प्रणालियां मुख्य रूप से शब्दार्थ समानता के लिए पुनर्प्राप्ति पर निर्भर करती हैं, कई सूचना क्षेत्रों में निहित संरचित संबंध ज्ञान को कैप्चर नहीं कर सकती हैं, और अक्सर अनावश्यक या शोर सामग्री को पुनः प्राप्त करती हैं। हालांकि ग्राफ-आधारित RAG ज्ञान ग्राफ (KG) के माध्यम से इस समस्या में सुधार करता है, अधिकांश मौजूदा ढांचे केवल दो इकाइयों को शामिल करने वाले संबंधों को मॉडल करते हैं, वास्तविक दुनिया में कई संबंधों की n-ary प्रकृति को अनदेखा करते हैं।
वास्तविक दुनिया के कई संबंध कई इकाइयों को शामिल करते हैं, जैसे "Mario + Rabbids Kingdom Battle निंटेंडो और यूबिसॉफ्ट के बीच पहला प्रमुख सहयोग है" यह संबंध एक साथ तीन इकाइयों को जोड़ता है। इन n-ary संबंधों को कई बाइनरी किनारों में विघटित करने से अनिवार्य रूप से महत्वपूर्ण संरचना और शब्दार्थ जानकारी का नुकसान होता है।
KH-आधारित RAG के मौजूदा तरीकों में तीन मुख्य सीमाएं हैं:
स्थिर पुनर्प्राप्ति योजना: पूर्वनिर्धारित हार्डकोडित पुनर्प्राप्ति पाइपलाइन पर निर्भर करता है, चाहे क्वेरी सामग्री या ग्राफ संदर्भ कुछ भी हो, समान संचालन अनुक्रम लागू करता है
गैर-अनुकूली पुनर्प्राप्ति निष्पादन: एकबारी, गैर-पुनरावृत्ति पुनर्प्राप्ति दृष्टिकोण अपनाता है, मध्यवर्ती तर्क परिणामों का उपयोग करके पुनर्प्राप्ति को अनुकूलित नहीं कर सकता है
ग्राफ संरचना शब्दार्थ का उथला उपयोग: मुख्य रूप से हाइपरएज को सरल लिंक या संबंधित पाठ ब्लॉक तक पहुंचने के लिए रूटिंग तंत्र के रूप में मानता है, हाइपरएज में एन्कोड किए गए समृद्ध संबंध शब्दार्थ को अनदेखा करता है
PRoH ढांचा प्रस्तावित करना: एक गतिशील ज्ञान हाइपरग्राफ RAG ढांचा, जो बहु-हॉप प्रश्नोत्तर के लिए हाइपरग्राफ की अभिव्यक्तिशील क्षमता का पूर्ण उपयोग करता है
संदर्भ-जागरूक योजना तंत्र: अंतर्निहित ज्ञान हाइपरग्राफ को रेखांकित करके और व्यावहारिक तर्क योजना उत्पन्न करने वाली योजना तंत्र
EWO-निर्देशित तर्क पथ पुनर्प्राप्ति रणनीति: ज्ञान हाइपरग्राफ के लिए सूक्ष्म-दानेदार, शब्दार्थ-जागरूक अन्वेषण रणनीति
उल्लेखनीय प्रदर्शन सुधार: कई ज्ञान क्षेत्रों पर SOTA प्रदर्शन प्राप्त करना, F1 स्कोर में औसतन 19.73% सुधार, पीढ़ी मूल्यांकन (G-E) स्कोर में 8.41% सुधार
प्रश्न q और ज्ञान हाइपरग्राफ H = (V, E) दिए गए, हाइपरग्राफ RAG को H से प्रश्न-संबंधित ज्ञान (तथ्य सेट F) पुनः प्राप्त करना चाहिए, फिर q और F के आधार पर उत्तर a(q) उत्पन्न करना चाहिए।
दीर्घ-दूरी बहु-हॉप प्रश्नोत्तर कार्यों में, PRoH मजबूत दृढ़ता प्रदर्शित करता है, औसत F1 में 26.68% सुधार, कंप्यूटर विज्ञान क्षेत्र में अधिकतम 44.87% सुधार।
PRoH-L वेरिएंट प्रतिस्पर्धी प्रदर्शन बनाए रखते हुए टोकन उपयोग में काफी कमी करता है, कृषि क्षेत्र में टोकन में 30.07% की कमी के साथ F1 में 16.58% सुधार।
मौजूदा ग्राफ-आधारित RAG तरीके ज्ञान ग्राफ के माध्यम से अधिक सटीक पुनर्प्राप्ति और संबंध-जागरूक तर्क प्राप्त करते हैं, लेकिन अधिकांश बाइनरी संबंध प्रतिनिधित्व तक सीमित हैं।
HyperGraphRAG और Hyper-RAG जैसी प्रारंभिक प्रणालियां उच्च-क्रम संबंधों को कैप्चर करने के लिए हाइपरएज निकालती हैं, लेकिन फिर भी अनुमानी एकबारी पुनर्प्राप्ति पाइपलाइन पर निर्भर करती हैं, संदर्भ-जागरूकता और पुनरावृत्ति तर्क क्षमता की कमी है।
PRoH संदर्भ-जागरूक योजना, संरचित पुनरावृत्ति प्रश्न विघटन और EWO-निर्देशित तर्क पथ पुनर्प्राप्ति का परिचय देकर, KH-आधारित RAG तरीकों की तीन मुख्य सीमाओं को सफलतापूर्वक हल करता है, कई ज्ञान क्षेत्रों में उल्लेखनीय प्रदर्शन सुधार प्राप्त करता है।
पेपर ने 40 संबंधित संदर्भों का हवाला दिया है, जो ग्राफ-आधारित RAG, ज्ञान हाइपरग्राफ, बहु-हॉप तर्क और अन्य संबंधित क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हैं, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करते हैं।