PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
تمثل الرسوم البيانية الفائقة للمعرفة (Knowledge Hypergraphs, KHs) شكلاً ناشئاً من أشكال تمثيل المعرفة لتوليد معزز بالاسترجاع (RAG)، وتوفر نموذجاً لنمذجة العلاقات متعددة الكيانات في شكل منظم. ومع ذلك، تعاني الطرق الحالية القائمة على KH من ثلاث قيود رئيسية: التخطيط الثابت للاسترجاع، والتنفيذ غير التكيفي للاسترجاع، والاستخدام السطحي لدلالات بنية KH، مما يحد من قدرتها على الإجابة على أسئلة متعددة الخطوات بفعالية. للتغلب على هذه القيود، تقترح هذه الورقة PRoH - إطار عمل ديناميكي للتخطيط والاستدلال على الرسوم البيانية الفائقة للمعرفة. يتضمن PRoH ثلاث ابتكارات أساسية: (1) وحدة تخطيط تدرك السياق، من خلال تحديد الحي المحلي لـ KH لتوجيه توليد خطط الاستدلال المنظمة؛ (2) عملية تحليل الأسئلة المنظمة، التي تنظم الأسئلة الفرعية كرسم بياني موجه غير دوري (DAG) متطور ديناميكياً لتحقيق الاستكشاف المتعدد المسارات التكيفي؛ (3) خوارزمية استرجاع مسار الاستدلال الموجهة بالتداخل المرجح للكيانات (EWO)، التي تعطي الأولوية لاجتياز الحواف الفائقة المتماسكة دلالياً.
تعتمد أنظمة RAG التقليدية بشكل أساسي على التشابه الدلالي للاسترجاع، وغير قادرة على التقاط معرفة العلاقات المنظمة المتأصلة في العديد من مجالات المعلومات، وغالباً ما تسترجع محتوى زائداً أو مزعجاً. على الرغم من أن RAG القائم على الرسوم البيانية يحسن هذه المشكلة من خلال الرسوم البيانية للمعرفة (KG)، إلا أن معظم الأطر الموجودة تنمذج فقط العلاقات التي تتضمن كيانين، متجاهلة الطبيعة n-ary للعديد من العلاقات في العالم الحقيقي.
تتضمن العديد من العلاقات في العالم الحقيقي كيانات متعددة، مثل "Mario + Rabbids Kingdom Battle هو أول تعاون رئيسي بين Nintendo و Ubisoft"، وهذه العلاقة تربط ثلاثة كيانات في نفس الوقت. سيؤدي تحليل هذه العلاقات n-ary إلى حواف ثنائية متعددة حتماً إلى فقدان المعلومات الهيكلية والدلالية الرئيسية.
التخطيط الثابت للاسترجاع: تعتمد على خطوط أنابيب استرجاع محددة مسبقاً ومشفرة بشكل صارم، وتطبق نفس تسلسل العمليات بغض النظر عن محتوى الاستعلام أو السياق على الرسم البياني
التنفيذ غير التكيفي للاسترجاع: تعتمد على طريقة استرجاع لمرة واحدة وغير تكرارية، وغير قادرة على استخدام نتائج الاستدلال الوسيطة لتحسين الاسترجاع
الاستخدام السطحي لدلالات بنية الرسم البياني: تعامل الحواف الفائقة بشكل أساسي كروابط بسيطة أو آليات توجيه للوصول إلى كتل النصوص ذات الصلة، متجاهلة الدلالات الغنية للعلاقات المشفرة في الحواف الفائقة
اقتراح إطار عمل PRoH: إطار عمل ديناميكي لـ RAG على الرسوم البيانية الفائقة للمعرفة، يستفيد بالكامل من القدرة التعبيرية للرسوم البيانية الفائقة للإجابة على أسئلة متعددة الخطوات
آلية التخطيط التي تدرك السياق: آلية تخطيط من خلال تحديد الرسم البياني الفائق للمعرفة الأساسي وتوليد خطط استدلال قابلة للتنفيذ
استراتيجية استرجاع مسار الاستدلال الموجهة بـ EWO: استراتيجية استكشاف دقيقة الحبيبات وتدرك الدلالات موجهة نحو الرسوم البيانية الفائقة للمعرفة
تحسن أداء كبير: تحقيق أداء متقدمة (SOTA) على مجالات معرفية متعددة، مع متوسط تحسن في درجة F1 بنسبة 19.73%، وتحسن درجة التقييم التوليدي (G-E) بنسبة 8.41%
بالنظر إلى سؤال q ورسم بياني فائق للمعرفة H = (V, E)، يحتاج RAG الفائق إلى استرجاع المعرفة ذات الصلة بالسؤال من H (مجموعة الحقائق F)، ثم توليد إجابة a(q) بناءً على q و F.
في مهام الإجابة على الأسئلة متعددة الخطوات طويلة المدى، يظهر PRoH متانة قوية، مع متوسط تحسن في F1 بنسبة 26.68%، وأعلى تحسن في مجال علوم الحاسوب بنسبة 44.87%.
تحقق طرق RAG القائمة على الرسوم البيانية الموجودة استرجاعاً أكثر دقة واستدلالاً يدرك العلاقات من خلال الرسوم البيانية للمعرفة، لكن معظمها يقتصر على تمثيل العلاقات الثنائية.
تستخرج الأنظمة المبكرة مثل HyperGraphRAG و Hyper-RAG الحواف الفائقة لالتقاط العلاقات عالية الرتبة، لكنها لا تزال تعتمد على خطوط أنابيب استرجاع استكشافية لمرة واحدة، وتفتقر إلى القدرة على التخطيط الذي يدرك السياق والاستدلال التكراري.
يحل PRoH بنجاح القيود الثلاثة الرئيسية لطرق RAG القائمة على KH من خلال إدخال التخطيط الذي يدرك السياق، وتحليل الأسئلة المنظم والتكراري، واسترجاع مسار الاستدلال الموجه بـ EWO، مما يحقق تحسناً كبيراً في الأداء عبر مجالات معرفية متعددة.
تستشهد الورقة بـ 40 مرجعاً ذا صلة، تغطي الأعمال المهمة في مجالات RAG القائم على الرسوم البيانية والرسوم البيانية الفائقة للمعرفة والاستدلال متعدد الخطوات، مما يوفر أساساً نظرياً متيناً للبحث.