PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic
PRoH: জ্ঞান হাইপারগ্রাফের উপর গতিশীল পরিকল্পনা এবং যুক্তিবিদ্যা পুনরুদ্ধার-বর্ধিত প্রজন্মের জন্য
জ্ঞান হাইপারগ্রাফ (Knowledge Hypergraphs, KHs) পুনরুদ্ধার-বর্ধিত প্রজন্ম (RAG) এর জন্য একটি উদীয়মান জ্ঞান প্রতিনিধিত্ব ফর্ম হিসাবে, একাধিক সত্তার সম্পর্ককে কাঠামোগত ফর্মে মডেল করার একটি প্যারাডাইম প্রদান করে। তবে, বিদ্যমান KH-ভিত্তিক RAG পদ্ধতিগুলি তিনটি প্রধান সীমাবদ্ধতার সম্মুখীন: স্থির পুনরুদ্ধার পরিকল্পনা, অ-অভিযোজনশীল পুনরুদ্ধার সম্পাদন এবং KH কাঠামোগত শব্দার্থের অগভীর ব্যবহার, যা কার্যকর বহু-হপ প্রশ্নোত্তরের ক্ষমতা সীমিত করে। এই সীমাবদ্ধতাগুলি অতিক্রম করার জন্য, এই পেপারটি PRoH প্রস্তাব করে—একটি গতিশীল জ্ঞান হাইপারগ্রাফ পরিকল্পনা এবং যুক্তিবিদ্যা কাঠামো। PRoH তিনটি মূল উদ্ভাবন অন্তর্ভুক্ত করে: (1) প্রসঙ্গ-সচেতন পরিকল্পনা মডিউল, যা স্থানীয় KH প্রতিবেশী স্কেচ করে কাঠামোগত যুক্তিবিদ্যা পরিকল্পনা প্রজন্মকে গাইড করে; (2) কাঠামোগত প্রশ্ন বিয়োজন প্রক্রিয়া, যা উপ-প্রশ্নগুলিকে অভিযোজনশীল বহু-ট্র্যাজেক্টরি অন্বেষণের জন্য গতিশীলভাবে বিকশিত নির্দেশিত অ্যাসাইক্লিক গ্রাফ (DAG) হিসাবে সংগঠিত করে; (3) সত্তা-ওজনযুক্ত ওভারল্যাপ (EWO) নির্দেশিত যুক্তিবিদ্যা পথ পুনরুদ্ধার অ্যালগরিদম, যা শব্দার্থগতভাবে সুসংগত হাইপারেজ ট্রাভার্সালকে অগ্রাধিকার দেয়।
ঐতিহ্যবাহী RAG সিস্টেমগুলি প্রধানত শব্দার্থগত সাদৃশ্যের জন্য পুনরুদ্ধারের উপর নির্ভর করে, অনেক তথ্য ক্ষেত্রে অন্তর্নিহিত কাঠামোগত সম্পর্ক জ্ঞান ক্যাপচার করতে পারে না এবং প্রায়শই অপ্রয়োজনীয় বা শব্দযুক্ত সামগ্রী পুনরুদ্ধার করে। যদিও গ্রাফ-ভিত্তিক RAG জ্ঞান গ্রাফ (KG) এর মাধ্যমে এটি উন্নত করে, বেশিরভাগ বিদ্যমান কাঠামো শুধুমাত্র দুটি সত্তা জড়িত সম্পর্ক মডেল করে, বাস্তব বিশ্বে অনেক সম্পর্ক প্রকৃতিতে n-ary হওয়ার বৈশিষ্ট্য উপেক্ষা করে।
বাস্তব বিশ্বের অনেক সম্পর্ক একাধিক সত্তা জড়িত, যেমন "Mario + Rabbids Kingdom Battle নিন্টেন্ডো এবং ইউবিসফ্টের মধ্যে প্রথম প্রধান সহযোগিতা" এই সম্পর্ক একযোগে তিনটি সত্তা সংযুক্ত করে। এই n-ary সম্পর্কগুলিকে একাধিক বাইনারি এজে বিয়োজন করা অনিবার্যভাবে মূল কাঠামো এবং শব্দার্থগত তথ্যের ক্ষতির দিকে পরিচালিত করে।
বিদ্যমান KH-ভিত্তিক RAG পদ্ধতিগুলি তিনটি প্রধান সীমাবদ্ধতা উপস্থাপন করে:
স্থির পুনরুদ্ধার পরিকল্পনা: পূর্বনির্ধারিত হার্ডকোডেড পুনরুদ্ধার পাইপলাইনের উপর নির্ভর করে, প্রশ্নের বিষয়বস্তু বা গ্রাফ প্রসঙ্গ নির্বিশেষে একই অপারেশন ক্রম প্রয়োগ করে
অ-অভিযোজনশীল পুনরুদ্ধার সম্পাদন: একবার, অ-পুনরাবৃত্তিমূলক পুনরুদ্ধার পদ্ধতি গ্রহণ করে, মধ্যবর্তী যুক্তিবিদ্যা ফলাফল ব্যবহার করে পুনরুদ্ধার অপ্টিমাইজ করতে পারে না
গ্রাফ কাঠামো শব্দার্থের অগভীর ব্যবহার: প্রধানত হাইপারেজগুলিকে সাধারণ লিঙ্ক বা প্রাসঙ্গিক পাঠ্য ব্লক অ্যাক্সেস করার রুটিং মেকানিজম হিসাবে বিবেচনা করে, হাইপারেজে এনকোড করা সমৃদ্ধ সম্পর্ক শব্দার্থ উপেক্ষা করে
প্রশ্ন q এবং জ্ঞান হাইপারগ্রাফ H = (V, E) দেওয়া, হাইপারগ্রাফ RAG কে H থেকে প্রশ্ন-প্রাসঙ্গিক জ্ঞান (তথ্য সেট F) পুনরুদ্ধার করতে হবে, তারপর q এবং F এর উপর ভিত্তি করে উত্তর a(q) তৈরি করতে হবে।
প্রশ্ন উপগ্রাফ স্কেচ: পরিকল্পনা প্রসঙ্গ গ্রাফ Hp নির্মাণ করে, LLM কে কাঠামোগত ইনপুট প্রদান করে
প্রাথমিক যুক্তিবিদ্যা পরিকল্পনা প্রজন্ম: পরিকল্পনা প্রসঙ্গের উপর ভিত্তি করে যুক্তিবিদ্যা পরিকল্পনা তৈরি করে
যুক্তিবিদ্যা DAG নির্মাণ: যুক্তিবিদ্যা পরিকল্পনা একটি নির্দেশিত অ্যাসাইক্লিক গ্রাফ হিসাবে প্রতিনিধিত্ব করে, ন্যূনতম প্রতিনিধিত্ব পেতে Hasse হ্রাস প্রয়োগ করে
দীর্ঘ-পরিসীমা বহু-হপ প্রশ্নোত্তর কাজে, PRoH শক্তিশালী স্থিতিস্থাপকতা প্রদর্শন করে, গড় F1 বৃদ্ধি ২৬.৬৮%, কম্পিউটার বিজ্ঞান ক্ষেত্রে সর্বোচ্চ বৃদ্ধি ৪৪.৮৭%।
PRoH-L ভেরিয়েন্ট টোকেন ব্যবহারের পরিমাণ উল্লেখযোগ্যভাবে হ্রাস করার সময় প্রতিযোগিতামূলক কর্মক্ষমতা বজায় রাখে, কৃষি ক্ষেত্রে টোকেন ৩০.০৭% হ্রাস করার সময় F1 ১৬.৫৮% বৃদ্ধি করে।
বিদ্যমান গ্রাফ-ভিত্তিক RAG পদ্ধতিগুলি জ্ঞান গ্রাফের মাধ্যমে আরও নির্ভুল পুনরুদ্ধার এবং সম্পর্ক-সচেতন যুক্তিবিদ্যা বাস্তবায়ন করে, কিন্তু বেশিরভাগ বাইনারি সম্পর্ক প্রতিনিধিত্বে সীমাবদ্ধ।
HyperGraphRAG এবং Hyper-RAG এর মতো প্রাথমিক সিস্টেমগুলি উচ্চ-ক্রম সম্পর্ক ক্যাপচার করতে হাইপারেজ নিষ্কাশন করে, কিন্তু এখনও হিউরিস্টিক একবার পুনরুদ্ধার পাইপলাইনের উপর নির্ভর করে, প্রসঙ্গ-সচেতনতা এবং পুনরাবৃত্তিমূলক যুক্তিবিদ্যা ক্ষমতার অভাব রয়েছে।
PRoH প্রসঙ্গ-সচেতন পরিকল্পনা, কাঠামোগত পুনরাবৃত্তিমূলক প্রশ্ন বিয়োজন এবং EWO-নির্দেশিত যুক্তিবিদ্যা পথ পুনরুদ্ধার প্রবর্তন করে, বিদ্যমান KH-ভিত্তিক RAG পদ্ধতির তিনটি প্রধান সীমাবদ্ধতা সফলভাবে সমাধান করে, একাধিক জ্ঞান ক্ষেত্রে উল্লেখযোগ্য কর্মক্ষমতা উন্নতি অর্জন করে।
পেপারটি ৪০টি সম্পর্কিত তথ্যসূত্র উদ্ধৃত করে, যা গ্রাফ-ভিত্তিক RAG, জ্ঞান হাইপারগ্রাফ, বহু-হপ যুক্তিবিদ্যা এবং অন্যান্য সম্পর্কিত ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।