PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic
PRoH: Dynamische Planung und Reasoning über Wissens-Hypergraphen für Retrieval-Augmented Generation
Wissens-Hypergraphen (Knowledge Hypergraphs, KHs) stellen als neue Wissensrepräsentationsform für Retrieval-Augmented Generation (RAG) ein Paradigma dar, das Multi-Entity-Beziehungen als strukturierte Form modelliert. Allerdings weisen bestehende KH-basierte RAG-Methoden drei Hauptlimitierungen auf: statische Abrufplanung, nicht-adaptive Abrufausführung und oberflächliche Nutzung der KH-Struktursemantik, die ihre Fähigkeit zur effektiven Multi-Hop-Fragebeantwortung einschränken. Um diese Limitierungen zu überwinden, präsentiert dieses Papier PRoH – ein Framework für dynamische Wissens-Hypergraph-Planung und Reasoning. PRoH enthält drei Kerninnnovationen: (1) ein kontextbewusstes Planungsmodul, das strukturiertes Reasoning durch Skizzierung lokaler KH-Nachbarschaften leitet; (2) einen strukturierten Frage-Dekompositionsprozess, der Teilfragen als dynamisch evolvierende gerichtete azyklische Graphen (DAGs) organisiert, um adaptive Multi-Pfad-Exploration zu ermöglichen; (3) einen Entity-Weighted-Overlap (EWO)-gesteuerten Reasoning-Pfad-Abrufalgorithmus, der semantisch kohärente Hyperkanten-Traversierungen priorisiert.
Traditionelle RAG-Systeme verlassen sich hauptsächlich auf semantische Ähnlichkeit für den Abruf und können strukturiertes Beziehungswissen, das vielen Informationsbereichen innewohnt, nicht erfassen. Sie rufen häufig redundante oder verrauschte Inhalte ab. Obwohl Graph-basierte RAG durch Wissensgraphen (KG) dieses Problem verbessert, modellieren die meisten bestehenden Frameworks nur Beziehungen zwischen zwei Entitäten und ignorieren die Tatsache, dass viele Beziehungen in der realen Welt von Natur aus n-är sind.
Viele Beziehungen in der realen Welt betreffen mehrere Entitäten, wie beispielsweise „Mario + Rabbids Kingdom Battle ist die erste große Zusammenarbeit zwischen Nintendo und Ubisoft", eine Beziehung, die drei Entitäten gleichzeitig verbindet. Die Zerlegung dieser n-ären Beziehungen in mehrere binäre Kanten führt unweigerlich zum Verlust kritischer Struktur- und Semantikinformationen.
Bestehende KH-basierte RAG-Methoden weisen drei Hauptlimitierungen auf:
Statische Abrufplanung: Abhängigkeit von vordefinierten, hartcodierten Abruf-Pipelines, die unabhängig von Abfrageinhalten oder Graphkontext die gleiche Operationssequenz anwenden
Nicht-adaptive Abrufausführung: Verwendung von einmaligen, nicht-iterativen Abrufmethoden, die keine Zwischenergebnisse des Reasoning zur Optimierung des Abrufs nutzen können
Oberflächliche Nutzung der Graphstruktur-Semantik: Behandlung von Hyperkanten hauptsächlich als einfache Links oder Routing-Mechanismen für den Zugriff auf relevante Textblöcke, wobei die in Hyperkanten kodierte reichhaltige Beziehungssemantik ignoriert wird
Präsentation des PRoH-Frameworks: Ein dynamisches Wissens-Hypergraph-RAG-Framework, das die Ausdruckskraft von Hypergraphen für Multi-Hop-Fragebeantwortung vollständig nutzt
Kontextbewusstes Planungsmechanismus: Ein Planungsmechanismus, der durch Skizzierung des zugrunde liegenden Wissens-Hypergraphen und Generierung durchführbarer Reasoning-Pläne funktioniert
EWO-gesteuerte Reasoning-Pfad-Abrufstrategie: Eine feinkörnige, semantikbewusste Explorationsstrategie speziell für Wissens-Hypergraphen
Signifikante Leistungsverbesserungen: Erreichung von SOTA-Leistung über mehrere Wissensbereiche hinweg, mit durchschnittlicher F1-Score-Verbesserung von 19,73% und Verbesserung der Generierungsbewertung (G-E) um 8,41%
Gegeben eine Frage q und ein Wissens-Hypergraph H = (V, E) muss Hypergraph-RAG relevantes Wissen (Faktenmenge F) aus H abrufen und dann basierend auf q und F eine Antwort a(q) generieren.
Frage-Subgraph-Skizzierung: Konstruktion eines Plan-Kontext-Graphen Hp als strukturierte Eingabe für das LLM
Initiale Reasoning-Plan-Generierung: Generierung des Reasoning-Plans basierend auf dem Plan-Kontext
Reasoning-DAG-Konstruktion: Darstellung des Reasoning-Plans als gerichteter azyklischer Graph mit Anwendung der Hasse-Reduktion zur minimalen Darstellung
Bei Langstrecken-Multi-Hop-Fragebeantwortungsaufgaben zeigt PRoH robuste Leistung mit durchschnittlicher F1-Verbesserung von 26,68%, mit höchster Verbesserung von 44,87% im Informatik-Bereich.
Die PRoH-L-Variante behält wettbewerbsfähige Leistung bei deutlich reduziertem Token-Verbrauch bei, mit 30,07% Token-Reduktion in der Landwirtschaft bei gleichzeitiger F1-Verbesserung von 16,58%.
Bestehende Graph-basierte RAG-Methoden ermöglichen präzisere Abrufe und beziehungsbewusste Reasoning durch Wissensgraphen, sind aber meist auf binäre Beziehungsdarstellung beschränkt.
Frühe Systeme wie HyperGraphRAG und Hyper-RAG extrahieren Hyperkanten zur Erfassung hochordentlicher Beziehungen, verlassen sich aber immer noch auf heuristische einmalige Abruf-Pipelines ohne kontextbewusste und iterative Reasoning-Fähigkeiten.
PRoH löst erfolgreich die drei Hauptlimitierungen bestehender KH-basierter RAG-Methoden durch Einführung kontextbewusster Planung, strukturierter iterativer Frage-Dekomposition und EWO-gesteuerter Reasoning-Pfad-Abrufe und erreicht signifikante Leistungsverbesserungen über mehrere Wissensbereiche hinweg.
Starke Innovativität: Erstes Framework für dynamische Planung und Reasoning in KH-RAG, das Kernlimitierungen bestehender Methoden adressiert
Signifikante technische Beiträge: EWO-Bewertungsmechanismus und strukturierte Frage-Dekomposition sind wichtige Innovationen für Hypergraph-Eigenschaften
Umfassende Experimente: Abdeckung mehrerer Bereiche und Langstrecken-Reasoning-Aufgaben mit vollständigen Ablationsstudien
Deutliche Leistungsverbesserungen: Konsistente und signifikante Verbesserungen gegenüber SOTA-Methoden
Das Papier zitiert 40 verwandte Arbeiten, die wichtige Arbeiten in den Bereichen Graph-basiertes RAG, Wissens-Hypergraphen und Multi-Hop-Reasoning abdecken und eine solide theoretische Grundlage für die Forschung bieten.