2025-11-12T08:22:09.411485

PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation

Zai, Tan, Wang et al.

Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.

academic

PRoH: Dynamische Planung und Reasoning über Wissens-Hypergraphen für Retrieval-Augmented Generation

Grundinformationen

Papier-ID: 2510.12434
Titel: PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Autoren: Xiangjun Zai, Xingyu Tan, Xiaoyang Wang, Qing Liu, Xiwei Xu, Wenjie Zhang
Klassifizierung: cs.CL (Computerlinguistik)
Veröffentlichungsdatum: 14. Oktober 2024 (arXiv-Preprint)
Papierlink: https://arxiv.org/abs/2510.12434

Zusammenfassung

Wissens-Hypergraphen (Knowledge Hypergraphs, KHs) stellen als neue Wissensrepräsentationsform für Retrieval-Augmented Generation (RAG) ein Paradigma dar, das Multi-Entity-Beziehungen als strukturierte Form modelliert. Allerdings weisen bestehende KH-basierte RAG-Methoden drei Hauptlimitierungen auf: statische Abrufplanung, nicht-adaptive Abrufausführung und oberflächliche Nutzung der KH-Struktursemantik, die ihre Fähigkeit zur effektiven Multi-Hop-Fragebeantwortung einschränken. Um diese Limitierungen zu überwinden, präsentiert dieses Papier PRoH – ein Framework für dynamische Wissens-Hypergraph-Planung und Reasoning. PRoH enthält drei Kerninnnovationen: (1) ein kontextbewusstes Planungsmodul, das strukturiertes Reasoning durch Skizzierung lokaler KH-Nachbarschaften leitet; (2) einen strukturierten Frage-Dekompositionsprozess, der Teilfragen als dynamisch evolvierende gerichtete azyklische Graphen (DAGs) organisiert, um adaptive Multi-Pfad-Exploration zu ermöglichen; (3) einen Entity-Weighted-Overlap (EWO)-gesteuerten Reasoning-Pfad-Abrufalgorithmus, der semantisch kohärente Hyperkanten-Traversierungen priorisiert.

Forschungshintergrund und Motivation

Problemdefinition

Traditionelle RAG-Systeme verlassen sich hauptsächlich auf semantische Ähnlichkeit für den Abruf und können strukturiertes Beziehungswissen, das vielen Informationsbereichen innewohnt, nicht erfassen. Sie rufen häufig redundante oder verrauschte Inhalte ab. Obwohl Graph-basierte RAG durch Wissensgraphen (KG) dieses Problem verbessert, modellieren die meisten bestehenden Frameworks nur Beziehungen zwischen zwei Entitäten und ignorieren die Tatsache, dass viele Beziehungen in der realen Welt von Natur aus n-är sind.

Bedeutungsanalyse

Viele Beziehungen in der realen Welt betreffen mehrere Entitäten, wie beispielsweise „Mario + Rabbids Kingdom Battle ist die erste große Zusammenarbeit zwischen Nintendo und Ubisoft", eine Beziehung, die drei Entitäten gleichzeitig verbindet. Die Zerlegung dieser n-ären Beziehungen in mehrere binäre Kanten führt unweigerlich zum Verlust kritischer Struktur- und Semantikinformationen.

Limitierungen bestehender Methoden

Bestehende KH-basierte RAG-Methoden weisen drei Hauptlimitierungen auf:

Statische Abrufplanung: Abhängigkeit von vordefinierten, hartcodierten Abruf-Pipelines, die unabhängig von Abfrageinhalten oder Graphkontext die gleiche Operationssequenz anwenden
Nicht-adaptive Abrufausführung: Verwendung von einmaligen, nicht-iterativen Abrufmethoden, die keine Zwischenergebnisse des Reasoning zur Optimierung des Abrufs nutzen können
Oberflächliche Nutzung der Graphstruktur-Semantik: Behandlung von Hyperkanten hauptsächlich als einfache Links oder Routing-Mechanismen für den Zugriff auf relevante Textblöcke, wobei die in Hyperkanten kodierte reichhaltige Beziehungssemantik ignoriert wird

Kernbeiträge

Präsentation des PRoH-Frameworks: Ein dynamisches Wissens-Hypergraph-RAG-Framework, das die Ausdruckskraft von Hypergraphen für Multi-Hop-Fragebeantwortung vollständig nutzt
Kontextbewusstes Planungsmechanismus: Ein Planungsmechanismus, der durch Skizzierung des zugrunde liegenden Wissens-Hypergraphen und Generierung durchführbarer Reasoning-Pläne funktioniert
EWO-gesteuerte Reasoning-Pfad-Abrufstrategie: Eine feinkörnige, semantikbewusste Explorationsstrategie speziell für Wissens-Hypergraphen
Signifikante Leistungsverbesserungen: Erreichung von SOTA-Leistung über mehrere Wissensbereiche hinweg, mit durchschnittlicher F1-Score-Verbesserung von 19,73% und Verbesserung der Generierungsbewertung (G-E) um 8,41%

Methodische Details

Aufgabendefinition

Gegeben eine Frage q und ein Wissens-Hypergraph H = (V, E) muss Hypergraph-RAG relevantes Wissen (Faktenmenge F) aus H abrufen und dann basierend auf q und F eine Antwort a(q) generieren.

Modellarchitektur

Das PRoH-Framework besteht aus vier Hauptkomponenten:

1. Graphkonstruktion und Indexierung

KH-Konstruktion: Verwendung der HyperGraphRAG-Methode zur Extraktion von Hyperkanten aus Dokumenten, Identifikation von Entitäten und KH-Konstruktion
Synonym-Hyperkanten-Erweiterung: Erweiterung der Graphkonnektivität durch einen dreistufigen Prozess zum Hinzufügen von Synonym-Hyperkanten:
- Berechnung der Kosinus-Ähnlichkeit für Entitätspaare
- Bildung von Ähnlichkeits-Subgraphen und Berechnung von Zusammenhangskomponenten
- Verwendung von LLM zur Bestimmung von Synonym-Entitäten und Hinzufügen von Synonym-Hyperkanten

2. Graphverankerung

Thema-Entitätserkennung: Verwendung von LLM zur Extraktion von Schlüsselwörtern, Verknüpfung mit Kandidaten-Entitäten durch Ähnlichkeitsabgleich
Ziel-Hyperkanten-Matching: Abruf von Hyperkanten mit semantischer Relevanz zur Frage
Frage-Subgraph-Konstruktion: Extraktion der Vereinigung der Dmax-Hop-Nachbarschaften von Thema-Entitäten und Ziel-Hyperkanten

3. Reasoning-Plan-Initialisierung

Frage-Subgraph-Skizzierung: Konstruktion eines Plan-Kontext-Graphen Hp als strukturierte Eingabe für das LLM
Initiale Reasoning-Plan-Generierung: Generierung des Reasoning-Plans basierend auf dem Plan-Kontext
Reasoning-DAG-Konstruktion: Darstellung des Reasoning-Plans als gerichteter azyklischer Graph mit Anwendung der Hasse-Reduktion zur minimalen Darstellung

4. Reasoning-Prozess

Zustandsraum-Suche: Modellierung des Reasoning als Suchproblem über DAG-Zuständen
Zustandsübergänge: Übergänge zum nächsten Zustand durch Lösung von Teilfragen der aktuellen Ebene
Dynamische DAG-Optimierung: Dynamische Optimierung des Reasoning-DAG basierend auf Zwischenergebnissen

Technische Innovationspunkte

Entity-Weighted-Overlap (EWO) Bewertung

Der EWO-Algorithmus leitet die Suchrichtungswahl durch zweistufige Berechnung:

Entity-Bewertung:

EW(v|qj) = {
    LLMScore(v, qj), if SE(v|qj) ≥ θemb
    0, otherwise
}

Hyperkanten-Bewertung:

EWO(e'|q,e) = Aggregate({SE(v,q) | v ∈ V(e) ∩ V(e')})

Strukturierte Frage-Dekomposition

Organisation von Teilfragen als dynamisch evolvierender DAG statt linearer Sequenz
Unterstützung der Koexistenz mehrerer Kandidatenantworten und Reasoning-Pfade
Ermöglichung der Wiederherstellung von lokalen Fehlern

Experimentelle Einrichtung

Datensätze

KHQA-Datensatz: Umfasst fünf Bereiche: Medizin, Landwirtschaft, Informatik, Recht und Hybrid
Langstrecken-Frage-Erweiterung: Zusätzliche Generierung von 200 Fragen mit 3-6 Hops pro Bereich zur Bewertung der Multi-Hop-Reasoning-Fähigkeit

Bewertungsmetriken

F1-Score: Messung der Antwortgenauigkeit
Abruf-Ähnlichkeit (R-S): Bewertung der Qualität abgerufener Inhalte
Generierungsbewertung (G-E): Bewertung der Qualität generierter Antworten

Vergleichsmethoden

LLM-only: Nur inhärentes LLM-Wissen
StandardRAG: Traditionelles blockbasiertes RAG
PathRAG: Pfadbasierte RAG-Methode
HippoRAG2: Neurobiologie-inspirierte Langzeitgedächtnis-Methode
HyperGraphRAG: Aktuelle SOTA-Hypergraph-RAG-Methode

Implementierungsdetails

LLM: GPT-4o-mini
Embedding-Modell: text-embedding-3-small
Schlüsselparameter: Planungstiefe dp=3, KH-Explorations-Tiefenlimit dmax=3, initiale Plananzahl n0=2

Experimentelle Ergebnisse

Hauptergebnisse

PRoH erreicht SOTA-Leistung bei F1- und G-E-Scores über alle Bereiche hinweg:

Bereich	HyperGraphRAG F1	PRoH F1	Verbesserung
Medizin	35,35	52,94	+49,7%
Landwirtschaft	33,89	56,67	+67,2%
Informatik	31,30	54,15	+73,0%
Recht	43,81	58,81	+34,2%
Hybrid	48,71	69,16	+42,0%

Ablationsstudien

Ablationsstudien zeigen die Wichtigkeit jeder Komponente:

Entfernung von EWO-Steuerung: F1-Rückgang um bis zu 5,3%
Entfernung von Synonym-Zusammenführung: F1-Rückgang um bis zu 5,2%
Entfernung von Plan-Kontext: F1-Rückgang um bis zu 5,8%
Entfernung von Ziel-Hyperkanten-Matching: F1-Rückgang um bis zu 8,6%

Langstrecken-Reasoning-Leistung

Bei Langstrecken-Multi-Hop-Fragebeantwortungsaufgaben zeigt PRoH robuste Leistung mit durchschnittlicher F1-Verbesserung von 26,68%, mit höchster Verbesserung von 44,87% im Informatik-Bereich.

Effizienzanalyse

Die PRoH-L-Variante behält wettbewerbsfähige Leistung bei deutlich reduziertem Token-Verbrauch bei, mit 30,07% Token-Reduktion in der Landwirtschaft bei gleichzeitiger F1-Verbesserung von 16,58%.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

PRoH löst erfolgreich die drei Hauptlimitierungen bestehender KH-basierter RAG-Methoden durch Einführung kontextbewusster Planung, strukturierter iterativer Frage-Dekomposition und EWO-gesteuerter Reasoning-Pfad-Abrufe und erreicht signifikante Leistungsverbesserungen über mehrere Wissensbereiche hinweg.

Limitierungen

Rechenkomplexität: Dynamische Planung und Zustandsraum-Suche können zusätzliche Rechenkosten verursachen
Parametersensitivität: Mehrere Hyperparameter (wie dp, dmax, n0) erfordern Optimierung für verschiedene Bereiche
Graphqualitäts-Abhängigkeit: Leistung hängt stark von Qualität und Vollständigkeit des initialen Wissens-Hypergraphen ab

Zukünftige Richtungen

Erforschung effizienterer Zustandsraum-Suchstrategien
Untersuchung adaptiver Parameteranpassungsmechanismen
Erweiterung auf größere Wissens-Hypergraphen und komplexere Reasoning-Aufgaben

Tiefgreifende Bewertung

Stärken

Starke Innovativität: Erstes Framework für dynamische Planung und Reasoning in KH-RAG, das Kernlimitierungen bestehender Methoden adressiert
Signifikante technische Beiträge: EWO-Bewertungsmechanismus und strukturierte Frage-Dekomposition sind wichtige Innovationen für Hypergraph-Eigenschaften
Umfassende Experimente: Abdeckung mehrerer Bereiche und Langstrecken-Reasoning-Aufgaben mit vollständigen Ablationsstudien
Deutliche Leistungsverbesserungen: Konsistente und signifikante Verbesserungen gegenüber SOTA-Methoden

Schwächen

Höhere Komplexität: Methode enthält mehrere Module und Parameter, die die praktische Einsatzbarkeit beeinträchtigen können
Unzureichende Kostenanalyse: Obwohl Token-Nutzungsanalyse bereitgestellt wird, fehlt detaillierte Zeitkomplexitätsanalyse
Begrenzte Generalisierungsvalidierung: Experimente konzentrieren sich hauptsächlich auf spezifischen KHQA-Datensatz

Einflussfähigkeit

Akademischer Wert: Bietet neue Forschungsrichtungen und technische Frameworks für KH-RAG-Bereich
Praktischer Wert: Wichtig für Anwendungsszenarien, die komplexes Multi-Hop-Reasoning erfordern
Reproduzierbarkeit: Bietet detaillierte Algorithmusbeschreibungen und Implementierungsdetails

Anwendungsszenarien

PRoH ist besonders geeignet für:

Komplexe Fragebeantwortungssysteme, die Multi-Hop-Reasoning erfordern
Wissensintensive Aufgaben mit Multi-Entity-Beziehungen
Anwendungsszenarien mit Anforderungen an Reasoning-Pfad-Interpretierbarkeit

Literaturverzeichnis

Das Papier zitiert 40 verwandte Arbeiten, die wichtige Arbeiten in den Bereichen Graph-basiertes RAG, Wissens-Hypergraphen und Multi-Hop-Reasoning abdecken und eine solide theoretische Grundlage für die Forschung bieten.