2025-11-12T08:22:09.411485

PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation

Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic

PRoH: Dynamische Planung und Reasoning über Wissens-Hypergraphen für Retrieval-Augmented Generation

Grundinformationen

  • Papier-ID: 2510.12434
  • Titel: PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
  • Autoren: Xiangjun Zai, Xingyu Tan, Xiaoyang Wang, Qing Liu, Xiwei Xu, Wenjie Zhang
  • Klassifizierung: cs.CL (Computerlinguistik)
  • Veröffentlichungsdatum: 14. Oktober 2024 (arXiv-Preprint)
  • Papierlink: https://arxiv.org/abs/2510.12434

Zusammenfassung

Wissens-Hypergraphen (Knowledge Hypergraphs, KHs) stellen als neue Wissensrepräsentationsform für Retrieval-Augmented Generation (RAG) ein Paradigma dar, das Multi-Entity-Beziehungen als strukturierte Form modelliert. Allerdings weisen bestehende KH-basierte RAG-Methoden drei Hauptlimitierungen auf: statische Abrufplanung, nicht-adaptive Abrufausführung und oberflächliche Nutzung der KH-Struktursemantik, die ihre Fähigkeit zur effektiven Multi-Hop-Fragebeantwortung einschränken. Um diese Limitierungen zu überwinden, präsentiert dieses Papier PRoH – ein Framework für dynamische Wissens-Hypergraph-Planung und Reasoning. PRoH enthält drei Kerninnnovationen: (1) ein kontextbewusstes Planungsmodul, das strukturiertes Reasoning durch Skizzierung lokaler KH-Nachbarschaften leitet; (2) einen strukturierten Frage-Dekompositionsprozess, der Teilfragen als dynamisch evolvierende gerichtete azyklische Graphen (DAGs) organisiert, um adaptive Multi-Pfad-Exploration zu ermöglichen; (3) einen Entity-Weighted-Overlap (EWO)-gesteuerten Reasoning-Pfad-Abrufalgorithmus, der semantisch kohärente Hyperkanten-Traversierungen priorisiert.

Forschungshintergrund und Motivation

Problemdefinition

Traditionelle RAG-Systeme verlassen sich hauptsächlich auf semantische Ähnlichkeit für den Abruf und können strukturiertes Beziehungswissen, das vielen Informationsbereichen innewohnt, nicht erfassen. Sie rufen häufig redundante oder verrauschte Inhalte ab. Obwohl Graph-basierte RAG durch Wissensgraphen (KG) dieses Problem verbessert, modellieren die meisten bestehenden Frameworks nur Beziehungen zwischen zwei Entitäten und ignorieren die Tatsache, dass viele Beziehungen in der realen Welt von Natur aus n-är sind.

Bedeutungsanalyse

Viele Beziehungen in der realen Welt betreffen mehrere Entitäten, wie beispielsweise „Mario + Rabbids Kingdom Battle ist die erste große Zusammenarbeit zwischen Nintendo und Ubisoft", eine Beziehung, die drei Entitäten gleichzeitig verbindet. Die Zerlegung dieser n-ären Beziehungen in mehrere binäre Kanten führt unweigerlich zum Verlust kritischer Struktur- und Semantikinformationen.

Limitierungen bestehender Methoden

Bestehende KH-basierte RAG-Methoden weisen drei Hauptlimitierungen auf:

  1. Statische Abrufplanung: Abhängigkeit von vordefinierten, hartcodierten Abruf-Pipelines, die unabhängig von Abfrageinhalten oder Graphkontext die gleiche Operationssequenz anwenden
  2. Nicht-adaptive Abrufausführung: Verwendung von einmaligen, nicht-iterativen Abrufmethoden, die keine Zwischenergebnisse des Reasoning zur Optimierung des Abrufs nutzen können
  3. Oberflächliche Nutzung der Graphstruktur-Semantik: Behandlung von Hyperkanten hauptsächlich als einfache Links oder Routing-Mechanismen für den Zugriff auf relevante Textblöcke, wobei die in Hyperkanten kodierte reichhaltige Beziehungssemantik ignoriert wird

Kernbeiträge

  1. Präsentation des PRoH-Frameworks: Ein dynamisches Wissens-Hypergraph-RAG-Framework, das die Ausdruckskraft von Hypergraphen für Multi-Hop-Fragebeantwortung vollständig nutzt
  2. Kontextbewusstes Planungsmechanismus: Ein Planungsmechanismus, der durch Skizzierung des zugrunde liegenden Wissens-Hypergraphen und Generierung durchführbarer Reasoning-Pläne funktioniert
  3. EWO-gesteuerte Reasoning-Pfad-Abrufstrategie: Eine feinkörnige, semantikbewusste Explorationsstrategie speziell für Wissens-Hypergraphen
  4. Signifikante Leistungsverbesserungen: Erreichung von SOTA-Leistung über mehrere Wissensbereiche hinweg, mit durchschnittlicher F1-Score-Verbesserung von 19,73% und Verbesserung der Generierungsbewertung (G-E) um 8,41%

Methodische Details

Aufgabendefinition

Gegeben eine Frage q und ein Wissens-Hypergraph H = (V, E) muss Hypergraph-RAG relevantes Wissen (Faktenmenge F) aus H abrufen und dann basierend auf q und F eine Antwort a(q) generieren.

Modellarchitektur

Das PRoH-Framework besteht aus vier Hauptkomponenten:

1. Graphkonstruktion und Indexierung

  • KH-Konstruktion: Verwendung der HyperGraphRAG-Methode zur Extraktion von Hyperkanten aus Dokumenten, Identifikation von Entitäten und KH-Konstruktion
  • Synonym-Hyperkanten-Erweiterung: Erweiterung der Graphkonnektivität durch einen dreistufigen Prozess zum Hinzufügen von Synonym-Hyperkanten:
    • Berechnung der Kosinus-Ähnlichkeit für Entitätspaare
    • Bildung von Ähnlichkeits-Subgraphen und Berechnung von Zusammenhangskomponenten
    • Verwendung von LLM zur Bestimmung von Synonym-Entitäten und Hinzufügen von Synonym-Hyperkanten

2. Graphverankerung

  • Thema-Entitätserkennung: Verwendung von LLM zur Extraktion von Schlüsselwörtern, Verknüpfung mit Kandidaten-Entitäten durch Ähnlichkeitsabgleich
  • Ziel-Hyperkanten-Matching: Abruf von Hyperkanten mit semantischer Relevanz zur Frage
  • Frage-Subgraph-Konstruktion: Extraktion der Vereinigung der Dmax-Hop-Nachbarschaften von Thema-Entitäten und Ziel-Hyperkanten

3. Reasoning-Plan-Initialisierung

  • Frage-Subgraph-Skizzierung: Konstruktion eines Plan-Kontext-Graphen Hp als strukturierte Eingabe für das LLM
  • Initiale Reasoning-Plan-Generierung: Generierung des Reasoning-Plans basierend auf dem Plan-Kontext
  • Reasoning-DAG-Konstruktion: Darstellung des Reasoning-Plans als gerichteter azyklischer Graph mit Anwendung der Hasse-Reduktion zur minimalen Darstellung

4. Reasoning-Prozess

  • Zustandsraum-Suche: Modellierung des Reasoning als Suchproblem über DAG-Zuständen
  • Zustandsübergänge: Übergänge zum nächsten Zustand durch Lösung von Teilfragen der aktuellen Ebene
  • Dynamische DAG-Optimierung: Dynamische Optimierung des Reasoning-DAG basierend auf Zwischenergebnissen

Technische Innovationspunkte

Entity-Weighted-Overlap (EWO) Bewertung

Der EWO-Algorithmus leitet die Suchrichtungswahl durch zweistufige Berechnung:

  1. Entity-Bewertung:
EW(v|qj) = {
    LLMScore(v, qj), if SE(v|qj) ≥ θemb
    0, otherwise
}
  1. Hyperkanten-Bewertung:
EWO(e'|q,e) = Aggregate({SE(v,q) | v ∈ V(e) ∩ V(e')})

Strukturierte Frage-Dekomposition

  • Organisation von Teilfragen als dynamisch evolvierender DAG statt linearer Sequenz
  • Unterstützung der Koexistenz mehrerer Kandidatenantworten und Reasoning-Pfade
  • Ermöglichung der Wiederherstellung von lokalen Fehlern

Experimentelle Einrichtung

Datensätze

  • KHQA-Datensatz: Umfasst fünf Bereiche: Medizin, Landwirtschaft, Informatik, Recht und Hybrid
  • Langstrecken-Frage-Erweiterung: Zusätzliche Generierung von 200 Fragen mit 3-6 Hops pro Bereich zur Bewertung der Multi-Hop-Reasoning-Fähigkeit

Bewertungsmetriken

  • F1-Score: Messung der Antwortgenauigkeit
  • Abruf-Ähnlichkeit (R-S): Bewertung der Qualität abgerufener Inhalte
  • Generierungsbewertung (G-E): Bewertung der Qualität generierter Antworten

Vergleichsmethoden

  • LLM-only: Nur inhärentes LLM-Wissen
  • StandardRAG: Traditionelles blockbasiertes RAG
  • PathRAG: Pfadbasierte RAG-Methode
  • HippoRAG2: Neurobiologie-inspirierte Langzeitgedächtnis-Methode
  • HyperGraphRAG: Aktuelle SOTA-Hypergraph-RAG-Methode

Implementierungsdetails

  • LLM: GPT-4o-mini
  • Embedding-Modell: text-embedding-3-small
  • Schlüsselparameter: Planungstiefe dp=3, KH-Explorations-Tiefenlimit dmax=3, initiale Plananzahl n0=2

Experimentelle Ergebnisse

Hauptergebnisse

PRoH erreicht SOTA-Leistung bei F1- und G-E-Scores über alle Bereiche hinweg:

BereichHyperGraphRAG F1PRoH F1Verbesserung
Medizin35,3552,94+49,7%
Landwirtschaft33,8956,67+67,2%
Informatik31,3054,15+73,0%
Recht43,8158,81+34,2%
Hybrid48,7169,16+42,0%

Ablationsstudien

Ablationsstudien zeigen die Wichtigkeit jeder Komponente:

  • Entfernung von EWO-Steuerung: F1-Rückgang um bis zu 5,3%
  • Entfernung von Synonym-Zusammenführung: F1-Rückgang um bis zu 5,2%
  • Entfernung von Plan-Kontext: F1-Rückgang um bis zu 5,8%
  • Entfernung von Ziel-Hyperkanten-Matching: F1-Rückgang um bis zu 8,6%

Langstrecken-Reasoning-Leistung

Bei Langstrecken-Multi-Hop-Fragebeantwortungsaufgaben zeigt PRoH robuste Leistung mit durchschnittlicher F1-Verbesserung von 26,68%, mit höchster Verbesserung von 44,87% im Informatik-Bereich.

Effizienzanalyse

Die PRoH-L-Variante behält wettbewerbsfähige Leistung bei deutlich reduziertem Token-Verbrauch bei, mit 30,07% Token-Reduktion in der Landwirtschaft bei gleichzeitiger F1-Verbesserung von 16,58%.

Verwandte Arbeiten

Graph-basiertes RAG

Bestehende Graph-basierte RAG-Methoden ermöglichen präzisere Abrufe und beziehungsbewusste Reasoning durch Wissensgraphen, sind aber meist auf binäre Beziehungsdarstellung beschränkt.

Wissens-Hypergraph-RAG

Frühe Systeme wie HyperGraphRAG und Hyper-RAG extrahieren Hyperkanten zur Erfassung hochordentlicher Beziehungen, verlassen sich aber immer noch auf heuristische einmalige Abruf-Pipelines ohne kontextbewusste und iterative Reasoning-Fähigkeiten.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

PRoH löst erfolgreich die drei Hauptlimitierungen bestehender KH-basierter RAG-Methoden durch Einführung kontextbewusster Planung, strukturierter iterativer Frage-Dekomposition und EWO-gesteuerter Reasoning-Pfad-Abrufe und erreicht signifikante Leistungsverbesserungen über mehrere Wissensbereiche hinweg.

Limitierungen

  1. Rechenkomplexität: Dynamische Planung und Zustandsraum-Suche können zusätzliche Rechenkosten verursachen
  2. Parametersensitivität: Mehrere Hyperparameter (wie dp, dmax, n0) erfordern Optimierung für verschiedene Bereiche
  3. Graphqualitäts-Abhängigkeit: Leistung hängt stark von Qualität und Vollständigkeit des initialen Wissens-Hypergraphen ab

Zukünftige Richtungen

  1. Erforschung effizienterer Zustandsraum-Suchstrategien
  2. Untersuchung adaptiver Parameteranpassungsmechanismen
  3. Erweiterung auf größere Wissens-Hypergraphen und komplexere Reasoning-Aufgaben

Tiefgreifende Bewertung

Stärken

  1. Starke Innovativität: Erstes Framework für dynamische Planung und Reasoning in KH-RAG, das Kernlimitierungen bestehender Methoden adressiert
  2. Signifikante technische Beiträge: EWO-Bewertungsmechanismus und strukturierte Frage-Dekomposition sind wichtige Innovationen für Hypergraph-Eigenschaften
  3. Umfassende Experimente: Abdeckung mehrerer Bereiche und Langstrecken-Reasoning-Aufgaben mit vollständigen Ablationsstudien
  4. Deutliche Leistungsverbesserungen: Konsistente und signifikante Verbesserungen gegenüber SOTA-Methoden

Schwächen

  1. Höhere Komplexität: Methode enthält mehrere Module und Parameter, die die praktische Einsatzbarkeit beeinträchtigen können
  2. Unzureichende Kostenanalyse: Obwohl Token-Nutzungsanalyse bereitgestellt wird, fehlt detaillierte Zeitkomplexitätsanalyse
  3. Begrenzte Generalisierungsvalidierung: Experimente konzentrieren sich hauptsächlich auf spezifischen KHQA-Datensatz

Einflussfähigkeit

  1. Akademischer Wert: Bietet neue Forschungsrichtungen und technische Frameworks für KH-RAG-Bereich
  2. Praktischer Wert: Wichtig für Anwendungsszenarien, die komplexes Multi-Hop-Reasoning erfordern
  3. Reproduzierbarkeit: Bietet detaillierte Algorithmusbeschreibungen und Implementierungsdetails

Anwendungsszenarien

PRoH ist besonders geeignet für:

  1. Komplexe Fragebeantwortungssysteme, die Multi-Hop-Reasoning erfordern
  2. Wissensintensive Aufgaben mit Multi-Entity-Beziehungen
  3. Anwendungsszenarien mit Anforderungen an Reasoning-Pfad-Interpretierbarkeit

Literaturverzeichnis

Das Papier zitiert 40 verwandte Arbeiten, die wichtige Arbeiten in den Bereichen Graph-basiertes RAG, Wissens-Hypergraphen und Multi-Hop-Reasoning abdecken und eine solide theoretische Grundlage für die Forschung bieten.