PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic
PRoH: Pianificazione Dinamica e Ragionamento su Ipergrafi di Conoscenza per la Generazione Aumentata da Recupero
Gli ipergrafi di conoscenza (Knowledge Hypergraphs, KH) rappresentano una forma emergente di rappresentazione della conoscenza per la generazione aumentata da recupero (RAG), fornendo un paradigma per modellare relazioni multi-entità in forma strutturata. Tuttavia, i metodi RAG basati su KH esistenti presentano tre limitazioni principali: pianificazione di recupero statica, esecuzione di recupero non adattiva e sfruttamento superficiale della semantica strutturale di KH, che limitano la capacità di eseguire efficaci domande e risposte multi-hop. Per superare queste limitazioni, questo articolo propone PRoH, un framework dinamico di pianificazione e ragionamento su ipergrafi di conoscenza. PRoH contiene tre innovazioni fondamentali: (1) un modulo di pianificazione consapevole del contesto che guida la generazione di piani di ragionamento strutturato delineando il vicinato locale di KH; (2) un processo di decomposizione strutturata dei problemi che organizza i sottoproblemi in un grafo aciclico diretto (DAG) dinamicamente evolutivo per consentire l'esplorazione adattiva multi-traccia; (3) un algoritmo di recupero del percorso di ragionamento guidato da sovrapposizione ponderata di entità (EWO) che privilegia l'attraversamento di iperarchi semanticamente coerenti.
I sistemi RAG tradizionali si basano principalmente sulla similarità semantica per il recupero, non riuscendo a catturare la conoscenza delle relazioni strutturate intrinseche a molti domini informativi, e spesso recuperano contenuti ridondanti o rumorosi. Sebbene i RAG basati su grafi migliorino questo problema attraverso grafi di conoscenza (KG), la maggior parte dei framework esistenti modella solo relazioni che coinvolgono due entità, ignorando il fatto che molte relazioni nel mondo reale sono intrinsecamente n-arie.
Molte relazioni nel mondo reale coinvolgono più entità, come "Mario + Rabbids Kingdom Battle è la prima grande collaborazione tra Nintendo e Ubisoft", una relazione che connette simultaneamente tre entità. Decomporre queste relazioni n-arie in più archi binari porterebbe inevitabilmente alla perdita di informazioni strutturali e semantiche critiche.
I metodi RAG basati su KH esistenti presentano tre limitazioni principali:
Pianificazione di recupero statica: Si basano su pipeline di recupero predefinite e hardcoded, applicando la stessa sequenza di operazioni indipendentemente dal contenuto della query o dal contesto del grafo
Esecuzione di recupero non adattiva: Adottano un approccio di recupero una tantum e non iterativo, incapaci di utilizzare risultati di ragionamento intermedi per ottimizzare il recupero
Sfruttamento superficiale della semantica strutturale del grafo: Trattano principalmente gli iperarchi come semplici collegamenti o meccanismi di routing per accedere a blocchi di testo rilevanti, ignorando la ricca semantica relazionale codificata negli iperarchi
Propone il framework PRoH: Un framework RAG dinamico su ipergrafi di conoscenza che sfrutta pienamente la capacità espressiva degli ipergrafi per domande e risposte multi-hop
Meccanismo di pianificazione consapevole del contesto: Un meccanismo di pianificazione che delinea l'ipergrafo di conoscenza sottostante e genera piani di ragionamento fattibili
Strategia di recupero del percorso di ragionamento guidata da EWO: Una strategia di esplorazione fine-grained e consapevole della semantica specifica per ipergrafi di conoscenza
Miglioramenti significativi delle prestazioni: Raggiunge prestazioni SOTA su più domini di conoscenza, con un aumento medio del punteggio F1 del 19,73% e un aumento del punteggio di valutazione generativa (G-E) dell'8,41%
Dato un problema q e un ipergrafo di conoscenza H = (V, E), il RAG su ipergrafo deve recuperare da H la conoscenza rilevante per il problema (insieme di fatti F), quindi generare una risposta a(q) basata su q e F.
Delineamento del sottografo di problema: Costruisce il grafo di contesto di pianificazione Hp, fornendo input strutturato a LLM
Generazione del piano di ragionamento iniziale: Genera il piano di ragionamento basato sul contesto di pianificazione
Costruzione del DAG di ragionamento: Rappresenta il piano di ragionamento come grafo aciclico diretto, applicando la riduzione di Hasse per ottenere la rappresentazione minima
Dataset KHQA: Copre cinque domini: medicina, agricoltura, informatica, diritto e misto
Estensione di problemi a lungo raggio: Genera ulteriormente 200 problemi a lungo raggio di 3-6 hop per dominio per valutare la capacità di ragionamento multi-hop
Nei compiti di domande e risposte multi-hop a lungo raggio, PRoH mostra una robustezza forte, con un miglioramento medio di F1 del 26.68% e un miglioramento massimo del 44.87% nel dominio dell'informatica.
La variante PRoH-L mantiene prestazioni competitive riducendo significativamente l'utilizzo di token, con una riduzione di token del 30.07% nel dominio agricolo mantenendo un miglioramento di F1 del 16.58%.
I metodi RAG basati su grafi esistenti realizzano recupero più preciso e ragionamento consapevole delle relazioni attraverso grafi di conoscenza, ma la maggior parte è limitata alla rappresentazione di relazioni binarie.
Sistemi precoci come HyperGraphRAG e Hyper-RAG estraggono iperarchi per catturare relazioni di ordine superiore, ma si basano ancora su pipeline di recupero euristiche una tantum, mancando di capacità di pianificazione consapevole del contesto e di ragionamento iterativo.
PRoH risolve con successo le tre limitazioni principali dei metodi RAG basati su KH esistenti introducendo pianificazione consapevole del contesto, decomposizione strutturata iterativa dei problemi e recupero del percorso di ragionamento guidato da EWO, realizzando miglioramenti significativi delle prestazioni su più domini di conoscenza.
Forte Innovatività: Primo framework KH-RAG con pianificazione dinamica e ragionamento, affrontando le limitazioni fondamentali dei metodi esistenti
Contributi Tecnici Significativi: Il meccanismo di punteggio EWO e la decomposizione strutturata dei problemi sono innovazioni importanti specifiche per le caratteristiche degli ipergrafi
Esperimenti Completi: Coprono più domini e compiti di ragionamento a lungo raggio, con esperimenti di ablazione completi
Miglioramenti di Prestazioni Evidenti: Miglioramenti significativi e coerenti rispetto ai metodi SOTA
Complessità Relativamente Alta: Il metodo contiene più moduli e parametri, che potrebbero influenzare la convenienza del dispiegamento pratico
Analisi dei Costi Computazionali Insufficiente: Sebbene fornisca analisi di utilizzo di token, manca un'analisi dettagliata della complessità temporale
Verifica di Generalizzabilità Limitata: Gli esperimenti si concentrano principalmente sul dataset KHQA specifico
L'articolo cita 40 lavori correlati, coprendo importanti lavori nei campi del RAG basato su grafi, ipergrafi di conoscenza, ragionamento multi-hop e altri, fornendo una base teorica solida per la ricerca.