2025-11-12T08:22:09.411485

PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation

Zai, Tan, Wang et al.

Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.

academic

PRoH: Pianificazione Dinamica e Ragionamento su Ipergrafi di Conoscenza per la Generazione Aumentata da Recupero

Informazioni Fondamentali

ID Articolo: 2510.12434
Titolo: PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Autori: Xiangjun Zai, Xingyu Tan, Xiaoyang Wang, Qing Liu, Xiwei Xu, Wenjie Zhang
Classificazione: cs.CL (Linguistica Computazionale)
Data di Pubblicazione: 14 ottobre 2024 (preprint arXiv)
Link dell'Articolo: https://arxiv.org/abs/2510.12434

Riassunto

Gli ipergrafi di conoscenza (Knowledge Hypergraphs, KH) rappresentano una forma emergente di rappresentazione della conoscenza per la generazione aumentata da recupero (RAG), fornendo un paradigma per modellare relazioni multi-entità in forma strutturata. Tuttavia, i metodi RAG basati su KH esistenti presentano tre limitazioni principali: pianificazione di recupero statica, esecuzione di recupero non adattiva e sfruttamento superficiale della semantica strutturale di KH, che limitano la capacità di eseguire efficaci domande e risposte multi-hop. Per superare queste limitazioni, questo articolo propone PRoH, un framework dinamico di pianificazione e ragionamento su ipergrafi di conoscenza. PRoH contiene tre innovazioni fondamentali: (1) un modulo di pianificazione consapevole del contesto che guida la generazione di piani di ragionamento strutturato delineando il vicinato locale di KH; (2) un processo di decomposizione strutturata dei problemi che organizza i sottoproblemi in un grafo aciclico diretto (DAG) dinamicamente evolutivo per consentire l'esplorazione adattiva multi-traccia; (3) un algoritmo di recupero del percorso di ragionamento guidato da sovrapposizione ponderata di entità (EWO) che privilegia l'attraversamento di iperarchi semanticamente coerenti.

Contesto di Ricerca e Motivazione

Definizione del Problema

I sistemi RAG tradizionali si basano principalmente sulla similarità semantica per il recupero, non riuscendo a catturare la conoscenza delle relazioni strutturate intrinseche a molti domini informativi, e spesso recuperano contenuti ridondanti o rumorosi. Sebbene i RAG basati su grafi migliorino questo problema attraverso grafi di conoscenza (KG), la maggior parte dei framework esistenti modella solo relazioni che coinvolgono due entità, ignorando il fatto che molte relazioni nel mondo reale sono intrinsecamente n-arie.

Analisi dell'Importanza

Molte relazioni nel mondo reale coinvolgono più entità, come "Mario + Rabbids Kingdom Battle è la prima grande collaborazione tra Nintendo e Ubisoft", una relazione che connette simultaneamente tre entità. Decomporre queste relazioni n-arie in più archi binari porterebbe inevitabilmente alla perdita di informazioni strutturali e semantiche critiche.

Limitazioni dei Metodi Esistenti

I metodi RAG basati su KH esistenti presentano tre limitazioni principali:

Pianificazione di recupero statica: Si basano su pipeline di recupero predefinite e hardcoded, applicando la stessa sequenza di operazioni indipendentemente dal contenuto della query o dal contesto del grafo
Esecuzione di recupero non adattiva: Adottano un approccio di recupero una tantum e non iterativo, incapaci di utilizzare risultati di ragionamento intermedi per ottimizzare il recupero
Sfruttamento superficiale della semantica strutturale del grafo: Trattano principalmente gli iperarchi come semplici collegamenti o meccanismi di routing per accedere a blocchi di testo rilevanti, ignorando la ricca semantica relazionale codificata negli iperarchi

Contributi Fondamentali

Propone il framework PRoH: Un framework RAG dinamico su ipergrafi di conoscenza che sfrutta pienamente la capacità espressiva degli ipergrafi per domande e risposte multi-hop
Meccanismo di pianificazione consapevole del contesto: Un meccanismo di pianificazione che delinea l'ipergrafo di conoscenza sottostante e genera piani di ragionamento fattibili
Strategia di recupero del percorso di ragionamento guidata da EWO: Una strategia di esplorazione fine-grained e consapevole della semantica specifica per ipergrafi di conoscenza
Miglioramenti significativi delle prestazioni: Raggiunge prestazioni SOTA su più domini di conoscenza, con un aumento medio del punteggio F1 del 19,73% e un aumento del punteggio di valutazione generativa (G-E) dell'8,41%

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un problema q e un ipergrafo di conoscenza H = (V, E), il RAG su ipergrafo deve recuperare da H la conoscenza rilevante per il problema (insieme di fatti F), quindi generare una risposta a(q) basata su q e F.

Architettura del Modello

Il framework PRoH contiene quattro componenti principali:

1. Costruzione e Indicizzazione del Grafo

Costruzione di KH: Adotta il metodo di HyperGraphRAG per estrarre iperarchi dai documenti, identificare entità e costruire KH
Potenziamento di iperarchi sinonimici: Aggiunge iperarchi sinonimici attraverso un processo in tre fasi per migliorare la connettività del grafo:
- Calcola la similarità del coseno per le coppie di entità
- Forma sottografi di similarità e calcola componenti connesse
- Utilizza LLM per determinare entità sinonimiche e aggiungere iperarchi sinonimici

2. Ancoraggio del Grafo

Identificazione di entità tematiche: Utilizza LLM per estrarre parole chiave, collegandole a entità candidate attraverso corrispondenza di similarità
Corrispondenza di iperarchi target: Recupera iperarchi semanticamente rilevanti per il problema
Costruzione di sottografo di problema: Estrae l'unione del vicinato Dmax-hop di entità tematiche e iperarchi target

3. Inizializzazione del Piano di Ragionamento

Delineamento del sottografo di problema: Costruisce il grafo di contesto di pianificazione Hp, fornendo input strutturato a LLM
Generazione del piano di ragionamento iniziale: Genera il piano di ragionamento basato sul contesto di pianificazione
Costruzione del DAG di ragionamento: Rappresenta il piano di ragionamento come grafo aciclico diretto, applicando la riduzione di Hasse per ottenere la rappresentazione minima

4. Processo di Ragionamento

Ricerca nello spazio degli stati: Modella il ragionamento come problema di ricerca su stati DAG
Transizione di stato: Transita al prossimo stato risolvendo i sottoproblemi del livello corrente
Ottimizzazione dinamica del DAG: Ottimizza dinamicamente il DAG di ragionamento in base alle risposte intermedie

Punti di Innovazione Tecnica

Punteggio di Sovrapposizione Ponderata di Entità (EWO)

L'algoritmo EWO guida la selezione della direzione di ricerca attraverso il calcolo in due fasi:

Punteggio di Entità:

EW(v|qj) = {
    LLMScore(v, qj), if SE(v|qj) ≥ θemb
    0, otherwise
}

Punteggio di Iperarco:

EWO(e'|q,e) = Aggregate({SE(v,q) | v ∈ V(e) ∩ V(e')})

Decomposizione Strutturata dei Problemi

Organizza i sottoproblemi in un DAG dinamicamente evolutivo piuttosto che in una sequenza lineare
Supporta la coesistenza di più risposte candidate e multiple tracce di ragionamento
Consente il recupero da errori locali

Configurazione Sperimentale

Dataset

Dataset KHQA: Copre cinque domini: medicina, agricoltura, informatica, diritto e misto
Estensione di problemi a lungo raggio: Genera ulteriormente 200 problemi a lungo raggio di 3-6 hop per dominio per valutare la capacità di ragionamento multi-hop

Metriche di Valutazione

Punteggio F1: Misura l'accuratezza della risposta
Similarità di Recupero (R-S): Valuta la qualità del contenuto recuperato
Valutazione Generativa (G-E): Valuta la qualità della risposta generata

Metodi di Confronto

Solo LLM: Utilizza solo la conoscenza intrinseca di LLM
RAG Standard: RAG tradizionale basato su blocchi
PathRAG: Metodo RAG basato su percorsi
HippoRAG2: Metodo di memoria a lungo termine ispirato alla neurobiologia
HyperGraphRAG: Metodo RAG su ipergrafi SOTA attuale

Dettagli di Implementazione

LLM: GPT-4o-mini
Modello di embedding: text-embedding-3-small
Parametri chiave: profondità di pianificazione dp=3, limite di profondità di esplorazione KH dmax=3, numero di piani iniziali n0=2

Risultati Sperimentali

Risultati Principali

PRoH raggiunge prestazioni SOTA su punteggi F1 e G-E in tutti i domini:

Dominio	HyperGraphRAG F1	PRoH F1	Miglioramento
Medicina	35.35	52.94	+49.7%
Agricoltura	33.89	56.67	+67.2%
Informatica	31.30	54.15	+73.0%
Diritto	43.81	58.81	+34.2%
Misto	48.71	69.16	+42.0%

Esperimenti di Ablazione

Gli esperimenti di ablazione mostrano l'importanza di ciascun componente:

Rimozione della guida EWO: Calo di F1 fino al 5.3%
Rimozione dell'unione di sinonimi: Calo di F1 fino al 5.2%
Rimozione del contesto di pianificazione: Calo di F1 fino al 5.8%
Rimozione della corrispondenza di iperarchi target: Calo di F1 fino al 8.6%

Prestazioni di Ragionamento a Lungo Raggio

Nei compiti di domande e risposte multi-hop a lungo raggio, PRoH mostra una robustezza forte, con un miglioramento medio di F1 del 26.68% e un miglioramento massimo del 44.87% nel dominio dell'informatica.

Analisi di Efficienza

La variante PRoH-L mantiene prestazioni competitive riducendo significativamente l'utilizzo di token, con una riduzione di token del 30.07% nel dominio agricolo mantenendo un miglioramento di F1 del 16.58%.

Lavori Correlati

RAG Basato su Grafi

I metodi RAG basati su grafi esistenti realizzano recupero più preciso e ragionamento consapevole delle relazioni attraverso grafi di conoscenza, ma la maggior parte è limitata alla rappresentazione di relazioni binarie.

RAG su Ipergrafi di Conoscenza

Sistemi precoci come HyperGraphRAG e Hyper-RAG estraggono iperarchi per catturare relazioni di ordine superiore, ma si basano ancora su pipeline di recupero euristiche una tantum, mancando di capacità di pianificazione consapevole del contesto e di ragionamento iterativo.

Conclusioni e Discussione

Conclusioni Principali

PRoH risolve con successo le tre limitazioni principali dei metodi RAG basati su KH esistenti introducendo pianificazione consapevole del contesto, decomposizione strutturata iterativa dei problemi e recupero del percorso di ragionamento guidato da EWO, realizzando miglioramenti significativi delle prestazioni su più domini di conoscenza.

Limitazioni

Complessità Computazionale: La programmazione dinamica e la ricerca nello spazio degli stati possono comportare costi computazionali aggiuntivi
Sensibilità ai Parametri: Più iperparametri (come dp, dmax, n0) richiedono ottimizzazione per diversi domini
Dipendenza dalla Qualità del Grafo: Le prestazioni dipendono altamente dalla qualità e dalla completezza dell'ipergrafo di conoscenza iniziale

Direzioni Future

Esplorare strategie di ricerca nello spazio degli stati più efficienti
Ricercare meccanismi di regolazione adattiva dei parametri
Estendere a ipergrafi di conoscenza su scala più ampia e compiti di ragionamento più complessi

Valutazione Approfondita

Punti di Forza

Forte Innovatività: Primo framework KH-RAG con pianificazione dinamica e ragionamento, affrontando le limitazioni fondamentali dei metodi esistenti
Contributi Tecnici Significativi: Il meccanismo di punteggio EWO e la decomposizione strutturata dei problemi sono innovazioni importanti specifiche per le caratteristiche degli ipergrafi
Esperimenti Completi: Coprono più domini e compiti di ragionamento a lungo raggio, con esperimenti di ablazione completi
Miglioramenti di Prestazioni Evidenti: Miglioramenti significativi e coerenti rispetto ai metodi SOTA

Insufficienze

Complessità Relativamente Alta: Il metodo contiene più moduli e parametri, che potrebbero influenzare la convenienza del dispiegamento pratico
Analisi dei Costi Computazionali Insufficiente: Sebbene fornisca analisi di utilizzo di token, manca un'analisi dettagliata della complessità temporale
Verifica di Generalizzabilità Limitata: Gli esperimenti si concentrano principalmente sul dataset KHQA specifico

Valore di Impatto

Valore Accademico: Fornisce nuove direzioni di ricerca e framework tecnico per il campo KH-RAG
Valore Pratico: Ha importanza significativa in scenari di applicazione che richiedono ragionamento complesso multi-hop
Riproducibilità: Fornisce descrizioni dettagliate degli algoritmi e dettagli di implementazione

Scenari Applicabili

PRoH è particolarmente adatto per:

Sistemi di domande e risposte complessi che richiedono ragionamento multi-hop
Compiti ad alta intensità di conoscenza che coinvolgono relazioni multi-entità
Scenari di applicazione che richiedono interpretabilità dei percorsi di ragionamento

Bibliografia

L'articolo cita 40 lavori correlati, coprendo importanti lavori nei campi del RAG basato su grafi, ipergrafi di conoscenza, ragionamento multi-hop e altri, fornendo una base teorica solida per la ricerca.