PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic
PRoH : Planification Dynamique et Raisonnement sur Hypergraphes de Connaissances pour la Génération Augmentée par Récupération
Les hypergraphes de connaissances (Knowledge Hypergraphs, KHs) constituent une forme émergente de représentation des connaissances pour la génération augmentée par récupération (RAG), offrant un paradigme pour modéliser les relations multi-entités sous forme structurée. Cependant, les méthodes RAG basées sur KH existantes présentent trois limitations majeures : la planification de récupération statique, l'exécution de récupération non-adaptative et l'exploitation superficielle de la sémantique structurelle des KH, qui limitent leur capacité à effectuer un questionnement-réponse multi-sauts efficace. Pour surmonter ces limitations, cet article propose PRoH — un cadre de planification et de raisonnement dynamique sur hypergraphes de connaissances. PRoH contient trois innovations fondamentales : (1) un module de planification sensible au contexte qui guide la génération de plans de raisonnement structuré en esquissant le voisinage local des KH ; (2) un processus de décomposition structurée des questions qui organise les sous-questions en graphes acycliques dirigés (DAG) évoluant dynamiquement pour permettre l'exploration multi-trajectoires adaptative ; (3) un algorithme de récupération de chemins de raisonnement guidé par le chevauchement pondéré par entité (EWO), privilégiant la traversée des hyperbords sémantiquement cohérente.
Les systèmes RAG traditionnels s'appuient principalement sur la similarité sémantique pour la récupération, incapables de capturer les connaissances de relations structurées inhérentes à de nombreux domaines informationnels, et récupèrent fréquemment du contenu redondant ou bruyant. Bien que les RAG basés sur graphes améliorent cette situation via les graphes de connaissances (KG), la plupart des cadres existants ne modélisent que les relations impliquant deux entités, ignorant le fait que de nombreuses relations du monde réel sont intrinsèquement n-aires.
De nombreuses relations du monde réel impliquent plusieurs entités, comme « Mario + Rabbids Kingdom Battle est la première collaboration majeure entre Nintendo et Ubisoft », une relation qui connecte simultanément trois entités. Décomposer ces relations n-aires en plusieurs arêtes binaires entraînerait inévitablement la perte d'informations structurelles et sémantiques clés.
Les méthodes RAG basées sur KH existantes présentent trois limitations majeures :
Planification de récupération statique : Dépendance envers des pipelines de récupération prédéfinis et codés en dur, appliquant la même séquence d'opérations indépendamment du contenu de la requête ou du contexte du graphe
Exécution de récupération non-adaptative : Adoption d'une approche de récupération ponctuelle et non-itérative, incapable d'utiliser les résultats de raisonnement intermédiaires pour optimiser la récupération
Exploitation superficielle de la sémantique structurelle du graphe : Traitement des hyperbords principalement comme des liens simples ou des mécanismes de routage pour accéder aux blocs de texte pertinents, ignorant la sémantique de relation riche encodée dans les hyperbords
Proposition du cadre PRoH : Un cadre RAG d'hypergraphes de connaissances dynamique exploitant pleinement la capacité expressive des hypergraphes pour le questionnement-réponse multi-sauts
Mécanisme de planification sensible au contexte : Un mécanisme de planification qui esquisse l'hypergraphe de connaissances sous-jacent et génère des plans de raisonnement viables
Stratégie de récupération de chemins de raisonnement guidée par EWO : Une stratégie d'exploration granulaire et sensible à la sémantique spécifique aux hypergraphes de connaissances
Amélioration significative des performances : Réalisation de performances SOTA sur plusieurs domaines de connaissances, avec une amélioration moyenne du score F1 de 19,73 % et une amélioration du score d'évaluation de génération (G-E) de 8,41 %
Étant donné une question q et un hypergraphe de connaissances H = (V, E), le RAG d'hypergraphes doit récupérer les connaissances pertinentes pour la question à partir de H (ensemble de faits F), puis générer une réponse a(q) basée sur q et F.
Construction de KH : Adoption de la méthode HyperGraphRAG pour extraire les hyperbords à partir de documents, identifier les entités et construire le KH
Amélioration des hyperbords synonymes : Ajout d'hyperbords synonymes via un processus en trois étapes pour améliorer la connectivité du graphe :
Calcul de la similarité cosinus entre les paires d'entités
Formation de sous-graphes de similarité et calcul des composantes connexes
Utilisation d'un LLM pour déterminer les entités synonymes et ajouter les hyperbords synonymes
Identification des entités thématiques : Utilisation d'un LLM pour extraire les mots-clés, liés aux entités candidates via la correspondance de similarité
Correspondance des hyperbords cibles : Récupération des hyperbords sémantiquement pertinents pour la question
Construction du sous-graphe de question : Extraction de l'union du voisinage à Dmax sauts des entités thématiques et des hyperbords cibles
Esquisse du sous-graphe de question : Construction du graphe de contexte de planification Hp fournissant une entrée structurée au LLM
Génération du plan de raisonnement initial : Génération du plan de raisonnement basée sur le contexte de planification
Construction du DAG de raisonnement : Représentation du plan de raisonnement sous forme de graphe acyclique dirigé, application de la réduction de Hasse pour obtenir la représentation minimale
Ensemble de données KHQA : Couvrant cinq domaines : médical, agricole, informatique, juridique et mixte
Extension des questions longue portée : Génération supplémentaire de 200 questions longue portée à 3-6 sauts par domaine pour évaluer la capacité de raisonnement multi-sauts
Dans les tâches de questionnement-réponse multi-sauts longue portée, PRoH démontre une robustesse forte, avec une amélioration moyenne du F1 de 26,68 %, atteignant une amélioration maximale de 44,87 % dans le domaine informatique.
La variante PRoH-L maintient une performance compétitive tout en réduisant significativement l'utilisation de tokens, avec une réduction de tokens de 30,07 % dans le domaine agricole tout en améliorant le F1 de 16,58 %.
Les méthodes RAG basées sur graphes existantes réalisent une récupération plus précise et un raisonnement conscient des relations via les graphes de connaissances, mais sont pour la plupart limitées à la représentation des relations binaires.
Les systèmes précoces comme HyperGraphRAG et Hyper-RAG extraient les hyperbords pour capturer les relations d'ordre supérieur, mais s'appuient toujours sur des pipelines de récupération heuristiques ponctuels, manquant de capacités de planification sensible au contexte et de raisonnement itératif.
PRoH résout avec succès les trois limitations majeures des méthodes RAG basées sur KH existantes en introduisant la planification sensible au contexte, la décomposition structurée itérative des questions et la récupération de chemins de raisonnement guidée par EWO, réalisant des améliorations de performance significatives sur plusieurs domaines de connaissances.
Complexité computationnelle : La programmation dynamique et la recherche dans l'espace d'états peuvent entraîner des surcharges computationnelles supplémentaires
Sensibilité aux paramètres : Plusieurs hyperparamètres (tels que dp, dmax, n0) nécessitent un ajustement pour différents domaines
Dépendance à la qualité du graphe : Les performances dépendent fortement de la qualité et de l'exhaustivité de l'hypergraphe de connaissances initial
Innovation forte : Premier cadre KH-RAG proposant la planification dynamique et le raisonnement, résolvant les limitations fondamentales des méthodes existantes
Contributions techniques significatives : Le mécanisme d'évaluation EWO et la décomposition structurée des questions sont des innovations importantes spécifiques aux caractéristiques des hypergraphes
Expérimentation complète : Couvrant plusieurs domaines et tâches de raisonnement longue portée, avec des expériences d'ablation exhaustives
Amélioration de performance manifeste : Améliorations significatives et cohérentes par rapport aux méthodes SOTA
Complexité relativement élevée : La méthode contient plusieurs modules et paramètres, pouvant affecter la commodité du déploiement pratique
Analyse insuffisante des coûts computationnels : Bien que fournissant une analyse d'utilisation de tokens, manque d'analyse détaillée de la complexité temporelle
Vérification limitée de la généralisation : Les expériences se concentrent principalement sur l'ensemble de données KHQA spécifique
L'article cite 40 références connexes, couvrant les travaux importants dans les domaines du RAG basé sur graphes, des hypergraphes de connaissances, du raisonnement multi-sauts et autres, fournissant une base théorique solide pour la recherche.