2025-11-12T08:22:09.411485

PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation

Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic

PRoH : Planification Dynamique et Raisonnement sur Hypergraphes de Connaissances pour la Génération Augmentée par Récupération

Informations Fondamentales

  • ID de l'article : 2510.12434
  • Titre : PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
  • Auteurs : Xiangjun Zai, Xingyu Tan, Xiaoyang Wang, Qing Liu, Xiwei Xu, Wenjie Zhang
  • Classification : cs.CL (Linguistique Computationnelle)
  • Date de publication : 14 octobre 2024 (prépublication arXiv)
  • Lien de l'article : https://arxiv.org/abs/2510.12434

Résumé

Les hypergraphes de connaissances (Knowledge Hypergraphs, KHs) constituent une forme émergente de représentation des connaissances pour la génération augmentée par récupération (RAG), offrant un paradigme pour modéliser les relations multi-entités sous forme structurée. Cependant, les méthodes RAG basées sur KH existantes présentent trois limitations majeures : la planification de récupération statique, l'exécution de récupération non-adaptative et l'exploitation superficielle de la sémantique structurelle des KH, qui limitent leur capacité à effectuer un questionnement-réponse multi-sauts efficace. Pour surmonter ces limitations, cet article propose PRoH — un cadre de planification et de raisonnement dynamique sur hypergraphes de connaissances. PRoH contient trois innovations fondamentales : (1) un module de planification sensible au contexte qui guide la génération de plans de raisonnement structuré en esquissant le voisinage local des KH ; (2) un processus de décomposition structurée des questions qui organise les sous-questions en graphes acycliques dirigés (DAG) évoluant dynamiquement pour permettre l'exploration multi-trajectoires adaptative ; (3) un algorithme de récupération de chemins de raisonnement guidé par le chevauchement pondéré par entité (EWO), privilégiant la traversée des hyperbords sémantiquement cohérente.

Contexte de Recherche et Motivation

Définition du Problème

Les systèmes RAG traditionnels s'appuient principalement sur la similarité sémantique pour la récupération, incapables de capturer les connaissances de relations structurées inhérentes à de nombreux domaines informationnels, et récupèrent fréquemment du contenu redondant ou bruyant. Bien que les RAG basés sur graphes améliorent cette situation via les graphes de connaissances (KG), la plupart des cadres existants ne modélisent que les relations impliquant deux entités, ignorant le fait que de nombreuses relations du monde réel sont intrinsèquement n-aires.

Analyse de l'Importance

De nombreuses relations du monde réel impliquent plusieurs entités, comme « Mario + Rabbids Kingdom Battle est la première collaboration majeure entre Nintendo et Ubisoft », une relation qui connecte simultanément trois entités. Décomposer ces relations n-aires en plusieurs arêtes binaires entraînerait inévitablement la perte d'informations structurelles et sémantiques clés.

Limitations des Méthodes Existantes

Les méthodes RAG basées sur KH existantes présentent trois limitations majeures :

  1. Planification de récupération statique : Dépendance envers des pipelines de récupération prédéfinis et codés en dur, appliquant la même séquence d'opérations indépendamment du contenu de la requête ou du contexte du graphe
  2. Exécution de récupération non-adaptative : Adoption d'une approche de récupération ponctuelle et non-itérative, incapable d'utiliser les résultats de raisonnement intermédiaires pour optimiser la récupération
  3. Exploitation superficielle de la sémantique structurelle du graphe : Traitement des hyperbords principalement comme des liens simples ou des mécanismes de routage pour accéder aux blocs de texte pertinents, ignorant la sémantique de relation riche encodée dans les hyperbords

Contributions Fondamentales

  1. Proposition du cadre PRoH : Un cadre RAG d'hypergraphes de connaissances dynamique exploitant pleinement la capacité expressive des hypergraphes pour le questionnement-réponse multi-sauts
  2. Mécanisme de planification sensible au contexte : Un mécanisme de planification qui esquisse l'hypergraphe de connaissances sous-jacent et génère des plans de raisonnement viables
  3. Stratégie de récupération de chemins de raisonnement guidée par EWO : Une stratégie d'exploration granulaire et sensible à la sémantique spécifique aux hypergraphes de connaissances
  4. Amélioration significative des performances : Réalisation de performances SOTA sur plusieurs domaines de connaissances, avec une amélioration moyenne du score F1 de 19,73 % et une amélioration du score d'évaluation de génération (G-E) de 8,41 %

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné une question q et un hypergraphe de connaissances H = (V, E), le RAG d'hypergraphes doit récupérer les connaissances pertinentes pour la question à partir de H (ensemble de faits F), puis générer une réponse a(q) basée sur q et F.

Architecture du Modèle

Le cadre PRoH contient quatre composants principaux :

1. Construction et Indexation du Graphe

  • Construction de KH : Adoption de la méthode HyperGraphRAG pour extraire les hyperbords à partir de documents, identifier les entités et construire le KH
  • Amélioration des hyperbords synonymes : Ajout d'hyperbords synonymes via un processus en trois étapes pour améliorer la connectivité du graphe :
    • Calcul de la similarité cosinus entre les paires d'entités
    • Formation de sous-graphes de similarité et calcul des composantes connexes
    • Utilisation d'un LLM pour déterminer les entités synonymes et ajouter les hyperbords synonymes

2. Ancrage du Graphe

  • Identification des entités thématiques : Utilisation d'un LLM pour extraire les mots-clés, liés aux entités candidates via la correspondance de similarité
  • Correspondance des hyperbords cibles : Récupération des hyperbords sémantiquement pertinents pour la question
  • Construction du sous-graphe de question : Extraction de l'union du voisinage à Dmax sauts des entités thématiques et des hyperbords cibles

3. Initialisation du Plan de Raisonnement

  • Esquisse du sous-graphe de question : Construction du graphe de contexte de planification Hp fournissant une entrée structurée au LLM
  • Génération du plan de raisonnement initial : Génération du plan de raisonnement basée sur le contexte de planification
  • Construction du DAG de raisonnement : Représentation du plan de raisonnement sous forme de graphe acyclique dirigé, application de la réduction de Hasse pour obtenir la représentation minimale

4. Processus de Raisonnement

  • Recherche dans l'espace d'états : Modélisation du raisonnement comme un problème de recherche sur les états du DAG
  • Transition d'états : Transition vers l'état suivant en résolvant les sous-questions du niveau actuel
  • Optimisation dynamique du DAG : Optimisation dynamique du DAG de raisonnement selon les réponses intermédiaires

Points d'Innovation Technique

Évaluation du Chevauchement Pondéré par Entité (EWO)

L'algorithme EWO guide la sélection de la direction de recherche via un calcul en deux étapes :

  1. Évaluation des entités :
EW(v|qj) = {
    LLMScore(v, qj), si SE(v|qj) ≥ θemb
    0, sinon
}
  1. Évaluation des hyperbords :
EWO(e'|q,e) = Agrégat({SE(v,q) | v ∈ V(e) ∩ V(e')})

Décomposition Structurée des Questions

  • Organisation des sous-questions en DAG évoluant dynamiquement plutôt qu'en séquence linéaire
  • Support de la coexistence de multiples réponses candidates et trajectoires de raisonnement multiples
  • Permettre la récupération à partir d'erreurs locales

Configuration Expérimentale

Ensembles de Données

  • Ensemble de données KHQA : Couvrant cinq domaines : médical, agricole, informatique, juridique et mixte
  • Extension des questions longue portée : Génération supplémentaire de 200 questions longue portée à 3-6 sauts par domaine pour évaluer la capacité de raisonnement multi-sauts

Métriques d'Évaluation

  • Score F1 : Mesure de la précision des réponses
  • Similarité de récupération (R-S) : Évaluation de la qualité du contenu récupéré
  • Évaluation de génération (G-E) : Évaluation de la qualité des réponses générées

Méthodes de Comparaison

  • LLM uniquement : Utilisation uniquement des connaissances intrinsèques du LLM
  • RAG standard : RAG traditionnel basé sur les blocs
  • PathRAG : Méthode RAG basée sur les chemins
  • HippoRAG2 : Méthode de mémoire à long terme inspirée par la neurobiologie
  • HyperGraphRAG : Méthode RAG d'hypergraphes SOTA actuelle

Détails d'Implémentation

  • LLM : GPT-4o-mini
  • Modèle d'intégration : text-embedding-3-small
  • Paramètres clés : profondeur de planification dp=3, limite de profondeur d'exploration KH dmax=3, nombre de plans initiaux n0=2

Résultats Expérimentaux

Résultats Principaux

PRoH a atteint les performances SOTA sur tous les scores F1 et G-E dans tous les domaines :

DomaineHyperGraphRAG F1PRoH F1Amélioration
Médical35,3552,94+49,7 %
Agricole33,8956,67+67,2 %
Informatique31,3054,15+73,0 %
Juridique43,8158,81+34,2 %
Mixte48,7169,16+42,0 %

Expériences d'Ablation

Les expériences d'ablation montrent l'importance de chaque composant :

  • Suppression de la guidance EWO : Baisse du F1 jusqu'à 5,3 %
  • Suppression de la fusion des synonymes : Baisse du F1 jusqu'à 5,2 %
  • Suppression du contexte de planification : Baisse du F1 jusqu'à 5,8 %
  • Suppression de la correspondance des hyperbords cibles : Baisse du F1 jusqu'à 8,6 %

Performance de Raisonnement Longue Portée

Dans les tâches de questionnement-réponse multi-sauts longue portée, PRoH démontre une robustesse forte, avec une amélioration moyenne du F1 de 26,68 %, atteignant une amélioration maximale de 44,87 % dans le domaine informatique.

Analyse d'Efficacité

La variante PRoH-L maintient une performance compétitive tout en réduisant significativement l'utilisation de tokens, avec une réduction de tokens de 30,07 % dans le domaine agricole tout en améliorant le F1 de 16,58 %.

Travaux Connexes

RAG Basé sur Graphes

Les méthodes RAG basées sur graphes existantes réalisent une récupération plus précise et un raisonnement conscient des relations via les graphes de connaissances, mais sont pour la plupart limitées à la représentation des relations binaires.

RAG d'Hypergraphes de Connaissances

Les systèmes précoces comme HyperGraphRAG et Hyper-RAG extraient les hyperbords pour capturer les relations d'ordre supérieur, mais s'appuient toujours sur des pipelines de récupération heuristiques ponctuels, manquant de capacités de planification sensible au contexte et de raisonnement itératif.

Conclusion et Discussion

Conclusions Principales

PRoH résout avec succès les trois limitations majeures des méthodes RAG basées sur KH existantes en introduisant la planification sensible au contexte, la décomposition structurée itérative des questions et la récupération de chemins de raisonnement guidée par EWO, réalisant des améliorations de performance significatives sur plusieurs domaines de connaissances.

Limitations

  1. Complexité computationnelle : La programmation dynamique et la recherche dans l'espace d'états peuvent entraîner des surcharges computationnelles supplémentaires
  2. Sensibilité aux paramètres : Plusieurs hyperparamètres (tels que dp, dmax, n0) nécessitent un ajustement pour différents domaines
  3. Dépendance à la qualité du graphe : Les performances dépendent fortement de la qualité et de l'exhaustivité de l'hypergraphe de connaissances initial

Directions Futures

  1. Exploration de stratégies de recherche dans l'espace d'états plus efficaces
  2. Étude de mécanismes d'ajustement de paramètres adaptatifs
  3. Extension à des hypergraphes de connaissances à plus grande échelle et des tâches de raisonnement plus complexes

Évaluation Approfondie

Points Forts

  1. Innovation forte : Premier cadre KH-RAG proposant la planification dynamique et le raisonnement, résolvant les limitations fondamentales des méthodes existantes
  2. Contributions techniques significatives : Le mécanisme d'évaluation EWO et la décomposition structurée des questions sont des innovations importantes spécifiques aux caractéristiques des hypergraphes
  3. Expérimentation complète : Couvrant plusieurs domaines et tâches de raisonnement longue portée, avec des expériences d'ablation exhaustives
  4. Amélioration de performance manifeste : Améliorations significatives et cohérentes par rapport aux méthodes SOTA

Insuffisances

  1. Complexité relativement élevée : La méthode contient plusieurs modules et paramètres, pouvant affecter la commodité du déploiement pratique
  2. Analyse insuffisante des coûts computationnels : Bien que fournissant une analyse d'utilisation de tokens, manque d'analyse détaillée de la complexité temporelle
  3. Vérification limitée de la généralisation : Les expériences se concentrent principalement sur l'ensemble de données KHQA spécifique

Impact

  1. Valeur académique : Fournit une nouvelle direction de recherche et un cadre technique pour le domaine du KH-RAG
  2. Valeur pratique : Importance significative dans les scénarios d'application nécessitant un raisonnement multi-sauts complexe
  3. Reproductibilité : Fournit une description d'algorithme détaillée et des détails d'implémentation

Scénarios d'Application

PRoH est particulièrement adapté à :

  1. Les systèmes de questionnement-réponse complexes nécessitant un raisonnement multi-sauts
  2. Les tâches intensives en connaissances impliquant des relations multi-entités
  3. Les scénarios d'application exigeant l'interprétabilité des chemins de raisonnement

Références

L'article cite 40 références connexes, couvrant les travaux importants dans les domaines du RAG basé sur graphes, des hypergraphes de connaissances, du raisonnement multi-sauts et autres, fournissant une base théorique solide pour la recherche.