2025-11-12T08:22:09.411485

PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation

Zai, Tan, Wang et al.
Knowledge Hypergraphs (KHs) have recently emerged as a knowledge representation for retrieval-augmented generation (RAG), offering a paradigm to model multi-entity relations into a structured form. However, existing KH-based RAG methods suffer from three major limitations: static retrieval planning, non-adaptive retrieval execution, and superficial use of KH structure and semantics, which constrain their ability to perform effective multi-hop question answering. To overcome these limitations, we propose PRoH, a dynamic Planning and Reasoning over Knowledge Hypergraphs framework. PRoH incorporates three core innovations: (i) a context-aware planning module that sketches the local KH neighborhood to guide structurally grounded reasoning plan generation; (ii) a structured question decomposition process that organizes subquestions as a dynamically evolving Directed Acyclic Graph (DAG) to enable adaptive, multi-trajectory exploration; and (iii) an Entity-Weighted Overlap (EWO)-guided reasoning path retrieval algorithm that prioritizes semantically coherent hyperedge traversals. Experiments across multiple domains demonstrate that PRoH achieves state-of-the-art performance, surpassing the prior SOTA model HyperGraphRAG by an average of 19.73% in F1 and 8.41% in Generation Evaluation (G-E) score, while maintaining strong robustness in long-range multi-hop reasoning tasks.
academic

PRoH: Planificación Dinámica y Razonamiento sobre Hipergrafos de Conocimiento para Generación Aumentada por Recuperación

Información Básica

  • ID del Artículo: 2510.12434
  • Título: PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation
  • Autores: Xiangjun Zai, Xingyu Tan, Xiaoyang Wang, Qing Liu, Xiwei Xu, Wenjie Zhang
  • Clasificación: cs.CL (Lingüística Computacional)
  • Fecha de Publicación: 14 de octubre de 2024 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.12434

Resumen

Los hipergrafos de conocimiento (Knowledge Hypergraphs, KHs) como forma emergente de representación del conocimiento para la generación aumentada por recuperación (RAG), ofrecen un paradigma para modelar relaciones multi-entidad en forma estructurada. Sin embargo, los métodos RAG basados en KH existentes presentan tres limitaciones principales: planificación de recuperación estática, ejecución de recuperación no adaptativa y utilización superficial de la semántica de la estructura KH, lo que limita su capacidad para realizar respuestas efectivas a preguntas de múltiples saltos. Para superar estas limitaciones, este artículo propone PRoH, un marco de planificación y razonamiento dinámico sobre hipergrafos de conocimiento. PRoH contiene tres innovaciones principales: (1) un módulo de planificación consciente del contexto que guía la generación de planes de razonamiento estructurado mediante la delineación de vecindarios KH locales; (2) un proceso de descomposición de problemas estructurado que organiza subproblemas en grafos acíclicos dirigidos (DAG) dinámicamente evolutivos para permitir exploración adaptativa de múltiples trayectorias; (3) un algoritmo de recuperación de rutas de razonamiento guiado por superposición ponderada de entidades (EWO) que prioriza el recorrido de hiperedges semánticamente coherentes.

Contexto de Investigación y Motivación

Definición del Problema

Los sistemas RAG tradicionales dependen principalmente de la similitud semántica para la recuperación, siendo incapaces de capturar el conocimiento de relaciones estructuradas inherente a muchos dominios de información, y frecuentemente recuperan contenido redundante o ruidoso. Aunque los RAG basados en grafos mejoran este problema mediante grafos de conocimiento (KG), la mayoría de marcos existentes solo modelan relaciones que involucran dos entidades, ignorando la naturaleza n-aria de muchas relaciones en el mundo real.

Análisis de Importancia

Muchas relaciones en el mundo real involucran múltiples entidades, como "Mario + Rabbids Kingdom Battle es la primera colaboración importante entre Nintendo y Ubisoft", una relación que conecta simultáneamente tres entidades. Descomponer estas relaciones n-arias en múltiples aristas binarias inevitablemente resulta en la pérdida de información estructural y semántica clave.

Limitaciones de Métodos Existentes

Los métodos RAG basados en KH existentes presentan tres limitaciones principales:

  1. Planificación de recuperación estática: Dependen de canalizaciones de recuperación predefinidas y codificadas, aplicando la misma secuencia de operaciones independientemente del contenido de la consulta o del contexto del grafo
  2. Ejecución de recuperación no adaptativa: Adoptan un enfoque de recuperación única y no iterativa, siendo incapaces de utilizar resultados de razonamiento intermedio para optimizar la recuperación
  3. Utilización superficial de la semántica de la estructura del grafo: Tratan principalmente las hiperedges como enlaces simples o mecanismos de enrutamiento para acceder a bloques de texto relevantes, ignorando la semántica de relaciones rica codificada en las hiperedges

Contribuciones Principales

  1. Propuesta del Marco PRoH: Un marco RAG de hipergrafos de conocimiento dinámico que aprovecha plenamente la capacidad expresiva de hipergrafos para respuestas a preguntas de múltiples saltos
  2. Mecanismo de Planificación Consciente del Contexto: Un mecanismo de planificación que delinea el hipergrafo de conocimiento subyacente y genera planes de razonamiento viables
  3. Estrategia de Recuperación de Rutas de Razonamiento Guiada por EWO: Una estrategia de exploración de grano fino y consciente de la semántica específica para hipergrafos de conocimiento
  4. Mejora Significativa de Rendimiento: Logra rendimiento SOTA en múltiples dominios de conocimiento, con una mejora promedio de puntuación F1 de 19.73% y una mejora de puntuación de evaluación generativa (G-E) de 8.41%

Explicación Detallada del Método

Definición de la Tarea

Dada una pregunta q y un hipergrafo de conocimiento H = (V, E), el RAG de hipergrafos necesita recuperar conocimiento relevante para la pregunta de H (conjunto de hechos F), y luego generar una respuesta a(q) basada en q y F.

Arquitectura del Modelo

El marco PRoH contiene cuatro componentes principales:

1. Construcción e Indexación del Grafo

  • Construcción de KH: Adopta el método de HyperGraphRAG para extraer hiperedges de documentos, identificar entidades y construir KH
  • Mejora de Hiperedges de Sinónimos: Añade hiperedges de sinónimos mediante un proceso de tres pasos para mejorar la conectividad del grafo:
    • Calcular la similitud de coseno para pares de entidades
    • Formar subgrafos de similitud y calcular componentes conectados
    • Utilizar LLM para determinar entidades sinónimas y añadir hiperedges de sinónimos

2. Anclaje del Grafo

  • Identificación de Entidades de Tema: Utiliza LLM para extraer palabras clave, vinculándolas a entidades candidatas mediante coincidencia de similitud
  • Coincidencia de Hiperedges Objetivo: Recupera hiperedges semánticamente relevantes para la pregunta
  • Construcción de Subgrafo de Pregunta: Extrae la unión del vecindario de Dmax saltos de entidades de tema e hiperedges objetivo

3. Inicialización del Plan de Razonamiento

  • Delineación del Subgrafo de Pregunta: Construye el grafo de contexto de planificación Hp, proporcionando entrada estructurada al LLM
  • Generación de Plan de Razonamiento Inicial: Genera plan de razonamiento basado en el contexto de planificación
  • Construcción de DAG de Razonamiento: Representa el plan de razonamiento como un grafo acíclico dirigido, aplicando reducción de Hasse para obtener representación mínima

4. Proceso de Razonamiento

  • Búsqueda en Espacio de Estados: Modela el razonamiento como un problema de búsqueda en estados DAG
  • Transición de Estados: Transita al siguiente estado resolviendo subproblemas del nivel actual
  • Optimización Dinámica de DAG: Optimiza dinámicamente el DAG de razonamiento según respuestas intermedias

Puntos de Innovación Técnica

Puntuación de Superposición Ponderada de Entidades (EWO)

El algoritmo EWO guía la selección de dirección de búsqueda mediante cálculo de dos pasos:

  1. Puntuación de Entidad:
EW(v|qj) = {
    LLMScore(v, qj), si SE(v|qj) ≥ θemb
    0, en caso contrario
}
  1. Puntuación de Hiperedge:
EWO(e'|q,e) = Aggregate({SE(v,q) | v ∈ V(e) ∩ V(e')})

Descomposición Estructurada de Problemas

  • Organiza subproblemas en DAG dinámicamente evolutivo en lugar de secuencia lineal
  • Soporta coexistencia de múltiples respuestas candidatas y múltiples trayectorias de razonamiento
  • Permite recuperación de errores locales

Configuración Experimental

Conjuntos de Datos

  • Conjunto de Datos KHQA: Abarca cinco dominios: medicina, agricultura, ciencias de la computación, derecho y mixto
  • Extensión de Problemas de Largo Alcance: Se generan 200 problemas adicionales de 3-6 saltos por dominio para evaluar la capacidad de razonamiento de múltiples saltos

Métricas de Evaluación

  • Puntuación F1: Mide la precisión de la respuesta
  • Similitud de Recuperación (R-S): Evalúa la calidad del contenido recuperado
  • Evaluación Generativa (G-E): Evalúa la calidad de la respuesta generada

Métodos de Comparación

  • Solo LLM: Utiliza únicamente el conocimiento intrínseco de LLM
  • RAG Estándar: RAG tradicional basado en bloques
  • PathRAG: Método RAG basado en rutas
  • HippoRAG2: Método de memoria a largo plazo inspirado en neurobiología
  • HyperGraphRAG: Método SOTA actual de RAG de hipergrafos

Detalles de Implementación

  • LLM: GPT-4o-mini
  • Modelo de Incrustación: text-embedding-3-small
  • Parámetros Clave: Profundidad de planificación dp=3, límite de profundidad de exploración KH dmax=3, número de planes iniciales n0=2

Resultados Experimentales

Resultados Principales

PRoH logra rendimiento SOTA en puntuaciones F1 y G-E en todos los dominios:

DominioHyperGraphRAG F1PRoH F1Mejora
Medicina35.3552.94+49.7%
Agricultura33.8956.67+67.2%
Ciencias de la Computación31.3054.15+73.0%
Derecho43.8158.81+34.2%
Mixto48.7169.16+42.0%

Experimentos de Ablación

Los experimentos de ablación muestran la importancia de cada componente:

  • Eliminación de guía EWO: Disminución de F1 hasta 5.3%
  • Eliminación de fusión de sinónimos: Disminución de F1 hasta 5.2%
  • Eliminación de contexto de planificación: Disminución de F1 hasta 5.8%
  • Eliminación de coincidencia de hiperedges objetivo: Disminución de F1 hasta 8.6%

Rendimiento de Razonamiento de Largo Alcance

En tareas de respuesta a preguntas de múltiples saltos de largo alcance, PRoH demuestra robustez sólida, con mejora promedio de F1 de 26.68%, alcanzando mejora máxima de 44.87% en el dominio de ciencias de la computación.

Análisis de Eficiencia

La variante PRoH-L mantiene rendimiento competitivo mientras reduce significativamente el uso de tokens, logrando reducción de tokens de 30.07% en el dominio de agricultura mientras mejora F1 en 16.58%.

Trabajo Relacionado

RAG Basado en Grafos

Los métodos RAG basados en grafos existentes logran recuperación más precisa y razonamiento consciente de relaciones mediante grafos de conocimiento, pero la mayoría se limitan a representación de relaciones binarias.

RAG de Hipergrafos de Conocimiento

Sistemas tempranos como HyperGraphRAG e Hyper-RAG extraen hiperedges para capturar relaciones de orden superior, pero aún dependen de canalizaciones de recuperación heurísticas de una sola vez, careciendo de capacidad de planificación consciente del contexto y razonamiento iterativo.

Conclusiones y Discusión

Conclusiones Principales

PRoH resuelve exitosamente las tres limitaciones principales de los métodos RAG basados en KH existentes mediante la introducción de planificación consciente del contexto, descomposición estructurada e iterativa de problemas y recuperación de rutas de razonamiento guiada por EWO, logrando mejoras de rendimiento significativas en múltiples dominios de conocimiento.

Limitaciones

  1. Complejidad Computacional: La planificación dinámica y búsqueda en espacio de estados pueden introducir sobrecarga computacional adicional
  2. Sensibilidad de Parámetros: Múltiples hiperparámetros (como dp, dmax, n0) requieren ajuste específico del dominio
  3. Dependencia de Calidad del Grafo: El rendimiento depende altamente de la calidad e integridad del hipergrafo de conocimiento inicial

Direcciones Futuras

  1. Explorar estrategias de búsqueda en espacio de estados más eficientes
  2. Investigar mecanismos de ajuste de parámetros adaptativos
  3. Extender a hipergrafos de conocimiento de mayor escala y tareas de razonamiento más complejas

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Propone por primera vez un marco KH-RAG de planificación y razonamiento dinámico, resolviendo limitaciones centrales de métodos existentes
  2. Contribuciones Técnicas Significativas: El mecanismo de puntuación EWO y la descomposición estructurada de problemas son innovaciones importantes específicas para características de hipergrafos
  3. Experimentación Completa: Abarca múltiples dominios y tareas de razonamiento de largo alcance, con experimentos de ablación exhaustivos
  4. Mejora de Rendimiento Evidente: Mejoras significativas y consistentes en comparación con métodos SOTA

Insuficiencias

  1. Complejidad Relativamente Alta: El método contiene múltiples módulos y parámetros, que pueden afectar la conveniencia del despliegue práctico
  2. Análisis de Costo Computacional Insuficiente: Aunque proporciona análisis de uso de tokens, carece de análisis detallado de complejidad temporal
  3. Validación de Generalización Limitada: Los experimentos se concentran principalmente en el conjunto de datos KHQA específico

Impacto

  1. Valor Académico: Proporciona nuevas direcciones de investigación y marco técnico para el campo de KH-RAG
  2. Valor Práctico: Tiene valor importante en escenarios de aplicación que requieren razonamiento complejo de múltiples saltos
  3. Reproducibilidad: Proporciona descripción de algoritmo detallada y detalles de implementación

Escenarios Aplicables

PRoH es particularmente adecuado para:

  1. Sistemas de respuesta a preguntas complejos que requieren razonamiento de múltiples saltos
  2. Tareas intensivas en conocimiento que involucran relaciones multi-entidad
  3. Escenarios de aplicación con requisitos de interpretabilidad de rutas de razonamiento

Referencias

El artículo cita 40 referencias relacionadas, abarcando trabajo importante en campos relacionados como RAG basado en grafos, hipergrafos de conocimiento y razonamiento de múltiples saltos, proporcionando una base teórica sólida para la investigación.