2025-11-12T13:52:10.754709

Physics-Informed High-order Graph Dynamics Identification Learning for Predicting Complex Networks Long-term Dynamics

Wang, Wang, Xue
Learning complex network dynamics is fundamental to understanding, modelling and controlling real-world complex systems. There are two main problems in the task of predicting the dynamic evolution of complex networks: on the one hand, existing methods usually use simple graphs to describe the relationships in complex networks; however, this approach can only capture pairwise relationships, while there may be rich non-pairwise structured relationships in the network. First-order GNNs have difficulty in capturing dynamic non-pairwise relationships. On the other hand, theoretical prediction models lack accuracy and data-driven prediction models lack interpretability. To address the above problems, this paper proposes a higher-order network dynamics identification method for long-term dynamic prediction of complex networks. Firstly, to address the problem that traditional graph machine learning can only deal with pairwise relations, dynamic hypergraph learning is introduced to capture the higher-order non-pairwise relations among complex networks and improve the accuracy of complex network modelling. Then, a dual-driven dynamic prediction module for physical data is proposed. The Koopman operator theory is introduced to transform the nonlinear dynamical differential equations for the dynamic evolution of complex networks into linear systems for solving. Meanwhile, the physical information neural differential equation method is utilised to ensure that the dynamic evolution conforms to the physical laws. The dual-drive dynamic prediction module ensures both accuracy and interpretability of the prediction. Validated on public datasets and self-built industrial chain network datasets, the experimental results show that the method in this paper has good prediction accuracy and long-term prediction performance.
academic

Identificación de Dinámicas de Grafos de Alto Orden Informadas por Física para Predecir la Dinámica a Largo Plazo de Redes Complejas

Información Básica

  • ID del Artículo: 2510.09082
  • Título: Physics-Informed High-order Graph Dynamics Identification Learning for Predicting Complex Networks Long-term Dynamics
  • Autores: Bicheng Wang, Junping Wang, Yibo Xue (Instituto de Automatización, Academia China de Ciencias)
  • Clasificación: cs.AI cs.CY cs.SI physics.soc-ph
  • Fecha de Publicación: Octubre de 2025 (Preimpresión en ArXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.09082

Resumen

En este artículo se propone un método de aprendizaje de identificación de dinámicas de grafos de alto orden informado por física (PhyHSL) para predecir la evolución dinámica a largo plazo de redes complejas. El método captura relaciones no pareadas de alto orden en la red mediante el aprendizaje de hipergrafos dinámicos, y construye un módulo de predicción de doble impulso combinando la teoría del operador de Koopman y ecuaciones diferenciales neurales informadas por física, mejorando la interpretabilidad del modelo mientras se garantiza la precisión de la predicción. La validez del método se verifica mediante experimentos en conjuntos de datos públicos y conjuntos de datos de redes de cadenas industriales construidos internamente.

Antecedentes de Investigación y Motivación

Problemas Centrales

La predicción de dinámicas de redes complejas enfrenta dos desafíos principales:

  1. Limitaciones en el Modelado de Relaciones: Los métodos existentes típicamente utilizan grafos simples para describir relaciones de red, capturando solo relaciones pareadas, mientras que las redes complejas contienen abundantes relaciones estructurales no pareadas (como la colaboración multiempresarial en cadenas de suministro, estructuras de redes viales en redes de transporte).
  2. Equilibrio entre Precisión e Interpretabilidad del Modelo Predictivo: Los modelos de predicción teórica carecen de precisión, los modelos impulsados por datos carecen de interpretabilidad, y tienden a producir acumulación de errores en predicciones a largo plazo.

Importancia de la Investigación

El aprendizaje de dinámicas de redes complejas es crucial para comprender, modelar y controlar sistemas complejos del mundo real, abarcando múltiples campos como redes cerebrales, redes sociales y redes de suministro. La predicción precisa de la evolución de redes ayuda a analizar la resiliencia intrínseca de la red y predecir estados futuros.

Limitaciones de Métodos Existentes

  • Restricciones de GNN de Primer Orden: Las redes neuronales de grafos tradicionales tienen dificultades para capturar relaciones dinámicas no pareadas
  • Dependencia de Métodos de Hipergrafos: Los métodos de hipergrafos existentes dependen principalmente de estructuras predefinidas, incapaces de adaptarse a características de evolución de redes dinámicas
  • Ausencia de Restricciones Físicas: Los métodos puramente impulsados por datos carecen de restricciones de mecanismos físicos, y los resultados de predicción tienden a desviarse de las trayectorias reales de evolución del sistema

Contribuciones Principales

  1. Módulo de Aprendizaje de Estructura de Hipergrafos Dinámicos: Supera las limitaciones de los hipergrafos tradicionales que dependen de estructuras predefinidas, generando dinámicamente hiperedges adaptativos mediante descomposición de matrices de bajo rango y convolución de hipergrafos, realizando modelado en línea de interacciones no pareadas.
  2. Módulo de Predicción Impulsado por Física y Datos:
    • Introduce la teoría del operador de Koopman para convertir ecuaciones diferenciales dinámicas no lineales en sistemas lineales solubles
    • Utiliza ecuaciones diferenciales ordinarias neurales informadas por física para garantizar que la evolución dinámica cumpla con leyes físicas
    • Optimiza conjuntamente a través de un marco de inferencia variacional, mejorando la robustez del modelo
  3. Marco Completo de Dinámicas de Redes de Alto Orden: Integra leyes físicas y modelado de estructuras de grafos impulsado por datos, construyendo un paradigma de optimización colaborativa para predicción de dinámicas a largo plazo de redes complejas.
  4. Validación Experimental: Verifica la precisión de predicción y el desempeño de generalización del método en conjuntos de datos públicos y conjuntos de datos de redes de cadenas de suministro construidos internamente.

Explicación Detallada del Método

Definición de Tarea

Dada una secuencia de observaciones históricas de una red compleja, predecir la evolución dinámica futura de la red. La entrada consiste en secuencias de características de nodos y estructura de red, y la salida es la predicción del estado de nodos en momentos futuros.

Arquitectura del Modelo

1. Codificador de Captura de Relaciones de Dominio

Construye un grafo temporal que contiene aristas espaciales y temporales:

  • Aristas Espaciales: Aristas ponderadas entre objetos basadas en marcas de tiempo idénticas
  • Aristas Temporales: Aristas ponderadas entre observaciones consecutivas de cada objeto

La matriz de adyacencia se define como:

A(it, jt') = {
    w^t_ij,  si t' = t
    1,       si i = j, t' = t+1  
    0,       en otro caso
}

Convolución Espacial de Primer Orden: Combina mecanismos de atención para aprender adaptativamente información de vecindario

s^(k)(it, jt') = A(it, jt') cos(W_query h^{t,(k)}_i, W_key h^{t',(k)}_j)
h^{t,(k+1)}_i = h^{t,(k)}_i + σ(∑_{jt'∈N_it} s^(k)(it, jt') W_value h^{t',(k)}_j)

Convolución Espectral de Segundo Orden: Utiliza polinomios de Chebyshev para explorar información semántica de no-vecindario

C^(k) = ∑^2_{m=0} T_m(L̃)C^{(k-1)}W^(k)_m

2. Aprendizaje de Estructura de Hipergrafos Dinámicos (DHSL)

Genera dinámicamente hiperedges mediante descomposición de matrices de bajo rango:

Λ = UW_Λ

donde U es la superposición de representaciones de estado de nodos y W es una matriz de pesos aprendible.

Proceso de convolución de hipergrafos:

E = σ(W_E Λ^T U) + Λ^T U  (incrustación de hiperedges)
F_i = ΛE = Λ(σ(W_E Λ^T U) + Λ^T U)  (actualización de incrustación de nodos)

3. Aprendizaje de Dinámicas de Red

Módulo Impulsado por Física:

  • Genera estado inicial mediante inferencia variacional: q(z^0_i|X,A) = N(MLP_m(f_i), MLP_v(f_i))
  • Utiliza solucionador de ODE neural para calcular estado futuro: (z^1_i, z^2_i, ..., z^{T+1}_i) = ODESolver(z^0_i, g, [t=0,...,T])

Módulo Impulsado por Datos: Basado en la teoría del operador de Koopman, mapea sistemas no lineales a espacios lineales:

K ∘ g(x_t) = g(F(x_t)) = g(x_{t+1})
(z̃^0_i, z̃^1_i, ..., z̃^{T+1}_i) = (f^0_i, Kf^0_i, Kf^1_i, ..., Kf^T_i)

Predicción Fusionada:

x̂^t_i = MLP(σ([z^t_i, z̃^t_i]))

Puntos de Innovación Técnica

  1. Generación de Hipergrafos Dinámicos: Sin necesidad de estructuras predefinidas, genera hiperedges adaptativos mediante estados de nodos
  2. Combinación de Restricciones Físicas y Linealización: El operador de Koopman proporciona representación linealizada global, las ODE neurales garantizan consistencia física
  3. Marco de Optimización Colaborativa: Entrenamiento colaborativo de módulos de doble impulso bajo marco de inferencia variacional

Configuración Experimental

Conjuntos de Datos

Conjuntos de Datos Públicos:

  • Social (páginas de Facebook): 3892 nodos, 17239 aristas
  • Web (enlaces EPA): 4252 nodos, 8896 aristas
  • WS (red Watts-Strogatz): 5000 nodos, 10000 aristas

Conjunto de Datos de Cadena de Suministro Construido Internamente:

  • Manufacture: 960 nodos, 25142 aristas
  • Electronic: 700 nodos, 16604 aristas
  • Finance: 1500 nodos, 61218 aristas

Métricas de Evaluación

Se utiliza el Error Absoluto Medio (MAE):

MAE = (1/N) ∑^N_{i=1} ||x̂_i - x_i||

Métodos de Comparación

  • Métodos GNN: DCRNN, MTGODE, DiskNet
  • Métodos de Hipergrafos: HGC-RNN, MSHyper
  • Métodos PINN: PhyCRNet, PINNsFormer, PhysicsSolver

Detalles de Implementación

  • Marco: PyTorch
  • Hardware: 2 GPUs NVIDIA A100
  • Experimentos repetidos 10 veces y promediados
  • Optimización: Marco de inferencia variacional, minimización de pérdida ELBO

Resultados Experimentales

Resultados Principales

PhyHSL logra resultados óptimos o subóptimos en los 6 conjuntos de datos:

Desempeño en Conjuntos de Datos Públicos:

  • Social: 0.201±0.007 (óptimo)
  • Web: 0.178±0.014 (óptimo)
  • WS: 0.127±0.007 (óptimo)

Desempeño en Conjuntos de Datos de Cadena de Suministro:

  • Manufacture: 0.112±0.014 (óptimo)
  • Electronic: 0.247±0.013 (óptimo)
  • Finance: 0.162±0.027 (subóptimo)

Mejora promedio de aproximadamente 10% en comparación con los mejores métodos de referencia, con ventajas más evidentes en redes complejas de cadenas de suministro.

Experimentos de Ablación

Los estudios de ablación en los conjuntos de datos Social y Manufacture muestran:

  • Eliminación del módulo impulsado por física: disminución de desempeño (0.231 vs 0.201)
  • Eliminación del módulo Koopman: disminución de desempeño (0.233 vs 0.201)
  • Eliminación del módulo de hipergrafos: impacto más significativo en redes complejas
  • Eliminación simultánea de doble impulso: disminución significativa de desempeño (0.268 vs 0.201)

Análisis de Predicción a Largo Plazo

  • Impacto de Longitud de Entrenamiento: El desempeño de predicción mejora con el aumento de la longitud de entrenamiento y tiende a estabilizarse
  • Impacto de Longitud de Predicción: En predicción a largo plazo, la ventaja de PhyHSL sobre DiskNet es más evidente
  • Eficiencia Computacional: Mayor eficiencia computacional en comparación con métodos que dependen de Transformer

Hallazgos Experimentales

  1. Los módulos de doble impulso se complementan mutuamente, cada uno es indispensable
  2. El módulo de hipergrafos tiene un papel más destacado en redes complejas
  3. Las restricciones físicas reducen efectivamente la acumulación de errores en predicciones a largo plazo
  4. El operador de Koopman reduce el número de parámetros aprendibles, mejorando la eficiencia computacional

Trabajo Relacionado

Predicción de Dinámicas de Red

  • Los métodos tempranos se basaban en GNN de primer orden, como NCDN que combinó por primera vez ODE neural y GNN
  • MTGODE abstrajo series temporales multivariadas como grafos dinámicos
  • DiskNet se basó en identificación de esqueletos de red mediante grupos de renormalización en espacios hiperbólicos

Redes Neuronales de Hipergrafos

  • HGNN fue el primer método de aprendizaje de hipergrafos espaciales
  • DHGNN fue el primero en manejar dinámicas de hiperedges
  • Los métodos existentes dependen principalmente de estructuras predefinidas o similitud de nodos

Conclusiones y Discusión

Conclusiones Principales

  1. PhyHSL integra efectivamente restricciones físicas y aprendizaje de estructuras de alto orden, mejorando significativamente el desempeño de predicción de dinámicas a largo plazo de redes complejas
  2. El aprendizaje de hipergrafos dinámicos captura exitosamente relaciones no pareadas, y el módulo de doble impulso garantiza precisión e interpretabilidad
  3. Demuestra buen valor práctico en escenarios industriales

Limitaciones

  1. La complejidad del modelo es relativamente alta, requiriendo equilibrio entre desempeño y costo computacional
  2. La aplicabilidad a redes extremadamente dispersas o de escala ultra grande requiere verificación adicional
  3. El diseño de restricciones físicas puede requerir conocimiento de expertos en el dominio

Direcciones Futuras

  1. Explorar construcción de relaciones de redes de hipergrafos más complejas
  2. Investigar métodos de aprendizaje en línea para actualización de estructura de red en tiempo real
  3. Desarrollar tecnologías de monitoreo y regulación en tiempo real de resiliencia de red

Evaluación Profunda

Fortalezas

  1. Fuerte Innovación Metodológica: Primera combinación orgánica del operador de Koopman, ODE neural informado por física y aprendizaje de hipergrafos dinámicos
  2. Definición Clara del Problema: Identificación precisa de desafíos centrales en predicción de redes complejas
  3. Diseño Experimental Completo: Abarca conjuntos de datos públicos e internos, experimentos de ablación suficientes
  4. Línea Técnica Razonable: La combinación de restricciones físicas e impulso de datos tiene base teórica

Insuficiencias

  1. Análisis Teórico Insuficiente: Carencia de garantías teóricas de convergencia y estabilidad
  2. Análisis de Complejidad Computacional Faltante: No proporciona análisis detallado de complejidad
  3. Sensibilidad de Hiperparámetros: Discusión insuficiente del impacto de hiperparámetros clave
  4. Verificación de Interpretabilidad: Validación insuficiente de la efectividad de restricciones físicas

Impacto

  1. Contribución Académica: Proporciona nuevo paradigma técnico para predicción de dinámicas de redes complejas
  2. Valor Práctico: Demuestra potencial de aplicación en escenarios industriales como cadenas de suministro
  3. Reproducibilidad: Proporciona detalles de implementación detallados, facilitando reproducción

Escenarios Aplicables

  • Predicción y gestión de riesgos de redes de cadenas de suministro
  • Modelado de propagación de información en redes sociales
  • Predicción de flujo de tráfico en redes de transporte
  • Análisis dinámico de redes biológicas
  • Propagación de riesgos en redes financieras

Referencias

El artículo cita trabajos importantes en campos relacionados, incluyendo:

  • Métodos fundamentales de redes neuronales de grafos (Kipf et al., Veličković et al.)
  • Teoría de ODE neural (Chen et al.)
  • Teoría del operador de Koopman (Mezić, Strogatz)
  • Redes neuronales de hipergrafos (Feng et al., Jiang et al.)
  • Redes neuronales informadas por física (Raissi)

Evaluación General: Este artículo propone un marco de predicción de dinámicas de redes complejas con fuerte innovación técnica y alto valor práctico, con diseño de método y verificación experimental relativamente completos. Aunque existen insuficiencias en análisis teórico y complejidad computacional, sus contribuciones técnicas y perspectivas de aplicación merecen reconocimiento.