2025-11-12T13:52:10.754709

Physics-Informed High-order Graph Dynamics Identification Learning for Predicting Complex Networks Long-term Dynamics

Wang, Wang, Xue

Learning complex network dynamics is fundamental to understanding, modelling and controlling real-world complex systems. There are two main problems in the task of predicting the dynamic evolution of complex networks: on the one hand, existing methods usually use simple graphs to describe the relationships in complex networks; however, this approach can only capture pairwise relationships, while there may be rich non-pairwise structured relationships in the network. First-order GNNs have difficulty in capturing dynamic non-pairwise relationships. On the other hand, theoretical prediction models lack accuracy and data-driven prediction models lack interpretability. To address the above problems, this paper proposes a higher-order network dynamics identification method for long-term dynamic prediction of complex networks. Firstly, to address the problem that traditional graph machine learning can only deal with pairwise relations, dynamic hypergraph learning is introduced to capture the higher-order non-pairwise relations among complex networks and improve the accuracy of complex network modelling. Then, a dual-driven dynamic prediction module for physical data is proposed. The Koopman operator theory is introduced to transform the nonlinear dynamical differential equations for the dynamic evolution of complex networks into linear systems for solving. Meanwhile, the physical information neural differential equation method is utilised to ensure that the dynamic evolution conforms to the physical laws. The dual-drive dynamic prediction module ensures both accuracy and interpretability of the prediction. Validated on public datasets and self-built industrial chain network datasets, the experimental results show that the method in this paper has good prediction accuracy and long-term prediction performance.

academic

Identificación de Dinámicas de Grafos de Alto Orden Informadas por Física para Predecir la Dinámica a Largo Plazo de Redes Complejas

Información Básica

ID del Artículo: 2510.09082
Título: Physics-Informed High-order Graph Dynamics Identification Learning for Predicting Complex Networks Long-term Dynamics
Autores: Bicheng Wang, Junping Wang, Yibo Xue (Instituto de Automatización, Academia China de Ciencias)
Clasificación: cs.AI cs.CY cs.SI physics.soc-ph
Fecha de Publicación: Octubre de 2025 (Preimpresión en ArXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.09082

Resumen

En este artículo se propone un método de aprendizaje de identificación de dinámicas de grafos de alto orden informado por física (PhyHSL) para predecir la evolución dinámica a largo plazo de redes complejas. El método captura relaciones no pareadas de alto orden en la red mediante el aprendizaje de hipergrafos dinámicos, y construye un módulo de predicción de doble impulso combinando la teoría del operador de Koopman y ecuaciones diferenciales neurales informadas por física, mejorando la interpretabilidad del modelo mientras se garantiza la precisión de la predicción. La validez del método se verifica mediante experimentos en conjuntos de datos públicos y conjuntos de datos de redes de cadenas industriales construidos internamente.

Antecedentes de Investigación y Motivación

Problemas Centrales

La predicción de dinámicas de redes complejas enfrenta dos desafíos principales:

Limitaciones en el Modelado de Relaciones: Los métodos existentes típicamente utilizan grafos simples para describir relaciones de red, capturando solo relaciones pareadas, mientras que las redes complejas contienen abundantes relaciones estructurales no pareadas (como la colaboración multiempresarial en cadenas de suministro, estructuras de redes viales en redes de transporte).
Equilibrio entre Precisión e Interpretabilidad del Modelo Predictivo: Los modelos de predicción teórica carecen de precisión, los modelos impulsados por datos carecen de interpretabilidad, y tienden a producir acumulación de errores en predicciones a largo plazo.

Importancia de la Investigación

El aprendizaje de dinámicas de redes complejas es crucial para comprender, modelar y controlar sistemas complejos del mundo real, abarcando múltiples campos como redes cerebrales, redes sociales y redes de suministro. La predicción precisa de la evolución de redes ayuda a analizar la resiliencia intrínseca de la red y predecir estados futuros.

Limitaciones de Métodos Existentes

Restricciones de GNN de Primer Orden: Las redes neuronales de grafos tradicionales tienen dificultades para capturar relaciones dinámicas no pareadas
Dependencia de Métodos de Hipergrafos: Los métodos de hipergrafos existentes dependen principalmente de estructuras predefinidas, incapaces de adaptarse a características de evolución de redes dinámicas
Ausencia de Restricciones Físicas: Los métodos puramente impulsados por datos carecen de restricciones de mecanismos físicos, y los resultados de predicción tienden a desviarse de las trayectorias reales de evolución del sistema

Contribuciones Principales

Módulo de Aprendizaje de Estructura de Hipergrafos Dinámicos: Supera las limitaciones de los hipergrafos tradicionales que dependen de estructuras predefinidas, generando dinámicamente hiperedges adaptativos mediante descomposición de matrices de bajo rango y convolución de hipergrafos, realizando modelado en línea de interacciones no pareadas.
Módulo de Predicción Impulsado por Física y Datos:
- Introduce la teoría del operador de Koopman para convertir ecuaciones diferenciales dinámicas no lineales en sistemas lineales solubles
- Utiliza ecuaciones diferenciales ordinarias neurales informadas por física para garantizar que la evolución dinámica cumpla con leyes físicas
- Optimiza conjuntamente a través de un marco de inferencia variacional, mejorando la robustez del modelo
Marco Completo de Dinámicas de Redes de Alto Orden: Integra leyes físicas y modelado de estructuras de grafos impulsado por datos, construyendo un paradigma de optimización colaborativa para predicción de dinámicas a largo plazo de redes complejas.
Validación Experimental: Verifica la precisión de predicción y el desempeño de generalización del método en conjuntos de datos públicos y conjuntos de datos de redes de cadenas de suministro construidos internamente.

Explicación Detallada del Método

Definición de Tarea

Dada una secuencia de observaciones históricas de una red compleja, predecir la evolución dinámica futura de la red. La entrada consiste en secuencias de características de nodos y estructura de red, y la salida es la predicción del estado de nodos en momentos futuros.

Arquitectura del Modelo

1. Codificador de Captura de Relaciones de Dominio

Construye un grafo temporal que contiene aristas espaciales y temporales:

Aristas Espaciales: Aristas ponderadas entre objetos basadas en marcas de tiempo idénticas
Aristas Temporales: Aristas ponderadas entre observaciones consecutivas de cada objeto

La matriz de adyacencia se define como:

A(it, jt') = {
    w^t_ij,  si t' = t
    1,       si i = j, t' = t+1  
    0,       en otro caso
}

Convolución Espacial de Primer Orden: Combina mecanismos de atención para aprender adaptativamente información de vecindario

s^(k)(it, jt') = A(it, jt') cos(W_query h^{t,(k)}_i, W_key h^{t',(k)}_j)
h^{t,(k+1)}_i = h^{t,(k)}_i + σ(∑_{jt'∈N_it} s^(k)(it, jt') W_value h^{t',(k)}_j)

Convolución Espectral de Segundo Orden: Utiliza polinomios de Chebyshev para explorar información semántica de no-vecindario

C^(k) = ∑^2_{m=0} T_m(L̃)C^{(k-1)}W^(k)_m

2. Aprendizaje de Estructura de Hipergrafos Dinámicos (DHSL)

Genera dinámicamente hiperedges mediante descomposición de matrices de bajo rango:

Λ = UW_Λ

donde U es la superposición de representaciones de estado de nodos y W es una matriz de pesos aprendible.

Proceso de convolución de hipergrafos:

E = σ(W_E Λ^T U) + Λ^T U  (incrustación de hiperedges)
F_i = ΛE = Λ(σ(W_E Λ^T U) + Λ^T U)  (actualización de incrustación de nodos)

3. Aprendizaje de Dinámicas de Red

Módulo Impulsado por Física:

Genera estado inicial mediante inferencia variacional: q(z^0_i|X,A) = N(MLP_m(f_i), MLP_v(f_i))
Utiliza solucionador de ODE neural para calcular estado futuro: (z^1_i, z^2_i, ..., z^{T+1}_i) = ODESolver(z^0_i, g, [t=0,...,T])

Módulo Impulsado por Datos: Basado en la teoría del operador de Koopman, mapea sistemas no lineales a espacios lineales:

K ∘ g(x_t) = g(F(x_t)) = g(x_{t+1})
(z̃^0_i, z̃^1_i, ..., z̃^{T+1}_i) = (f^0_i, Kf^0_i, Kf^1_i, ..., Kf^T_i)

Predicción Fusionada:

x̂^t_i = MLP(σ([z^t_i, z̃^t_i]))

Puntos de Innovación Técnica

Generación de Hipergrafos Dinámicos: Sin necesidad de estructuras predefinidas, genera hiperedges adaptativos mediante estados de nodos
Combinación de Restricciones Físicas y Linealización: El operador de Koopman proporciona representación linealizada global, las ODE neurales garantizan consistencia física
Marco de Optimización Colaborativa: Entrenamiento colaborativo de módulos de doble impulso bajo marco de inferencia variacional

Configuración Experimental

Conjuntos de Datos

Conjuntos de Datos Públicos:

Social (páginas de Facebook): 3892 nodos, 17239 aristas
Web (enlaces EPA): 4252 nodos, 8896 aristas
WS (red Watts-Strogatz): 5000 nodos, 10000 aristas

Conjunto de Datos de Cadena de Suministro Construido Internamente:

Manufacture: 960 nodos, 25142 aristas
Electronic: 700 nodos, 16604 aristas
Finance: 1500 nodos, 61218 aristas

Métricas de Evaluación

Se utiliza el Error Absoluto Medio (MAE):

MAE = (1/N) ∑^N_{i=1} ||x̂_i - x_i||

Métodos de Comparación

Métodos GNN: DCRNN, MTGODE, DiskNet
Métodos de Hipergrafos: HGC-RNN, MSHyper
Métodos PINN: PhyCRNet, PINNsFormer, PhysicsSolver

Detalles de Implementación

Marco: PyTorch
Hardware: 2 GPUs NVIDIA A100
Experimentos repetidos 10 veces y promediados
Optimización: Marco de inferencia variacional, minimización de pérdida ELBO

Resultados Experimentales

Resultados Principales

PhyHSL logra resultados óptimos o subóptimos en los 6 conjuntos de datos:

Desempeño en Conjuntos de Datos Públicos:

Social: 0.201±0.007 (óptimo)
Web: 0.178±0.014 (óptimo)
WS: 0.127±0.007 (óptimo)

Desempeño en Conjuntos de Datos de Cadena de Suministro:

Manufacture: 0.112±0.014 (óptimo)
Electronic: 0.247±0.013 (óptimo)
Finance: 0.162±0.027 (subóptimo)

Mejora promedio de aproximadamente 10% en comparación con los mejores métodos de referencia, con ventajas más evidentes en redes complejas de cadenas de suministro.

Experimentos de Ablación

Los estudios de ablación en los conjuntos de datos Social y Manufacture muestran:

Eliminación del módulo impulsado por física: disminución de desempeño (0.231 vs 0.201)
Eliminación del módulo Koopman: disminución de desempeño (0.233 vs 0.201)
Eliminación del módulo de hipergrafos: impacto más significativo en redes complejas
Eliminación simultánea de doble impulso: disminución significativa de desempeño (0.268 vs 0.201)

Análisis de Predicción a Largo Plazo

Impacto de Longitud de Entrenamiento: El desempeño de predicción mejora con el aumento de la longitud de entrenamiento y tiende a estabilizarse
Impacto de Longitud de Predicción: En predicción a largo plazo, la ventaja de PhyHSL sobre DiskNet es más evidente
Eficiencia Computacional: Mayor eficiencia computacional en comparación con métodos que dependen de Transformer

Hallazgos Experimentales

Los módulos de doble impulso se complementan mutuamente, cada uno es indispensable
El módulo de hipergrafos tiene un papel más destacado en redes complejas
Las restricciones físicas reducen efectivamente la acumulación de errores en predicciones a largo plazo
El operador de Koopman reduce el número de parámetros aprendibles, mejorando la eficiencia computacional

Trabajo Relacionado

Predicción de Dinámicas de Red

Los métodos tempranos se basaban en GNN de primer orden, como NCDN que combinó por primera vez ODE neural y GNN
MTGODE abstrajo series temporales multivariadas como grafos dinámicos
DiskNet se basó en identificación de esqueletos de red mediante grupos de renormalización en espacios hiperbólicos

Redes Neuronales de Hipergrafos

HGNN fue el primer método de aprendizaje de hipergrafos espaciales
DHGNN fue el primero en manejar dinámicas de hiperedges
Los métodos existentes dependen principalmente de estructuras predefinidas o similitud de nodos

Conclusiones y Discusión

Conclusiones Principales

PhyHSL integra efectivamente restricciones físicas y aprendizaje de estructuras de alto orden, mejorando significativamente el desempeño de predicción de dinámicas a largo plazo de redes complejas
El aprendizaje de hipergrafos dinámicos captura exitosamente relaciones no pareadas, y el módulo de doble impulso garantiza precisión e interpretabilidad
Demuestra buen valor práctico en escenarios industriales

Limitaciones

La complejidad del modelo es relativamente alta, requiriendo equilibrio entre desempeño y costo computacional
La aplicabilidad a redes extremadamente dispersas o de escala ultra grande requiere verificación adicional
El diseño de restricciones físicas puede requerir conocimiento de expertos en el dominio

Direcciones Futuras

Explorar construcción de relaciones de redes de hipergrafos más complejas
Investigar métodos de aprendizaje en línea para actualización de estructura de red en tiempo real
Desarrollar tecnologías de monitoreo y regulación en tiempo real de resiliencia de red

Evaluación Profunda

Fortalezas

Fuerte Innovación Metodológica: Primera combinación orgánica del operador de Koopman, ODE neural informado por física y aprendizaje de hipergrafos dinámicos
Definición Clara del Problema: Identificación precisa de desafíos centrales en predicción de redes complejas
Diseño Experimental Completo: Abarca conjuntos de datos públicos e internos, experimentos de ablación suficientes
Línea Técnica Razonable: La combinación de restricciones físicas e impulso de datos tiene base teórica

Insuficiencias

Análisis Teórico Insuficiente: Carencia de garantías teóricas de convergencia y estabilidad
Análisis de Complejidad Computacional Faltante: No proporciona análisis detallado de complejidad
Sensibilidad de Hiperparámetros: Discusión insuficiente del impacto de hiperparámetros clave
Verificación de Interpretabilidad: Validación insuficiente de la efectividad de restricciones físicas

Impacto

Contribución Académica: Proporciona nuevo paradigma técnico para predicción de dinámicas de redes complejas
Valor Práctico: Demuestra potencial de aplicación en escenarios industriales como cadenas de suministro
Reproducibilidad: Proporciona detalles de implementación detallados, facilitando reproducción

Escenarios Aplicables

Predicción y gestión de riesgos de redes de cadenas de suministro
Modelado de propagación de información en redes sociales
Predicción de flujo de tráfico en redes de transporte
Análisis dinámico de redes biológicas
Propagación de riesgos en redes financieras

Referencias

El artículo cita trabajos importantes en campos relacionados, incluyendo:

Métodos fundamentales de redes neuronales de grafos (Kipf et al., Veličković et al.)
Teoría de ODE neural (Chen et al.)
Teoría del operador de Koopman (Mezić, Strogatz)
Redes neuronales de hipergrafos (Feng et al., Jiang et al.)
Redes neuronales informadas por física (Raissi)

Evaluación General: Este artículo propone un marco de predicción de dinámicas de redes complejas con fuerte innovación técnica y alto valor práctico, con diseño de método y verificación experimental relativamente completos. Aunque existen insuficiencias en análisis teórico y complejidad computacional, sus contribuciones técnicas y perspectivas de aplicación merecen reconocimiento.