2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.

Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.

academic

Predicción Probabilística de Métricas de QoS en Redes Tolerantes a Retardos Utilizando Modelos de Difusión Condicional en Dinámicas Latentes

Información Básica

ID del Artículo: 2504.08821
Título: Predicción Probabilística de Métricas de QoS en Redes Tolerantes a Retardos Utilizando Modelos de Difusión Condicional en Dinámicas Latentes
Autores: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
Clasificación: cs.LG (Aprendizaje Automático), stat.ML (Estadística - Aprendizaje Automático)
Fecha de Publicación: 15 de octubre de 2025 (arXiv v3)
Enlace del Artículo: https://arxiv.org/abs/2504.08821v3

Resumen

Este artículo aborda el problema de predicción de métricas de QoS en redes tolerantes a retardos (DTN) mediante un método de predicción probabilística basado en modelos de difusión condicional. Los métodos tradicionales de regresión de media tienen dificultades para capturar adecuadamente la complejidad de los datos, lo que resulta en un rendimiento deficiente en tareas operacionales como el enrutamiento en DTN. El artículo formaliza el problema de predicción de métricas de QoS en DTN como un problema de predicción probabilística de series temporales multivariadas, utilizando modelos de difusión combinados con dinámicas temporales latentes para cuantificar la incertidumbre en las predicciones. Los resultados experimentales demuestran que este método logra el mejor rendimiento entre los métodos populares de predicción probabilística de series temporales.

Antecedentes de Investigación y Motivación

Definición del Problema

Las redes tolerantes a retardos (DTN) desempeñan un papel importante en comunicaciones a distancias extremadamente largas o en entornos adversos, con aplicaciones generalizadas en comunicaciones vehiculares, redes de monitoreo de vida silvestre y comunicaciones en zonas rurales. Las DTN frecuentemente enfrentan desafíos como interrupciones frecuentes, altas tasas de error y retardos que pueden persistir durante horas o incluso días.

Importancia del Problema

Optimización del Rendimiento de Red: La predicción de métricas de QoS puede mejorar el rendimiento de la red en términos de latencia, rendimiento, consumo de energía y confiabilidad
Programación de Recursos: Los protocolos de enrutamiento pueden distribuir información de manera más eficiente según el estado de la red, reduciendo el consumo de energía
Gestión de Prioridades de Tráfico: Diferentes tipos de tráfico de red tienen diferentes requisitos de QoS, y la predicción ayuda en la asignación de prioridades

Limitaciones de Métodos Existentes

Métodos Tradicionales de Regresión de Media: Basados en modelos autorregresivos, enfocados en proporcionar predicciones puntuales precisas minimizando métricas como MSE
Procesamiento Insuficiente de Datos Multimodales: Cuando los datos contienen múltiples modas, la regresión de media no puede capturar la complejidad completa de los datos
Ausencia de Cuantificación de Incertidumbre: Los métodos de regresión determinista no pueden cuantificar la incertidumbre en las predicciones, lo cual es necesario en tareas operacionales como el enrutamiento en DTN

Motivación de la Investigación

Las series temporales de QoS en DTN presentan características no estacionarias y multimodales, requiriendo un método que pueda:

Capturar la dinámica compleja de datos temporales
Proporcionar un marco de predicción probabilística que cuantifique la incertidumbre
Procesar datos no estacionarios y multimodales de manera robusta

Contribuciones Principales

Redefinición del Problema: Reformula el problema de predicción de métricas de QoS en DTN como un problema de predicción probabilística de series temporales, permitiendo cuantificar la incertidumbre en las predicciones
Extensión del Modelo de Difusión: Extiende modelos de difusión populares para inferir muestras de la distribución predictiva, combinando dinámicas de contexto temporal latente para mejorar la adaptabilidad del modelo a series temporales no estacionarias y multimodales
Marco DiffTCN: Propone un marco de modelo de difusión condicional que combina redes convolucionales temporales (TCN) y Transformer, capturando efectivamente dependencias a largo plazo
Verificación Experimental: Mediante experimentos extensos demuestra las ventajas del método propuesto sobre técnicas existentes, logrando el mejor rendimiento en múltiples métricas de evaluación

Explicación Detallada del Método

Definición de la Tarea

Dada una serie temporal multivariada $X = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}$ , donde $m$ es el número de variables y $t$ es la longitud de la serie temporal. El objetivo es predecir la distribución de los próximos $p$ pasos temporales $Y = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}$ , donde $n \leq m$ .

Arquitectura del Modelo

1. Fundamentos del Modelo de Difusión

El modelo de difusión contiene dos procesos:

Proceso de Difusión Hacia Adelante: Añade progresivamente ruido gaussiano a los datos $q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)$
Proceso de Desruido Inverso: Recupera los datos a partir del ruido $p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)$

La función de pérdida se simplifica a: $L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]$

2. Modelo de Difusión Condicional

Para mejorar la precisión y confiabilidad de las predicciones, se introduce información condicional: $p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)$

donde $e^j$ representa la dinámica temporal en el tiempo $j$ . La función de pérdida condicional es: $L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]$

3. Captura de Dinámicas Temporales Latentes

Se utiliza una red convolucional temporal (TCN) para capturar dinámicas de contexto, cuyos componentes principales incluyen:

Convolución Causal: Previene fugas de información
Red Completamente Convolucional 1D: Mapeo de entrada a salida
Convolución Dilatada: Expande el campo receptivo
Bloques Temporales Residuales: Profundiza la red

4. Integración de Transformer

Se utiliza Transformer para reemplazar capas de convolución dilatada como módulo computacional principal:

Captura relaciones de dependencia a largo plazo en series temporales
Pondera dinámicamente los valores de características en diferentes pasos temporales
Captura interdependencias entre diferentes variables mediante mecanismos de atención

Puntos de Innovación Técnica

Paradigma de Predicción Probabilística: Transición de predicción determinista a predicción probabilística, permitiendo cuantificar la incertidumbre
Diseño de Difusión Condicional: Integra dinámicas temporales de contexto como información condicional en el proceso de difusión
Fusión TCN-Transformer: Combina el paralelismo de TCN con la capacidad de capturar dependencias a largo plazo de Transformer
Estrategia de Predicción Iterativa: Adopta un método de predicción paso a paso, aplicable a rangos de predicción arbitrarios

Configuración Experimental

Conjuntos de Datos

Se utilizan conjuntos de datos de sensores públicos que contienen métricas de QoS como latencia de Internet:

Escala de Datos: Más de 100 días de datos, muestreados una vez por minuto
División de Datos:
- D1: Aproximadamente 80,000 marcas de tiempo
- D2: Aproximadamente 40,000 marcas de tiempo, con diferentes rangos numéricos y distribuciones
Configuración de Predicción: Utiliza las últimas 120 marcas de tiempo para predecir valores de latencia en los próximos 10 pasos temporales

Métricas de Evaluación

MAE (Error Absoluto Medio): Error absoluto promedio
MSE (Error Cuadrático Medio): Error cuadrático promedio
CRPS (Puntuación de Probabilidad Clasificada Continua): Puntuación de probabilidad clasificada continua $CRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy$

Métodos de Comparación

DeepAR: Método autorregresivo profundo basado en redes recurrentes
DeepFactor: Modelo híbrido que combina modelos clásicos de series temporales con redes neuronales profundas
TimeGrad: Método de desruido autorregresivo basado en modelos de difusión
Diffusion: Modelo de difusión vanilla original

Detalles de Implementación

Optimizador: Adam, tasa de aprendizaje 0.001
Pasos de Difusión: 50 pasos
Nivel de Ruido: β₁ = 0.0001, βₜ = 0.5
Tamaño de Lote: 64
Número de Muestras de Inferencia: 100 muestras para aproximar la distribución
Hardware: GPU Nvidia 3090 individual (24GB)

Resultados Experimentales

Resultados Principales

Resultados de MAE y MSE

Conjunto de Datos	Rango Temporal	MSE			MAE
		Diffusion	TimeGrad	DiffTCN	Diffusion	TimeGrad	DiffTCN
D1	1	2.750±0.312	2.372±0.084	1.959±0.033	1.150±0.021	1.020±0.011	0.749±0.014
D1	10	2.594±0.116	2.203±0.087	1.924±0.015	1.060±0.013	0.915±0.036	0.761±0.011
D2	1	6.042±0.582	3.905±0.163	3.371±0.072	2.424±0.230	1.926±0.114	1.634±0.029
D2	10	6.572±0.219	4.455±0.319	2.508±0.096	2.324±0.151	1.808±0.013	1.707±0.010

Resultados de CRPS

Método	D1	D2
DeepAR	0.065±0.007	0.096±0.008
DeepFactor	0.064±0.001	0.095±0.001
Diffusion	0.082±0.009	0.127±0.010
TimeGrad	0.067±0.003	0.091±0.004
DiffTCN	0.052±0.001	0.081±0.002

Hallazgos Experimentales

Ventaja Consistente: DiffTCN logra el mejor rendimiento en todos los rangos de predicción y conjuntos de datos
Cuantificación de Incertidumbre: Los resultados de CRPS demuestran que DiffTCN supera significativamente a los métodos de referencia en calidad de predicción probabilística
Estabilidad: DiffTCN exhibe la menor variabilidad de rendimiento, indicando la robustez del método
Ventaja de TCN: En comparación con TimeGrad que utiliza codificadores RNN, el paralelismo de TCN proporciona mejoras de precisión evidentes

Trabajo Relacionado

Predicción de QoS en DTN

Métodos de Redes Neuronales: Abdellah et al. utilizan NARX-RNN para predecir latencia de red
Aplicación de LSTM: Nagai et al. construyen una plataforma de prueba de red de sensores inalámbricos, utilizando LSTM para predecir latencia
Factorización de Matrices: Ghandi et al. formalizan el problema de predicción de latencia de red como un problema de factorización de matrices no negativas

Predicción de Series Temporales

Métodos Tradicionales: Métodos de predicción basados en modelos estadísticos como ARMA
Aprendizaje Profundo: Métodos de redes neuronales recurrentes como RNN, LSTM, GRU
Predicción Probabilística: Marcos de predicción probabilística como DeepAR y DeepFactor

Aplicaciones de Modelos de Difusión

Generación de Imágenes: Aplicaciones exitosas de modelos de difusión en tareas de generación de imágenes
Series Temporales: Aplicación de modelos de difusión a predicción de series temporales como TimeGrad

Conclusiones y Discusión

Conclusiones Principales

Ventaja de Predicción Probabilística: Reformular el problema de predicción de QoS como predicción probabilística puede cuantificar efectivamente la incertidumbre
Efectividad del Modelo de Difusión: El modelo de difusión condicional puede procesar efectivamente datos de series temporales no estacionarias y multimodales
Diseño de Arquitectura Razonable: La combinación de TCN y Transformer aprovecha efectivamente las ventajas de ambos

Limitaciones

Complejidad Computacional: Los modelos de difusión requieren muestreo multietapa, con sobrecarga computacional considerable
Escala de Conjunto de Datos: Los experimentos solo se validan en un único tipo de datos de latencia de red
Despliegue Práctico: Falta validación y despliegue en entornos DTN reales

Direcciones Futuras

La principal dirección de investigación futura propuesta es extender el marco para manejar escenarios fuera de distribución (out-of-distribution), es decir, realizar inferencia en datos con distribuciones diferentes a los datos de entrenamiento.

Evaluación Profunda

Fortalezas

Definición Clara del Problema: Identifica con precisión las limitaciones de métodos existentes, reformulando razonablemente el problema como predicción probabilística
Innovación del Método: Combina ingeniosamente modelos de difusión con modelado de dinámicas temporales, con una ruta técnica novedosa
Experimentos Exhaustivos: Comparación con múltiples líneas de base sólidas, utilizando múltiples métricas de evaluación, con resultados convincentes
Implementación de Ingeniería: Proporciona detalles de implementación detallados, facilitando la reproducibilidad

Deficiencias

Ausencia de Análisis Teórico: Carece de análisis teórico sobre por qué el método es efectivo y pruebas de convergencia
Conjunto de Datos Único: Solo validado en datos de latencia de red, faltando validación en otras métricas de QoS
Eficiencia Computacional: No discute suficientemente la sobrecarga computacional de modelos de difusión y problemas de tiempo real
Experimentos de Ablación Insuficientes: Carece de análisis detallado de la contribución de cada componente

Impacto

Contribución Académica: Proporciona una nueva ruta técnica para predicción de QoS en el campo de DTN
Valor Práctico: La capacidad de predicción probabilística tiene valor importante para operaciones reales de red
Generalidad del Método: El marco propuesto puede generalizarse a otras tareas de predicción de series temporales

Escenarios Aplicables

Optimización de Red DTN: Decisiones de enrutamiento, asignación de recursos, balanceo de carga
Operaciones de Red: Predicción de fallos, monitoreo de rendimiento, planificación de capacidad
Otras Predicciones Temporales: Tareas de predicción de series temporales con requisitos de cuantificación de incertidumbre

Referencias

El artículo cita 51 referencias relacionadas, abarcando múltiples campos como DTN, predicción de series temporales y modelos de difusión, proporcionando una base teórica sólida para la investigación.

Evaluación General: Este artículo aborda la necesidad práctica de predicción de QoS en DTN, proponiendo una solución técnicamente innovadora con verificación experimental exhaustiva. Aunque presenta ciertas deficiencias en análisis teórico y amplitud experimental, en general es un trabajo de investigación de alta calidad con valor de referencia importante para campos relacionados.