2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.
Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.
academic

Predicción Probabilística de Métricas de QoS en Redes Tolerantes a Retardos Utilizando Modelos de Difusión Condicional en Dinámicas Latentes

Información Básica

  • ID del Artículo: 2504.08821
  • Título: Predicción Probabilística de Métricas de QoS en Redes Tolerantes a Retardos Utilizando Modelos de Difusión Condicional en Dinámicas Latentes
  • Autores: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
  • Clasificación: cs.LG (Aprendizaje Automático), stat.ML (Estadística - Aprendizaje Automático)
  • Fecha de Publicación: 15 de octubre de 2025 (arXiv v3)
  • Enlace del Artículo: https://arxiv.org/abs/2504.08821v3

Resumen

Este artículo aborda el problema de predicción de métricas de QoS en redes tolerantes a retardos (DTN) mediante un método de predicción probabilística basado en modelos de difusión condicional. Los métodos tradicionales de regresión de media tienen dificultades para capturar adecuadamente la complejidad de los datos, lo que resulta en un rendimiento deficiente en tareas operacionales como el enrutamiento en DTN. El artículo formaliza el problema de predicción de métricas de QoS en DTN como un problema de predicción probabilística de series temporales multivariadas, utilizando modelos de difusión combinados con dinámicas temporales latentes para cuantificar la incertidumbre en las predicciones. Los resultados experimentales demuestran que este método logra el mejor rendimiento entre los métodos populares de predicción probabilística de series temporales.

Antecedentes de Investigación y Motivación

Definición del Problema

Las redes tolerantes a retardos (DTN) desempeñan un papel importante en comunicaciones a distancias extremadamente largas o en entornos adversos, con aplicaciones generalizadas en comunicaciones vehiculares, redes de monitoreo de vida silvestre y comunicaciones en zonas rurales. Las DTN frecuentemente enfrentan desafíos como interrupciones frecuentes, altas tasas de error y retardos que pueden persistir durante horas o incluso días.

Importancia del Problema

  1. Optimización del Rendimiento de Red: La predicción de métricas de QoS puede mejorar el rendimiento de la red en términos de latencia, rendimiento, consumo de energía y confiabilidad
  2. Programación de Recursos: Los protocolos de enrutamiento pueden distribuir información de manera más eficiente según el estado de la red, reduciendo el consumo de energía
  3. Gestión de Prioridades de Tráfico: Diferentes tipos de tráfico de red tienen diferentes requisitos de QoS, y la predicción ayuda en la asignación de prioridades

Limitaciones de Métodos Existentes

  1. Métodos Tradicionales de Regresión de Media: Basados en modelos autorregresivos, enfocados en proporcionar predicciones puntuales precisas minimizando métricas como MSE
  2. Procesamiento Insuficiente de Datos Multimodales: Cuando los datos contienen múltiples modas, la regresión de media no puede capturar la complejidad completa de los datos
  3. Ausencia de Cuantificación de Incertidumbre: Los métodos de regresión determinista no pueden cuantificar la incertidumbre en las predicciones, lo cual es necesario en tareas operacionales como el enrutamiento en DTN

Motivación de la Investigación

Las series temporales de QoS en DTN presentan características no estacionarias y multimodales, requiriendo un método que pueda:

  • Capturar la dinámica compleja de datos temporales
  • Proporcionar un marco de predicción probabilística que cuantifique la incertidumbre
  • Procesar datos no estacionarios y multimodales de manera robusta

Contribuciones Principales

  1. Redefinición del Problema: Reformula el problema de predicción de métricas de QoS en DTN como un problema de predicción probabilística de series temporales, permitiendo cuantificar la incertidumbre en las predicciones
  2. Extensión del Modelo de Difusión: Extiende modelos de difusión populares para inferir muestras de la distribución predictiva, combinando dinámicas de contexto temporal latente para mejorar la adaptabilidad del modelo a series temporales no estacionarias y multimodales
  3. Marco DiffTCN: Propone un marco de modelo de difusión condicional que combina redes convolucionales temporales (TCN) y Transformer, capturando efectivamente dependencias a largo plazo
  4. Verificación Experimental: Mediante experimentos extensos demuestra las ventajas del método propuesto sobre técnicas existentes, logrando el mejor rendimiento en múltiples métricas de evaluación

Explicación Detallada del Método

Definición de la Tarea

Dada una serie temporal multivariada X=(x1,x2,...,xt)Rm×tX = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}, donde mm es el número de variables y tt es la longitud de la serie temporal. El objetivo es predecir la distribución de los próximos pp pasos temporales Y=(yt+1,yt+2,...,yt+p)Rn×pY = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}, donde nmn \leq m.

Arquitectura del Modelo

1. Fundamentos del Modelo de Difusión

El modelo de difusión contiene dos procesos:

  • Proceso de Difusión Hacia Adelante: Añade progresivamente ruido gaussiano a los datos q(xsxs1)=N(xs;1βsxs1,βsI)q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)
  • Proceso de Desruido Inverso: Recupera los datos a partir del ruido pθ(xs1xs)=N(xs1;μθ(xs,s),σθ(xs,s)I)p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)

La función de pérdida se simplifica a: Lsimple=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s)2]L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]

2. Modelo de Difusión Condicional

Para mejorar la precisión y confiabilidad de las predicciones, se introduce información condicional: pθ(xs1xs,ej)=N(xs1;μθ(xs,s,ej),σθ(xs,s,ej)I)p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)

donde eje^j representa la dinámica temporal en el tiempo jj. La función de pérdida condicional es: Lsimples=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s),ej2]L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]

3. Captura de Dinámicas Temporales Latentes

Se utiliza una red convolucional temporal (TCN) para capturar dinámicas de contexto, cuyos componentes principales incluyen:

  • Convolución Causal: Previene fugas de información
  • Red Completamente Convolucional 1D: Mapeo de entrada a salida
  • Convolución Dilatada: Expande el campo receptivo
  • Bloques Temporales Residuales: Profundiza la red

4. Integración de Transformer

Se utiliza Transformer para reemplazar capas de convolución dilatada como módulo computacional principal:

  • Captura relaciones de dependencia a largo plazo en series temporales
  • Pondera dinámicamente los valores de características en diferentes pasos temporales
  • Captura interdependencias entre diferentes variables mediante mecanismos de atención

Puntos de Innovación Técnica

  1. Paradigma de Predicción Probabilística: Transición de predicción determinista a predicción probabilística, permitiendo cuantificar la incertidumbre
  2. Diseño de Difusión Condicional: Integra dinámicas temporales de contexto como información condicional en el proceso de difusión
  3. Fusión TCN-Transformer: Combina el paralelismo de TCN con la capacidad de capturar dependencias a largo plazo de Transformer
  4. Estrategia de Predicción Iterativa: Adopta un método de predicción paso a paso, aplicable a rangos de predicción arbitrarios

Configuración Experimental

Conjuntos de Datos

Se utilizan conjuntos de datos de sensores públicos que contienen métricas de QoS como latencia de Internet:

  • Escala de Datos: Más de 100 días de datos, muestreados una vez por minuto
  • División de Datos:
    • D1: Aproximadamente 80,000 marcas de tiempo
    • D2: Aproximadamente 40,000 marcas de tiempo, con diferentes rangos numéricos y distribuciones
  • Configuración de Predicción: Utiliza las últimas 120 marcas de tiempo para predecir valores de latencia en los próximos 10 pasos temporales

Métricas de Evaluación

  1. MAE (Error Absoluto Medio): Error absoluto promedio
  2. MSE (Error Cuadrático Medio): Error cuadrático promedio
  3. CRPS (Puntuación de Probabilidad Clasificada Continua): Puntuación de probabilidad clasificada continua CRPS(F,x)=(F(y)1(xy))2dyCRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy

Métodos de Comparación

  • DeepAR: Método autorregresivo profundo basado en redes recurrentes
  • DeepFactor: Modelo híbrido que combina modelos clásicos de series temporales con redes neuronales profundas
  • TimeGrad: Método de desruido autorregresivo basado en modelos de difusión
  • Diffusion: Modelo de difusión vanilla original

Detalles de Implementación

  • Optimizador: Adam, tasa de aprendizaje 0.001
  • Pasos de Difusión: 50 pasos
  • Nivel de Ruido: β₁ = 0.0001, βₜ = 0.5
  • Tamaño de Lote: 64
  • Número de Muestras de Inferencia: 100 muestras para aproximar la distribución
  • Hardware: GPU Nvidia 3090 individual (24GB)

Resultados Experimentales

Resultados Principales

Resultados de MAE y MSE

Conjunto de DatosRango TemporalMSEMAE
DiffusionTimeGradDiffTCNDiffusionTimeGradDiffTCN
D112.750±0.3122.372±0.0841.959±0.0331.150±0.0211.020±0.0110.749±0.014
D1102.594±0.1162.203±0.0871.924±0.0151.060±0.0130.915±0.0360.761±0.011
D216.042±0.5823.905±0.1633.371±0.0722.424±0.2301.926±0.1141.634±0.029
D2106.572±0.2194.455±0.3192.508±0.0962.324±0.1511.808±0.0131.707±0.010

Resultados de CRPS

MétodoD1D2
DeepAR0.065±0.0070.096±0.008
DeepFactor0.064±0.0010.095±0.001
Diffusion0.082±0.0090.127±0.010
TimeGrad0.067±0.0030.091±0.004
DiffTCN0.052±0.0010.081±0.002

Hallazgos Experimentales

  1. Ventaja Consistente: DiffTCN logra el mejor rendimiento en todos los rangos de predicción y conjuntos de datos
  2. Cuantificación de Incertidumbre: Los resultados de CRPS demuestran que DiffTCN supera significativamente a los métodos de referencia en calidad de predicción probabilística
  3. Estabilidad: DiffTCN exhibe la menor variabilidad de rendimiento, indicando la robustez del método
  4. Ventaja de TCN: En comparación con TimeGrad que utiliza codificadores RNN, el paralelismo de TCN proporciona mejoras de precisión evidentes

Trabajo Relacionado

Predicción de QoS en DTN

  • Métodos de Redes Neuronales: Abdellah et al. utilizan NARX-RNN para predecir latencia de red
  • Aplicación de LSTM: Nagai et al. construyen una plataforma de prueba de red de sensores inalámbricos, utilizando LSTM para predecir latencia
  • Factorización de Matrices: Ghandi et al. formalizan el problema de predicción de latencia de red como un problema de factorización de matrices no negativas

Predicción de Series Temporales

  • Métodos Tradicionales: Métodos de predicción basados en modelos estadísticos como ARMA
  • Aprendizaje Profundo: Métodos de redes neuronales recurrentes como RNN, LSTM, GRU
  • Predicción Probabilística: Marcos de predicción probabilística como DeepAR y DeepFactor

Aplicaciones de Modelos de Difusión

  • Generación de Imágenes: Aplicaciones exitosas de modelos de difusión en tareas de generación de imágenes
  • Series Temporales: Aplicación de modelos de difusión a predicción de series temporales como TimeGrad

Conclusiones y Discusión

Conclusiones Principales

  1. Ventaja de Predicción Probabilística: Reformular el problema de predicción de QoS como predicción probabilística puede cuantificar efectivamente la incertidumbre
  2. Efectividad del Modelo de Difusión: El modelo de difusión condicional puede procesar efectivamente datos de series temporales no estacionarias y multimodales
  3. Diseño de Arquitectura Razonable: La combinación de TCN y Transformer aprovecha efectivamente las ventajas de ambos

Limitaciones

  1. Complejidad Computacional: Los modelos de difusión requieren muestreo multietapa, con sobrecarga computacional considerable
  2. Escala de Conjunto de Datos: Los experimentos solo se validan en un único tipo de datos de latencia de red
  3. Despliegue Práctico: Falta validación y despliegue en entornos DTN reales

Direcciones Futuras

La principal dirección de investigación futura propuesta es extender el marco para manejar escenarios fuera de distribución (out-of-distribution), es decir, realizar inferencia en datos con distribuciones diferentes a los datos de entrenamiento.

Evaluación Profunda

Fortalezas

  1. Definición Clara del Problema: Identifica con precisión las limitaciones de métodos existentes, reformulando razonablemente el problema como predicción probabilística
  2. Innovación del Método: Combina ingeniosamente modelos de difusión con modelado de dinámicas temporales, con una ruta técnica novedosa
  3. Experimentos Exhaustivos: Comparación con múltiples líneas de base sólidas, utilizando múltiples métricas de evaluación, con resultados convincentes
  4. Implementación de Ingeniería: Proporciona detalles de implementación detallados, facilitando la reproducibilidad

Deficiencias

  1. Ausencia de Análisis Teórico: Carece de análisis teórico sobre por qué el método es efectivo y pruebas de convergencia
  2. Conjunto de Datos Único: Solo validado en datos de latencia de red, faltando validación en otras métricas de QoS
  3. Eficiencia Computacional: No discute suficientemente la sobrecarga computacional de modelos de difusión y problemas de tiempo real
  4. Experimentos de Ablación Insuficientes: Carece de análisis detallado de la contribución de cada componente

Impacto

  1. Contribución Académica: Proporciona una nueva ruta técnica para predicción de QoS en el campo de DTN
  2. Valor Práctico: La capacidad de predicción probabilística tiene valor importante para operaciones reales de red
  3. Generalidad del Método: El marco propuesto puede generalizarse a otras tareas de predicción de series temporales

Escenarios Aplicables

  1. Optimización de Red DTN: Decisiones de enrutamiento, asignación de recursos, balanceo de carga
  2. Operaciones de Red: Predicción de fallos, monitoreo de rendimiento, planificación de capacidad
  3. Otras Predicciones Temporales: Tareas de predicción de series temporales con requisitos de cuantificación de incertidumbre

Referencias

El artículo cita 51 referencias relacionadas, abarcando múltiples campos como DTN, predicción de series temporales y modelos de difusión, proporcionando una base teórica sólida para la investigación.


Evaluación General: Este artículo aborda la necesidad práctica de predicción de QoS en DTN, proponiendo una solución técnicamente innovadora con verificación experimental exhaustiva. Aunque presenta ciertas deficiencias en análisis teórico y amplitud experimental, en general es un trabajo de investigación de alta calidad con valor de referencia importante para campos relacionados.