2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.

Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.

academic

Previsione Probabilistica delle Metriche QoS nelle Reti Tolleranti ai Ritardi Utilizzando Modelli di Diffusione Condizionata sulla Dinamica Latente

Informazioni Fondamentali

ID Articolo: 2504.08821
Titolo: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
Autori: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
Classificazione: cs.LG (Machine Learning), stat.ML (Statistics - Machine Learning)
Data di Pubblicazione: 15 ottobre 2025 (arXiv v3)
Link Articolo: https://arxiv.org/abs/2504.08821v3

Riassunto

Questo articolo affronta il problema della previsione delle metriche QoS (Quality of Service) nelle reti tolleranti ai ritardi (DTN) proponendo un metodo di previsione probabilistica basato su modelli di diffusione condizionata. I metodi tradizionali di regressione sulla media faticano a catturare adeguatamente la complessità dei dati, causando degradazione delle prestazioni in compiti operativi come il routing nelle DTN. L'articolo formalizza il problema della previsione delle metriche QoS nelle DTN come un problema di previsione probabilistica di serie temporali multivariate, quantificando l'incertezza della previsione attraverso modelli di diffusione combinati con dinamica temporale latente. I risultati sperimentali dimostrano che il metodo proposto raggiunge le prestazioni migliori tra i metodi popolari di previsione probabilistica di serie temporali.

Contesto di Ricerca e Motivazione

Definizione del Problema

Le reti tolleranti ai ritardi (DTN) svolgono un ruolo cruciale nelle comunicazioni su distanze estremamente lunghe o in ambienti ostili, con applicazioni diffuse nella comunicazione veicolare, nelle reti di monitoraggio della fauna selvatica e nella comunicazione nelle aree rurali. Le DTN affrontano frequentemente sfide come interruzioni frequenti, elevati tassi di errore e ritardi che possono durare ore o addirittura giorni.

Importanza del Problema

Ottimizzazione delle Prestazioni di Rete: La previsione delle metriche QoS può migliorare le prestazioni della rete in termini di latenza, throughput, consumo energetico e affidabilità
Pianificazione delle Risorse: I protocolli di routing possono distribuire le informazioni in modo più efficiente in base allo stato della rete, riducendo il consumo energetico
Gestione della Priorità del Traffico: Diversi tipi di traffico di rete hanno diversi requisiti QoS, e la previsione aiuta nell'assegnazione delle priorità

Limitazioni dei Metodi Esistenti

Metodi Tradizionali di Regressione sulla Media: Basati su modelli autoregressivi, si concentrano sulla fornitura di previsioni puntuali accurate minimizzando metriche come MSE
Insufficiente Gestione dei Dati Multimodali: Quando i dati contengono più modalità, la regressione sulla media non riesce a catturare la complessità completa dei dati
Mancanza di Quantificazione dell'Incertezza: I metodi di regressione deterministica non possono quantificare l'incertezza della previsione, il che è necessario per compiti operativi come il routing nelle DTN

Motivazione della Ricerca

Le serie temporali QoS nelle DTN presentano caratteristiche non stazionarie e multimodali, richiedendo un metodo che possa:

Catturare la dinamica complessa dei dati temporali
Fornire un framework di previsione probabilistica che quantifichi l'incertezza
Gestire robustamente dati non stazionari e multimodali

Contributi Principali

Ridefinizione del Problema: Riformulazione del problema di previsione delle metriche QoS nelle DTN come problema di previsione probabilistica di serie temporali, in grado di quantificare l'incertezza della previsione
Estensione del Modello di Diffusione: Estensione dei modelli di diffusione popolari per inferire campioni della distribuzione di previsione, combinando dinamica contestuale latente per migliorare l'adattabilità del modello a serie temporali non stazionarie e multimodali
Framework DiffTCN: Proposta di un framework di modello di diffusione condizionata che combina reti convoluzionali temporali (TCN) e Transformer, catturando efficacemente le dipendenze a lungo termine
Validazione Sperimentale: Dimostrazione attraverso esperimenti estesi dei vantaggi del metodo proposto rispetto alle tecniche esistenti, raggiungendo le migliori prestazioni su molteplici metriche di valutazione

Spiegazione Dettagliata del Metodo

Definizione del Compito

Data una serie temporale multivariata $X = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}$ , dove $m$ è il numero di variabili e $t$ è la lunghezza della serie temporale. L'obiettivo è prevedere la distribuzione dei prossimi $p$ passi temporali $Y = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}$ , dove $n \leq m$ .

Architettura del Modello

1. Fondamenti del Modello di Diffusione

Il modello di diffusione comprende due processi:

Processo di Diffusione in Avanti: Aggiunta graduale di rumore gaussiano ai dati $q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)$
Processo di Denoising Inverso: Recupero dei dati dal rumore $p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)$

La funzione di perdita è semplificata a: $L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]$

2. Modello di Diffusione Condizionata

Per migliorare l'accuratezza e l'affidabilità della previsione, vengono introdotte informazioni condizionali: $p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)$

dove $e^j$ rappresenta la dinamica temporale al tempo $j$ . La funzione di perdita condizionata è: $L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]$

3. Cattura della Dinamica Temporale Latente

Viene adottata una rete convoluzionale temporale (TCN) per catturare la dinamica contestuale, i cui componenti principali includono:

Convoluzione Causale: Previene la perdita di informazioni
Rete Completamente Convoluzionale 1D: Mappatura da input a output
Convoluzione Dilatata: Estende il campo ricettivo
Blocchi Temporali Residui: Approfondisce la rete

4. Integrazione di Transformer

Viene utilizzato Transformer per sostituire i livelli di convoluzione dilatata come modulo di calcolo principale:

Cattura le relazioni di dipendenza a lungo termine nelle serie temporali
Pesa dinamicamente i valori delle caratteristiche di diversi passi temporali
Cattura le interdipendenze tra diverse variabili attraverso meccanismi di attenzione

Punti di Innovazione Tecnica

Paradigma di Previsione Probabilistica: Transizione dalla previsione deterministica alla previsione probabilistica, in grado di quantificare l'incertezza
Progettazione di Diffusione Condizionata: Integrazione della dinamica temporale contestuale come informazione condizionata nel processo di diffusione
Fusione TCN-Transformer: Combinazione della parallelizzabilità del TCN con la capacità di Transformer di catturare dipendenze a lungo termine
Strategia di Previsione Iterativa: Adozione di un approccio di previsione graduale, applicabile a qualsiasi intervallo di previsione

Configurazione Sperimentale

Dataset

Utilizzo di dataset di sensori pubblici contenenti metriche QoS come latenza Internet:

Scala dei Dati: Dati di oltre 100 giorni, campionati una volta al minuto
Divisione dei Dati:
- D1: circa 80.000 timestamp
- D2: circa 40.000 timestamp, con diversi intervalli di valori e distribuzioni
Impostazione della Previsione: Utilizzo degli ultimi 120 timestamp per prevedere i valori di latenza dei prossimi 10 timestamp

Metriche di Valutazione

MAE (Mean Absolute Error): Errore Assoluto Medio
MSE (Mean Squared Error): Errore Quadratico Medio
CRPS (Continuous Ranked Probability Score): Punteggio di Probabilità Classificata Continua $CRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy$

Metodi di Confronto

DeepAR: Metodo autoregressivo profondo basato su reti ricorrenti
DeepFactor: Modello ibrido che combina modelli classici di serie temporali e reti neurali profonde
TimeGrad: Metodo di denoising autoregressivo basato su modelli di diffusione
Diffusion: Modello di diffusione vanilla originale

Dettagli di Implementazione

Ottimizzatore: Adam, tasso di apprendimento 0.001
Passi di Diffusione: 50 passi
Livelli di Rumore: β₁ = 0.0001, βₜ = 0.5
Dimensione del Batch: 64
Numero di Campioni di Inferenza: 100 campioni per approssimare la distribuzione
Hardware: Una singola GPU Nvidia 3090 (24GB)

Risultati Sperimentali

Risultati Principali

Risultati MAE e MSE

Dataset	Intervallo Temporale	MSE			MAE
		Diffusion	TimeGrad	DiffTCN	Diffusion	TimeGrad	DiffTCN
D1	1	2.750±0.312	2.372±0.084	1.959±0.033	1.150±0.021	1.020±0.011	0.749±0.014
D1	10	2.594±0.116	2.203±0.087	1.924±0.015	1.060±0.013	0.915±0.036	0.761±0.011
D2	1	6.042±0.582	3.905±0.163	3.371±0.072	2.424±0.230	1.926±0.114	1.634±0.029
D2	10	6.572±0.219	4.455±0.319	2.508±0.096	2.324±0.151	1.808±0.013	1.707±0.010

Risultati CRPS

Metodo	D1	D2
DeepAR	0.065±0.007	0.096±0.008
DeepFactor	0.064±0.001	0.095±0.001
Diffusion	0.082±0.009	0.127±0.010
TimeGrad	0.067±0.003	0.091±0.004
DiffTCN	0.052±0.001	0.081±0.002

Scoperte Sperimentali

Vantaggio Coerente: DiffTCN raggiunge le migliori prestazioni su tutti gli intervalli di previsione e i dataset
Quantificazione dell'Incertezza: I risultati CRPS dimostrano che DiffTCN supera significativamente i metodi di base nella qualità della previsione probabilistica
Stabilità: DiffTCN mostra la minima variabilità di prestazioni, indicando la robustezza del metodo
Vantaggi del TCN: Rispetto a TimeGrad che utilizza un encoder RNN, la parallelizzabilità del TCN porta a un miglioramento evidente dell'accuratezza

Lavori Correlati

Previsione QoS nelle DTN

Metodi Basati su Reti Neurali: Abdellah et al. utilizzano NARX-RNN per prevedere la latenza di rete
Applicazioni LSTM: Nagai et al. costruiscono una piattaforma di test per reti di sensori wireless, utilizzando LSTM per prevedere la latenza
Fattorizzazione Matriciale: Ghandi et al. formalizzano il problema di previsione della latenza di rete come problema di fattorizzazione matriciale non negativa

Previsione di Serie Temporali

Metodi Tradizionali: Metodi di previsione basati su modelli statistici come ARMA
Deep Learning: Metodi di reti neurali ricorrenti come RNN, LSTM, GRU
Previsione Probabilistica: Framework di previsione probabilistica come DeepAR, DeepFactor

Applicazioni di Modelli di Diffusione

Generazione di Immagini: Applicazioni di successo dei modelli di diffusione nei compiti di generazione di immagini
Serie Temporali: Applicazione di modelli di diffusione alla previsione di serie temporali come TimeGrad

Conclusioni e Discussione

Conclusioni Principali

Vantaggi della Previsione Probabilistica: La riformulazione del problema di previsione QoS come previsione probabilistica può quantificare efficacemente l'incertezza
Efficacia del Modello di Diffusione: Il modello di diffusione condizionata può gestire efficacemente dati di serie temporali non stazionari e multimodali
Ragionevolezza della Progettazione Architetturale: La combinazione di TCN e Transformer sfrutta pienamente i vantaggi di entrambi

Limitazioni

Complessità Computazionale: I modelli di diffusione richiedono campionamento multi-passo, con elevato carico computazionale
Scala del Dataset: Gli esperimenti sono stati convalidati solo su un singolo tipo di dati di latenza di rete
Distribuzione Pratica: Mancanza di distribuzione e validazione in ambienti DTN reali

Direzioni Future

La principale direzione di ricerca futura proposta dall'articolo è l'estensione del framework per gestire scenari fuori distribuzione (out-of-distribution), ovvero l'inferenza su dati con distribuzione diversa dai dati di addestramento.

Valutazione Approfondita

Punti di Forza

Definizione Chiara del Problema: Identificazione accurata delle limitazioni dei metodi esistenti, riformulazione ragionevole del problema come previsione probabilistica
Innovazione del Metodo: Combinazione ingegnosa del modello di diffusione con la modellazione della dinamica temporale, percorso tecnico innovativo
Esperimenti Completi: Confronto con molteplici baseline forti, utilizzo di molteplici metriche di valutazione, risultati convincenti
Implementazione Ingegneristica: Fornitura di dettagli di implementazione dettagliati, favorisce la riproducibilità

Insufficienze

Mancanza di Analisi Teorica: Assenza di analisi teorica sul perché il metodo sia efficace e prove di convergenza
Dataset Singolo: Validazione solo su dati di latenza di rete, mancanza di validazione su altri tipi di metriche QoS
Efficienza Computazionale: Discussione insufficiente del carico computazionale dei modelli di diffusione e dei problemi di tempo reale
Esperimenti di Ablazione Insufficienti: Mancanza di analisi dettagliata del contributo di ciascun componente

Impatto

Contributo Accademico: Fornisce un nuovo percorso tecnico per la previsione QoS nel campo delle DTN
Valore Pratico: La capacità di previsione probabilistica ha importanza significativa per la gestione pratica della rete
Generalità del Metodo: Il framework proposto può essere esteso ad altri compiti di previsione di serie temporali

Scenari Applicabili

Ottimizzazione della Rete DTN: Decisioni di routing, allocazione delle risorse, bilanciamento del carico
Gestione della Rete: Previsione dei guasti, monitoraggio delle prestazioni, pianificazione della capacità
Altre Previsioni di Serie Temporali: Compiti di previsione di serie temporali con esigenze di quantificazione dell'incertezza

Bibliografia

L'articolo cita 51 articoli correlati, coprendo importanti lavori in molteplici campi come DTN, previsione di serie temporali e modelli di diffusione, fornendo una base teorica solida per la ricerca.

Valutazione Complessiva: Questo articolo affronta le esigenze pratiche della previsione QoS nelle DTN, proponendo una soluzione tecnicamente innovativa e con validazione sperimentale completa. Sebbene presenti alcune insufficienze nell'analisi teorica e nell'ampiezza sperimentale, nel complesso rappresenta un lavoro di ricerca di alta qualità con importante valore di riferimento per i campi correlati.