2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.
Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.
academic

Previsione Probabilistica delle Metriche QoS nelle Reti Tolleranti ai Ritardi Utilizzando Modelli di Diffusione Condizionata sulla Dinamica Latente

Informazioni Fondamentali

  • ID Articolo: 2504.08821
  • Titolo: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
  • Autori: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
  • Classificazione: cs.LG (Machine Learning), stat.ML (Statistics - Machine Learning)
  • Data di Pubblicazione: 15 ottobre 2025 (arXiv v3)
  • Link Articolo: https://arxiv.org/abs/2504.08821v3

Riassunto

Questo articolo affronta il problema della previsione delle metriche QoS (Quality of Service) nelle reti tolleranti ai ritardi (DTN) proponendo un metodo di previsione probabilistica basato su modelli di diffusione condizionata. I metodi tradizionali di regressione sulla media faticano a catturare adeguatamente la complessità dei dati, causando degradazione delle prestazioni in compiti operativi come il routing nelle DTN. L'articolo formalizza il problema della previsione delle metriche QoS nelle DTN come un problema di previsione probabilistica di serie temporali multivariate, quantificando l'incertezza della previsione attraverso modelli di diffusione combinati con dinamica temporale latente. I risultati sperimentali dimostrano che il metodo proposto raggiunge le prestazioni migliori tra i metodi popolari di previsione probabilistica di serie temporali.

Contesto di Ricerca e Motivazione

Definizione del Problema

Le reti tolleranti ai ritardi (DTN) svolgono un ruolo cruciale nelle comunicazioni su distanze estremamente lunghe o in ambienti ostili, con applicazioni diffuse nella comunicazione veicolare, nelle reti di monitoraggio della fauna selvatica e nella comunicazione nelle aree rurali. Le DTN affrontano frequentemente sfide come interruzioni frequenti, elevati tassi di errore e ritardi che possono durare ore o addirittura giorni.

Importanza del Problema

  1. Ottimizzazione delle Prestazioni di Rete: La previsione delle metriche QoS può migliorare le prestazioni della rete in termini di latenza, throughput, consumo energetico e affidabilità
  2. Pianificazione delle Risorse: I protocolli di routing possono distribuire le informazioni in modo più efficiente in base allo stato della rete, riducendo il consumo energetico
  3. Gestione della Priorità del Traffico: Diversi tipi di traffico di rete hanno diversi requisiti QoS, e la previsione aiuta nell'assegnazione delle priorità

Limitazioni dei Metodi Esistenti

  1. Metodi Tradizionali di Regressione sulla Media: Basati su modelli autoregressivi, si concentrano sulla fornitura di previsioni puntuali accurate minimizzando metriche come MSE
  2. Insufficiente Gestione dei Dati Multimodali: Quando i dati contengono più modalità, la regressione sulla media non riesce a catturare la complessità completa dei dati
  3. Mancanza di Quantificazione dell'Incertezza: I metodi di regressione deterministica non possono quantificare l'incertezza della previsione, il che è necessario per compiti operativi come il routing nelle DTN

Motivazione della Ricerca

Le serie temporali QoS nelle DTN presentano caratteristiche non stazionarie e multimodali, richiedendo un metodo che possa:

  • Catturare la dinamica complessa dei dati temporali
  • Fornire un framework di previsione probabilistica che quantifichi l'incertezza
  • Gestire robustamente dati non stazionari e multimodali

Contributi Principali

  1. Ridefinizione del Problema: Riformulazione del problema di previsione delle metriche QoS nelle DTN come problema di previsione probabilistica di serie temporali, in grado di quantificare l'incertezza della previsione
  2. Estensione del Modello di Diffusione: Estensione dei modelli di diffusione popolari per inferire campioni della distribuzione di previsione, combinando dinamica contestuale latente per migliorare l'adattabilità del modello a serie temporali non stazionarie e multimodali
  3. Framework DiffTCN: Proposta di un framework di modello di diffusione condizionata che combina reti convoluzionali temporali (TCN) e Transformer, catturando efficacemente le dipendenze a lungo termine
  4. Validazione Sperimentale: Dimostrazione attraverso esperimenti estesi dei vantaggi del metodo proposto rispetto alle tecniche esistenti, raggiungendo le migliori prestazioni su molteplici metriche di valutazione

Spiegazione Dettagliata del Metodo

Definizione del Compito

Data una serie temporale multivariata X=(x1,x2,...,xt)Rm×tX = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}, dove mm è il numero di variabili e tt è la lunghezza della serie temporale. L'obiettivo è prevedere la distribuzione dei prossimi pp passi temporali Y=(yt+1,yt+2,...,yt+p)Rn×pY = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}, dove nmn \leq m.

Architettura del Modello

1. Fondamenti del Modello di Diffusione

Il modello di diffusione comprende due processi:

  • Processo di Diffusione in Avanti: Aggiunta graduale di rumore gaussiano ai dati q(xsxs1)=N(xs;1βsxs1,βsI)q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)
  • Processo di Denoising Inverso: Recupero dei dati dal rumore pθ(xs1xs)=N(xs1;μθ(xs,s),σθ(xs,s)I)p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)

La funzione di perdita è semplificata a: Lsimple=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s)2]L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]

2. Modello di Diffusione Condizionata

Per migliorare l'accuratezza e l'affidabilità della previsione, vengono introdotte informazioni condizionali: pθ(xs1xs,ej)=N(xs1;μθ(xs,s,ej),σθ(xs,s,ej)I)p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)

dove eje^j rappresenta la dinamica temporale al tempo jj. La funzione di perdita condizionata è: Lsimples=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s),ej2]L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]

3. Cattura della Dinamica Temporale Latente

Viene adottata una rete convoluzionale temporale (TCN) per catturare la dinamica contestuale, i cui componenti principali includono:

  • Convoluzione Causale: Previene la perdita di informazioni
  • Rete Completamente Convoluzionale 1D: Mappatura da input a output
  • Convoluzione Dilatata: Estende il campo ricettivo
  • Blocchi Temporali Residui: Approfondisce la rete

4. Integrazione di Transformer

Viene utilizzato Transformer per sostituire i livelli di convoluzione dilatata come modulo di calcolo principale:

  • Cattura le relazioni di dipendenza a lungo termine nelle serie temporali
  • Pesa dinamicamente i valori delle caratteristiche di diversi passi temporali
  • Cattura le interdipendenze tra diverse variabili attraverso meccanismi di attenzione

Punti di Innovazione Tecnica

  1. Paradigma di Previsione Probabilistica: Transizione dalla previsione deterministica alla previsione probabilistica, in grado di quantificare l'incertezza
  2. Progettazione di Diffusione Condizionata: Integrazione della dinamica temporale contestuale come informazione condizionata nel processo di diffusione
  3. Fusione TCN-Transformer: Combinazione della parallelizzabilità del TCN con la capacità di Transformer di catturare dipendenze a lungo termine
  4. Strategia di Previsione Iterativa: Adozione di un approccio di previsione graduale, applicabile a qualsiasi intervallo di previsione

Configurazione Sperimentale

Dataset

Utilizzo di dataset di sensori pubblici contenenti metriche QoS come latenza Internet:

  • Scala dei Dati: Dati di oltre 100 giorni, campionati una volta al minuto
  • Divisione dei Dati:
    • D1: circa 80.000 timestamp
    • D2: circa 40.000 timestamp, con diversi intervalli di valori e distribuzioni
  • Impostazione della Previsione: Utilizzo degli ultimi 120 timestamp per prevedere i valori di latenza dei prossimi 10 timestamp

Metriche di Valutazione

  1. MAE (Mean Absolute Error): Errore Assoluto Medio
  2. MSE (Mean Squared Error): Errore Quadratico Medio
  3. CRPS (Continuous Ranked Probability Score): Punteggio di Probabilità Classificata Continua CRPS(F,x)=(F(y)1(xy))2dyCRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy

Metodi di Confronto

  • DeepAR: Metodo autoregressivo profondo basato su reti ricorrenti
  • DeepFactor: Modello ibrido che combina modelli classici di serie temporali e reti neurali profonde
  • TimeGrad: Metodo di denoising autoregressivo basato su modelli di diffusione
  • Diffusion: Modello di diffusione vanilla originale

Dettagli di Implementazione

  • Ottimizzatore: Adam, tasso di apprendimento 0.001
  • Passi di Diffusione: 50 passi
  • Livelli di Rumore: β₁ = 0.0001, βₜ = 0.5
  • Dimensione del Batch: 64
  • Numero di Campioni di Inferenza: 100 campioni per approssimare la distribuzione
  • Hardware: Una singola GPU Nvidia 3090 (24GB)

Risultati Sperimentali

Risultati Principali

Risultati MAE e MSE

DatasetIntervallo TemporaleMSEMAE
DiffusionTimeGradDiffTCNDiffusionTimeGradDiffTCN
D112.750±0.3122.372±0.0841.959±0.0331.150±0.0211.020±0.0110.749±0.014
D1102.594±0.1162.203±0.0871.924±0.0151.060±0.0130.915±0.0360.761±0.011
D216.042±0.5823.905±0.1633.371±0.0722.424±0.2301.926±0.1141.634±0.029
D2106.572±0.2194.455±0.3192.508±0.0962.324±0.1511.808±0.0131.707±0.010

Risultati CRPS

MetodoD1D2
DeepAR0.065±0.0070.096±0.008
DeepFactor0.064±0.0010.095±0.001
Diffusion0.082±0.0090.127±0.010
TimeGrad0.067±0.0030.091±0.004
DiffTCN0.052±0.0010.081±0.002

Scoperte Sperimentali

  1. Vantaggio Coerente: DiffTCN raggiunge le migliori prestazioni su tutti gli intervalli di previsione e i dataset
  2. Quantificazione dell'Incertezza: I risultati CRPS dimostrano che DiffTCN supera significativamente i metodi di base nella qualità della previsione probabilistica
  3. Stabilità: DiffTCN mostra la minima variabilità di prestazioni, indicando la robustezza del metodo
  4. Vantaggi del TCN: Rispetto a TimeGrad che utilizza un encoder RNN, la parallelizzabilità del TCN porta a un miglioramento evidente dell'accuratezza

Lavori Correlati

Previsione QoS nelle DTN

  • Metodi Basati su Reti Neurali: Abdellah et al. utilizzano NARX-RNN per prevedere la latenza di rete
  • Applicazioni LSTM: Nagai et al. costruiscono una piattaforma di test per reti di sensori wireless, utilizzando LSTM per prevedere la latenza
  • Fattorizzazione Matriciale: Ghandi et al. formalizzano il problema di previsione della latenza di rete come problema di fattorizzazione matriciale non negativa

Previsione di Serie Temporali

  • Metodi Tradizionali: Metodi di previsione basati su modelli statistici come ARMA
  • Deep Learning: Metodi di reti neurali ricorrenti come RNN, LSTM, GRU
  • Previsione Probabilistica: Framework di previsione probabilistica come DeepAR, DeepFactor

Applicazioni di Modelli di Diffusione

  • Generazione di Immagini: Applicazioni di successo dei modelli di diffusione nei compiti di generazione di immagini
  • Serie Temporali: Applicazione di modelli di diffusione alla previsione di serie temporali come TimeGrad

Conclusioni e Discussione

Conclusioni Principali

  1. Vantaggi della Previsione Probabilistica: La riformulazione del problema di previsione QoS come previsione probabilistica può quantificare efficacemente l'incertezza
  2. Efficacia del Modello di Diffusione: Il modello di diffusione condizionata può gestire efficacemente dati di serie temporali non stazionari e multimodali
  3. Ragionevolezza della Progettazione Architetturale: La combinazione di TCN e Transformer sfrutta pienamente i vantaggi di entrambi

Limitazioni

  1. Complessità Computazionale: I modelli di diffusione richiedono campionamento multi-passo, con elevato carico computazionale
  2. Scala del Dataset: Gli esperimenti sono stati convalidati solo su un singolo tipo di dati di latenza di rete
  3. Distribuzione Pratica: Mancanza di distribuzione e validazione in ambienti DTN reali

Direzioni Future

La principale direzione di ricerca futura proposta dall'articolo è l'estensione del framework per gestire scenari fuori distribuzione (out-of-distribution), ovvero l'inferenza su dati con distribuzione diversa dai dati di addestramento.

Valutazione Approfondita

Punti di Forza

  1. Definizione Chiara del Problema: Identificazione accurata delle limitazioni dei metodi esistenti, riformulazione ragionevole del problema come previsione probabilistica
  2. Innovazione del Metodo: Combinazione ingegnosa del modello di diffusione con la modellazione della dinamica temporale, percorso tecnico innovativo
  3. Esperimenti Completi: Confronto con molteplici baseline forti, utilizzo di molteplici metriche di valutazione, risultati convincenti
  4. Implementazione Ingegneristica: Fornitura di dettagli di implementazione dettagliati, favorisce la riproducibilità

Insufficienze

  1. Mancanza di Analisi Teorica: Assenza di analisi teorica sul perché il metodo sia efficace e prove di convergenza
  2. Dataset Singolo: Validazione solo su dati di latenza di rete, mancanza di validazione su altri tipi di metriche QoS
  3. Efficienza Computazionale: Discussione insufficiente del carico computazionale dei modelli di diffusione e dei problemi di tempo reale
  4. Esperimenti di Ablazione Insufficienti: Mancanza di analisi dettagliata del contributo di ciascun componente

Impatto

  1. Contributo Accademico: Fornisce un nuovo percorso tecnico per la previsione QoS nel campo delle DTN
  2. Valore Pratico: La capacità di previsione probabilistica ha importanza significativa per la gestione pratica della rete
  3. Generalità del Metodo: Il framework proposto può essere esteso ad altri compiti di previsione di serie temporali

Scenari Applicabili

  1. Ottimizzazione della Rete DTN: Decisioni di routing, allocazione delle risorse, bilanciamento del carico
  2. Gestione della Rete: Previsione dei guasti, monitoraggio delle prestazioni, pianificazione della capacità
  3. Altre Previsioni di Serie Temporali: Compiti di previsione di serie temporali con esigenze di quantificazione dell'incertezza

Bibliografia

L'articolo cita 51 articoli correlati, coprendo importanti lavori in molteplici campi come DTN, previsione di serie temporali e modelli di diffusione, fornendo una base teorica solida per la ricerca.


Valutazione Complessiva: Questo articolo affronta le esigenze pratiche della previsione QoS nelle DTN, proponendo una soluzione tecnicamente innovativa e con validazione sperimentale completa. Sebbene presenti alcune insufficienze nell'analisi teorica e nell'ampiezza sperimentale, nel complesso rappresenta un lavoro di ricerca di alta qualità con importante valore di riferimento per i campi correlati.