2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.

Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.

academic

Probabilistische QoS-Metrik-Vorhersage in verzögerungstoleranten Netzwerken unter Verwendung von bedingten Diffusionsmodellen auf latenten Dynamiken

Grundinformationen

Papier-ID: 2504.08821
Titel: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
Autoren: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
Klassifizierung: cs.LG (Maschinelles Lernen), stat.ML (Statistik - Maschinelles Lernen)
Veröffentlichungsdatum: 15. Oktober 2025 (arXiv v3)
Papierlink: https://arxiv.org/abs/2504.08821v3

Zusammenfassung

Dieses Papier schlägt eine probabilistische Vorhersagemethode basierend auf bedingten Diffusionsmodellen für das QoS-Metrik-Vorhersageproblem in verzögerungstoleranten Netzwerken (DTN) vor. Traditionelle Mittelwert-Regressionsmethoden können die Komplexität der Daten nicht vollständig erfassen, was zu schlechterer Leistung bei operativen Aufgaben wie DTN-Routing führt. Das Papier formalisiert das QoS-Metrik-Vorhersageproblem in DTN als probabilistische Vorhersage multivariater Zeitreihen und quantifiziert die Vorhersageunsicherheit durch Diffusionsmodelle in Kombination mit latenten Zeitreihendynamiken. Experimentelle Ergebnisse zeigen, dass die Methode unter populären probabilistischen Zeitreihen-Vorhersagemethoden die beste Leistung erbringt.

Forschungshintergrund und Motivation

Problemdefinition

Verzögerungstolerante Netzwerke (DTN) spielen eine wichtige Rolle in der Kommunikation über extrem große Entfernungen oder in rauen Umgebungen und werden häufig in Fahrzeugkommunikation, Wildtier-Tracking-Überwachungsnetzwerken und ländlicher Kommunikation eingesetzt. DTN stehen häufig vor Herausforderungen wie häufigen Unterbrechungen, hohen Fehlerraten und Verzögerungen, die Stunden oder sogar Tage andauern können.

Bedeutung des Problems

Netzwerkleistungsoptimierung: QoS-Metrik-Vorhersage kann die Netzwerkleistung in Bezug auf Latenz, Durchsatz, Energieverbrauch und Zuverlässigkeit verbessern
Ressourcenplanung: Routing-Protokolle können Informationen effizienter basierend auf Netzwerkzustand verteilen und Energieverbrauch senken
Verkehrspriorisierungsverwaltung: Verschiedene Arten von Netzwerkverkehr haben unterschiedliche QoS-Anforderungen; Vorhersage hilft bei der Prioritätszuweisung

Einschränkungen bestehender Methoden

Traditionelle Mittelwert-Regressionsmethoden: Basieren auf autoregressiven Modellen und konzentrieren sich auf genaue Punktvorhersagen durch Minimierung von Metriken wie MSE
Unzureichende multimodale Datenverarbeitung: Wenn Daten mehrere Modi enthalten, kann Mittelwert-Regression die vollständige Komplexität der Daten nicht erfassen
Fehlende Unsicherheitsquantifizierung: Deterministische Regressionsmethoden können die Vorhersageunsicherheit nicht quantifizieren, was für operative Aufgaben wie DTN-Routing erforderlich ist

Forschungsmotivation

QoS-Zeitreihen in DTN weisen nicht-stationäre und multimodale Merkmale auf und erfordern eine Methode, die:

Komplexe Dynamiken von Zeitreihendaten erfasst
Ein probabilistisches Vorhersage-Framework zur Quantifizierung der Vorhersageunsicherheit bietet
Ein robustes Modell zur Verarbeitung nicht-stationärer und multimolarer Daten darstellt

Kernbeiträge

Neudefinition des Problems: Formalisiert das QoS-Metrik-Vorhersageproblem in DTN neu als probabilistische Zeitreihen-Vorhersage, die die Vorhersageunsicherheit quantifizieren kann
Erweiterung des Diffusionsmodells: Erweitert populäre Diffusionsmodelle zur Inferenz von Stichproben der Vorhersageverteilung und kombiniert diese mit latenten Kontextdynamiken, um die Modellierungsfähigkeit für nicht-stationäre und multimodale Zeitreihen zu verbessern
DiffTCN-Framework: Schlägt ein bedingtes Diffusionsmodell-Framework vor, das Temporal Convolutional Networks (TCN) und Transformer kombiniert, um langfristige Abhängigkeiten effektiv zu erfassen
Experimentelle Validierung: Demonstriert durch umfangreiche Experimente die Überlegenheit der vorgeschlagenen Methode gegenüber bestehenden Techniken und erreicht beste Leistung bei mehreren Bewertungsmetriken

Methodische Details

Aufgabendefinition

Gegeben sei eine multivariate Zeitreihe $X = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}$ , wobei $m$ die Anzahl der Variablen und $t$ die Zeitreihenlänge ist. Das Ziel ist die Vorhersage der Verteilung der nächsten $p$ Zeitschritte $Y = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}$ , wobei $n \leq m$ .

Modellarchitektur

1. Grundlagen des Diffusionsmodells

Das Diffusionsmodell besteht aus zwei Prozessen:

Vorwärts-Diffusionsprozess: Fügt schrittweise Gaußsches Rauschen zu den Daten hinzu $q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)$
Rückwärts-Denoisierungsprozess: Stellt Daten aus Rauschen wieder her $p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)$

Die Verlustfunktion wird vereinfacht zu: $L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]$

2. Bedingtes Diffusionsmodell

Um die Genauigkeit und Zuverlässigkeit der Vorhersage zu verbessern, werden Bedingungsinformationen eingeführt: $p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)$

wobei $e^j$ die Zeitreihendynamik zum Zeitpunkt $j$ darstellt. Die bedingte Verlustfunktion lautet: $L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]$

3. Erfassung latenter Zeitreihendynamiken

Verwendet Temporal Convolutional Networks (TCN) zur Erfassung von Kontextdynamiken. Die Hauptkomponenten von TCN sind:

Kausale Faltung: Verhindert Informationslecks
1D vollständig konvolutionales Netzwerk: Abbildung von Eingabe zu Ausgabe
Dilatierte Faltung: Erweitert das Empfangsfeld
Residuale Zeitblöcke: Vertieft das Netzwerk

4. Transformer-Integration

Verwendet Transformer anstelle von dilatierten Faltungsschichten als Hauptrechenmodul:

Erfasst langfristige Abhängigkeiten in Zeitreihen
Gewichtet Merkmalswerte verschiedener Zeitschritte dynamisch
Erfasst gegenseitige Abhängigkeiten zwischen verschiedenen Variablen durch Aufmerksamkeitsmechanismen

Technische Innovationen

Probabilistisches Vorhersage-Paradigma: Übergang von deterministischer zu probabilistischer Vorhersage ermöglicht Unsicherheitsquantifizierung
Bedingte Diffusionsgestaltung: Integriert Kontextzeitreihendynamiken als Bedingungsinformationen in den Diffusionsprozess
TCN-Transformer-Fusion: Kombiniert die Parallelität von TCN mit der Fähigkeit von Transformer, langfristige Abhängigkeiten zu erfassen
Iterative Vorhersagestrategie: Verwendet schrittweise Vorhersagemethode, anwendbar auf beliebige Vorhersagezeiträume

Experimentelle Einrichtung

Datensätze

Verwendet öffentliche Sensordatensätze mit QoS-Metriken wie Internetlatenz:

Datengröße: Über 100 Tage Daten, einmal pro Minute abgetastet
Datenteilung:
- D1: Etwa 80.000 Zeitstempel
- D2: Etwa 40.000 Zeitstempel mit unterschiedlichen Wertebereichen und Verteilungen
Vorhersageeinstellung: Verwendet die letzten 120 Zeitstempel zur Vorhersage von Verzögerungswerten für die nächsten 10 Zeitstempel

Bewertungsmetriken

MAE (Mean Absolute Error): Mittlerer absoluter Fehler
MSE (Mean Squared Error): Mittlerer quadratischer Fehler
CRPS (Continuous Ranked Probability Score): Kontinuierliche Rangwahrscheinlichkeitsbewertung $CRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy$

Vergleichsmethoden

DeepAR: Tiefe autoregressive Methode basierend auf rekurrenten Netzwerken
DeepFactor: Hybridmodell, das klassische Zeitreihenmodelle und tiefe neuronale Netzwerke kombiniert
TimeGrad: Autoregressive Denoisierungsmethode basierend auf Diffusionsmodellen
Diffusion: Ursprüngliches Vanilla-Diffusionsmodell

Implementierungsdetails

Optimierer: Adam, Lernrate 0,001
Diffusionsschritte: 50 Schritte
Rauschpegel: β₁ = 0,0001, βₜ = 0,5
Batch-Größe: 64
Inferenzstichproben: 100 Stichproben zur Approximation der Verteilung
Hardware: Einzelne Nvidia 3090 GPU (24 GB)

Experimentelle Ergebnisse

Hauptergebnisse

MAE- und MSE-Ergebnisse

Datensatz	Zeitbereich	MSE			MAE
		Diffusion	TimeGrad	DiffTCN	Diffusion	TimeGrad	DiffTCN
D1	1	2,750±0,312	2,372±0,084	1,959±0,033	1,150±0,021	1,020±0,011	0,749±0,014
D1	10	2,594±0,116	2,203±0,087	1,924±0,015	1,060±0,013	0,915±0,036	0,761±0,011
D2	1	6,042±0,582	3,905±0,163	3,371±0,072	2,424±0,230	1,926±0,114	1,634±0,029
D2	10	6,572±0,219	4,455±0,319	2,508±0,096	2,324±0,151	1,808±0,013	1,707±0,010

CRPS-Ergebnisse

Methode	D1	D2
DeepAR	0,065±0,007	0,096±0,008
DeepFactor	0,064±0,001	0,095±0,001
Diffusion	0,082±0,009	0,127±0,010
TimeGrad	0,067±0,003	0,091±0,004
DiffTCN	0,052±0,001	0,081±0,002

Experimentelle Erkenntnisse

Konsistente Überlegenheit: DiffTCN erreicht beste Leistung über alle Vorhersagezeiträume und Datensätze hinweg
Unsicherheitsquantifizierung: CRPS-Ergebnisse zeigen, dass DiffTCN in der probabilistischen Vorhersagequalität signifikant besser als Baseline-Methoden ist
Stabilität: DiffTCN zeigt minimale Leistungsvariabilität und demonstriert Robustheit der Methode
TCN-Vorteile: Im Vergleich zu TimeGrad mit RNN-Encoder bringt die Parallelität von TCN deutliche Genauigkeitsverbesserungen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Vorteile der probabilistischen Vorhersage: Die Umformulierung des QoS-Vorhersageproblems als probabilistische Vorhersage kann Unsicherheit effektiv quantifizieren
Effektivität des Diffusionsmodells: Bedingte Diffusionsmodelle können nicht-stationäre und multimodale Zeitreihendaten effektiv verarbeiten
Angemessene Architekturgestaltung: Die Kombination von TCN und Transformer nutzt die Vorteile beider Ansätze effektiv

Einschränkungen

Rechenkomplexität: Diffusionsmodelle erfordern mehrstufiges Sampling mit großem Rechenaufwand
Datensatzgröße: Experimente werden nur auf einem einzelnen Typ von Netzwerkverzögerungsdaten validiert
Praktische Bereitstellung: Mangel an Bereitstellung und Validierung in echten DTN-Umgebungen

Zukünftige Richtungen

Die Hauptzukunftsforschungsrichtung des Papiers ist die Erweiterung des Frameworks zur Verarbeitung von Out-of-Distribution-Szenarien, d.h. Inferenz auf Daten mit anderer Verteilung als Trainingsdaten.

Tiefgreifende Bewertung

Stärken

Klare Problemdefinition: Identifiziert genau die Einschränkungen bestehender Methoden und formuliert das Problem angemessen als probabilistische Vorhersage neu
Methodische Innovation: Kombiniert geschickt Diffusionsmodelle mit Zeitreihendynamik-Modellierung; technische Route ist neuartig
Umfangreiche Experimente: Vergleich mit mehreren starken Baselines, Verwendung mehrerer Bewertungsmetriken mit überzeugenden Ergebnissen
Technische Implementierung: Bietet detaillierte Implementierungsdetails, die Reproduzierbarkeit fördern

Mängel

Fehlende theoretische Analyse: Mangel an theoretischer Analyse, warum die Methode effektiv ist, und Konvergenzbeweis
Einzelne Datensätze: Validierung nur auf Netzwerkverzögerungsdaten; mangelnde Validierung anderer QoS-Metriken
Rechnerische Effizienz: Unzureichende Diskussion des Rechenaufwands und der Echtzeitfähigkeit von Diffusionsmodellen
Unzureichende Ablationsstudien: Mangel an detaillierter Analyse des Beitrags einzelner Komponenten

Auswirkungen

Akademischer Beitrag: Bietet neue technische Wege für QoS-Vorhersage im DTN-Bereich
Praktischer Wert: Probabilistische Vorhersagefähigkeit hat wichtigen Wert für praktische Netzwerkwartung
Methodische Allgemeingültigkeit: Das vorgeschlagene Framework kann auf andere Zeitreihen-Vorhersageaufgaben verallgemeinert werden

Anwendungsszenarien

DTN-Netzwerkoptimierung: Routing-Entscheidungen, Ressourcenallokation, Lastverteilung
Netzwerkwartung: Fehlervorhersage, Leistungsüberwachung, Kapazitätsplanung
Andere Zeitreihen-Vorhersage: Zeitreihen-Vorhersageaufgaben mit Anforderungen zur Unsicherheitsquantifizierung

Literaturverzeichnis

Das Papier zitiert 51 verwandte Arbeiten, die wichtige Arbeiten in mehreren Bereichen wie DTN, Zeitreihen-Vorhersage und Diffusionsmodelle abdecken und eine solide theoretische Grundlage für die Forschung bieten.

Gesamtbewertung: Dieses Papier schlägt eine technisch innovative und experimentell gut validierte Lösung für die praktischen Anforderungen der QoS-Vorhersage in DTN vor. Obwohl es gewisse Mängel in theoretischer Analyse und experimenteller Breite gibt, ist es insgesamt eine hochwertige Forschungsarbeit mit wichtigem Referenzwert für verwandte Bereiche.