2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.
Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.
academic

Probabilistische QoS-Metrik-Vorhersage in verzögerungstoleranten Netzwerken unter Verwendung von bedingten Diffusionsmodellen auf latenten Dynamiken

Grundinformationen

  • Papier-ID: 2504.08821
  • Titel: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
  • Autoren: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
  • Klassifizierung: cs.LG (Maschinelles Lernen), stat.ML (Statistik - Maschinelles Lernen)
  • Veröffentlichungsdatum: 15. Oktober 2025 (arXiv v3)
  • Papierlink: https://arxiv.org/abs/2504.08821v3

Zusammenfassung

Dieses Papier schlägt eine probabilistische Vorhersagemethode basierend auf bedingten Diffusionsmodellen für das QoS-Metrik-Vorhersageproblem in verzögerungstoleranten Netzwerken (DTN) vor. Traditionelle Mittelwert-Regressionsmethoden können die Komplexität der Daten nicht vollständig erfassen, was zu schlechterer Leistung bei operativen Aufgaben wie DTN-Routing führt. Das Papier formalisiert das QoS-Metrik-Vorhersageproblem in DTN als probabilistische Vorhersage multivariater Zeitreihen und quantifiziert die Vorhersageunsicherheit durch Diffusionsmodelle in Kombination mit latenten Zeitreihendynamiken. Experimentelle Ergebnisse zeigen, dass die Methode unter populären probabilistischen Zeitreihen-Vorhersagemethoden die beste Leistung erbringt.

Forschungshintergrund und Motivation

Problemdefinition

Verzögerungstolerante Netzwerke (DTN) spielen eine wichtige Rolle in der Kommunikation über extrem große Entfernungen oder in rauen Umgebungen und werden häufig in Fahrzeugkommunikation, Wildtier-Tracking-Überwachungsnetzwerken und ländlicher Kommunikation eingesetzt. DTN stehen häufig vor Herausforderungen wie häufigen Unterbrechungen, hohen Fehlerraten und Verzögerungen, die Stunden oder sogar Tage andauern können.

Bedeutung des Problems

  1. Netzwerkleistungsoptimierung: QoS-Metrik-Vorhersage kann die Netzwerkleistung in Bezug auf Latenz, Durchsatz, Energieverbrauch und Zuverlässigkeit verbessern
  2. Ressourcenplanung: Routing-Protokolle können Informationen effizienter basierend auf Netzwerkzustand verteilen und Energieverbrauch senken
  3. Verkehrspriorisierungsverwaltung: Verschiedene Arten von Netzwerkverkehr haben unterschiedliche QoS-Anforderungen; Vorhersage hilft bei der Prioritätszuweisung

Einschränkungen bestehender Methoden

  1. Traditionelle Mittelwert-Regressionsmethoden: Basieren auf autoregressiven Modellen und konzentrieren sich auf genaue Punktvorhersagen durch Minimierung von Metriken wie MSE
  2. Unzureichende multimodale Datenverarbeitung: Wenn Daten mehrere Modi enthalten, kann Mittelwert-Regression die vollständige Komplexität der Daten nicht erfassen
  3. Fehlende Unsicherheitsquantifizierung: Deterministische Regressionsmethoden können die Vorhersageunsicherheit nicht quantifizieren, was für operative Aufgaben wie DTN-Routing erforderlich ist

Forschungsmotivation

QoS-Zeitreihen in DTN weisen nicht-stationäre und multimodale Merkmale auf und erfordern eine Methode, die:

  • Komplexe Dynamiken von Zeitreihendaten erfasst
  • Ein probabilistisches Vorhersage-Framework zur Quantifizierung der Vorhersageunsicherheit bietet
  • Ein robustes Modell zur Verarbeitung nicht-stationärer und multimolarer Daten darstellt

Kernbeiträge

  1. Neudefinition des Problems: Formalisiert das QoS-Metrik-Vorhersageproblem in DTN neu als probabilistische Zeitreihen-Vorhersage, die die Vorhersageunsicherheit quantifizieren kann
  2. Erweiterung des Diffusionsmodells: Erweitert populäre Diffusionsmodelle zur Inferenz von Stichproben der Vorhersageverteilung und kombiniert diese mit latenten Kontextdynamiken, um die Modellierungsfähigkeit für nicht-stationäre und multimodale Zeitreihen zu verbessern
  3. DiffTCN-Framework: Schlägt ein bedingtes Diffusionsmodell-Framework vor, das Temporal Convolutional Networks (TCN) und Transformer kombiniert, um langfristige Abhängigkeiten effektiv zu erfassen
  4. Experimentelle Validierung: Demonstriert durch umfangreiche Experimente die Überlegenheit der vorgeschlagenen Methode gegenüber bestehenden Techniken und erreicht beste Leistung bei mehreren Bewertungsmetriken

Methodische Details

Aufgabendefinition

Gegeben sei eine multivariate Zeitreihe X=(x1,x2,...,xt)Rm×tX = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}, wobei mm die Anzahl der Variablen und tt die Zeitreihenlänge ist. Das Ziel ist die Vorhersage der Verteilung der nächsten pp Zeitschritte Y=(yt+1,yt+2,...,yt+p)Rn×pY = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}, wobei nmn \leq m.

Modellarchitektur

1. Grundlagen des Diffusionsmodells

Das Diffusionsmodell besteht aus zwei Prozessen:

  • Vorwärts-Diffusionsprozess: Fügt schrittweise Gaußsches Rauschen zu den Daten hinzu q(xsxs1)=N(xs;1βsxs1,βsI)q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)
  • Rückwärts-Denoisierungsprozess: Stellt Daten aus Rauschen wieder her pθ(xs1xs)=N(xs1;μθ(xs,s),σθ(xs,s)I)p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)

Die Verlustfunktion wird vereinfacht zu: Lsimple=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s)2]L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]

2. Bedingtes Diffusionsmodell

Um die Genauigkeit und Zuverlässigkeit der Vorhersage zu verbessern, werden Bedingungsinformationen eingeführt: pθ(xs1xs,ej)=N(xs1;μθ(xs,s,ej),σθ(xs,s,ej)I)p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)

wobei eje^j die Zeitreihendynamik zum Zeitpunkt jj darstellt. Die bedingte Verlustfunktion lautet: Lsimples=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s),ej2]L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]

3. Erfassung latenter Zeitreihendynamiken

Verwendet Temporal Convolutional Networks (TCN) zur Erfassung von Kontextdynamiken. Die Hauptkomponenten von TCN sind:

  • Kausale Faltung: Verhindert Informationslecks
  • 1D vollständig konvolutionales Netzwerk: Abbildung von Eingabe zu Ausgabe
  • Dilatierte Faltung: Erweitert das Empfangsfeld
  • Residuale Zeitblöcke: Vertieft das Netzwerk

4. Transformer-Integration

Verwendet Transformer anstelle von dilatierten Faltungsschichten als Hauptrechenmodul:

  • Erfasst langfristige Abhängigkeiten in Zeitreihen
  • Gewichtet Merkmalswerte verschiedener Zeitschritte dynamisch
  • Erfasst gegenseitige Abhängigkeiten zwischen verschiedenen Variablen durch Aufmerksamkeitsmechanismen

Technische Innovationen

  1. Probabilistisches Vorhersage-Paradigma: Übergang von deterministischer zu probabilistischer Vorhersage ermöglicht Unsicherheitsquantifizierung
  2. Bedingte Diffusionsgestaltung: Integriert Kontextzeitreihendynamiken als Bedingungsinformationen in den Diffusionsprozess
  3. TCN-Transformer-Fusion: Kombiniert die Parallelität von TCN mit der Fähigkeit von Transformer, langfristige Abhängigkeiten zu erfassen
  4. Iterative Vorhersagestrategie: Verwendet schrittweise Vorhersagemethode, anwendbar auf beliebige Vorhersagezeiträume

Experimentelle Einrichtung

Datensätze

Verwendet öffentliche Sensordatensätze mit QoS-Metriken wie Internetlatenz:

  • Datengröße: Über 100 Tage Daten, einmal pro Minute abgetastet
  • Datenteilung:
    • D1: Etwa 80.000 Zeitstempel
    • D2: Etwa 40.000 Zeitstempel mit unterschiedlichen Wertebereichen und Verteilungen
  • Vorhersageeinstellung: Verwendet die letzten 120 Zeitstempel zur Vorhersage von Verzögerungswerten für die nächsten 10 Zeitstempel

Bewertungsmetriken

  1. MAE (Mean Absolute Error): Mittlerer absoluter Fehler
  2. MSE (Mean Squared Error): Mittlerer quadratischer Fehler
  3. CRPS (Continuous Ranked Probability Score): Kontinuierliche Rangwahrscheinlichkeitsbewertung CRPS(F,x)=(F(y)1(xy))2dyCRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy

Vergleichsmethoden

  • DeepAR: Tiefe autoregressive Methode basierend auf rekurrenten Netzwerken
  • DeepFactor: Hybridmodell, das klassische Zeitreihenmodelle und tiefe neuronale Netzwerke kombiniert
  • TimeGrad: Autoregressive Denoisierungsmethode basierend auf Diffusionsmodellen
  • Diffusion: Ursprüngliches Vanilla-Diffusionsmodell

Implementierungsdetails

  • Optimierer: Adam, Lernrate 0,001
  • Diffusionsschritte: 50 Schritte
  • Rauschpegel: β₁ = 0,0001, βₜ = 0,5
  • Batch-Größe: 64
  • Inferenzstichproben: 100 Stichproben zur Approximation der Verteilung
  • Hardware: Einzelne Nvidia 3090 GPU (24 GB)

Experimentelle Ergebnisse

Hauptergebnisse

MAE- und MSE-Ergebnisse

DatensatzZeitbereichMSEMAE
DiffusionTimeGradDiffTCNDiffusionTimeGradDiffTCN
D112,750±0,3122,372±0,0841,959±0,0331,150±0,0211,020±0,0110,749±0,014
D1102,594±0,1162,203±0,0871,924±0,0151,060±0,0130,915±0,0360,761±0,011
D216,042±0,5823,905±0,1633,371±0,0722,424±0,2301,926±0,1141,634±0,029
D2106,572±0,2194,455±0,3192,508±0,0962,324±0,1511,808±0,0131,707±0,010

CRPS-Ergebnisse

MethodeD1D2
DeepAR0,065±0,0070,096±0,008
DeepFactor0,064±0,0010,095±0,001
Diffusion0,082±0,0090,127±0,010
TimeGrad0,067±0,0030,091±0,004
DiffTCN0,052±0,0010,081±0,002

Experimentelle Erkenntnisse

  1. Konsistente Überlegenheit: DiffTCN erreicht beste Leistung über alle Vorhersagezeiträume und Datensätze hinweg
  2. Unsicherheitsquantifizierung: CRPS-Ergebnisse zeigen, dass DiffTCN in der probabilistischen Vorhersagequalität signifikant besser als Baseline-Methoden ist
  3. Stabilität: DiffTCN zeigt minimale Leistungsvariabilität und demonstriert Robustheit der Methode
  4. TCN-Vorteile: Im Vergleich zu TimeGrad mit RNN-Encoder bringt die Parallelität von TCN deutliche Genauigkeitsverbesserungen

Verwandte Arbeiten

QoS-Vorhersage in DTN

  • Neuronale Netzwerk-Methoden: Abdellah et al. verwenden NARX-RNN zur Vorhersage von Netzwerkverzögerungen
  • LSTM-Anwendungen: Nagai et al. konstruieren Testplattform für drahtlose Sensornetzwerke und verwenden LSTM zur Verzögerungsvorhersage
  • Matrixfaktorisierung: Ghandi et al. formalisieren Netzwerkverzögerungsvorhersage als nicht-negatives Matrixfaktorisierungsproblem

Zeitreihen-Vorhersage

  • Traditionelle Methoden: Vorhersagemethoden basierend auf statistischen Modellen wie ARMA
  • Tiefes Lernen: Rekurrente neuronale Netzwerke wie RNN, LSTM, GRU
  • Probabilistische Vorhersage: Probabilistische Vorhersage-Frameworks wie DeepAR, DeepFactor

Diffusionsmodell-Anwendungen

  • Bildgenerierung: Erfolgreiche Anwendung von Diffusionsmodellen bei Bildgenerierungsaufgaben
  • Zeitreihen: Anwendung von Diffusionsmodellen auf Zeitreihen-Vorhersage wie TimeGrad

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Vorteile der probabilistischen Vorhersage: Die Umformulierung des QoS-Vorhersageproblems als probabilistische Vorhersage kann Unsicherheit effektiv quantifizieren
  2. Effektivität des Diffusionsmodells: Bedingte Diffusionsmodelle können nicht-stationäre und multimodale Zeitreihendaten effektiv verarbeiten
  3. Angemessene Architekturgestaltung: Die Kombination von TCN und Transformer nutzt die Vorteile beider Ansätze effektiv

Einschränkungen

  1. Rechenkomplexität: Diffusionsmodelle erfordern mehrstufiges Sampling mit großem Rechenaufwand
  2. Datensatzgröße: Experimente werden nur auf einem einzelnen Typ von Netzwerkverzögerungsdaten validiert
  3. Praktische Bereitstellung: Mangel an Bereitstellung und Validierung in echten DTN-Umgebungen

Zukünftige Richtungen

Die Hauptzukunftsforschungsrichtung des Papiers ist die Erweiterung des Frameworks zur Verarbeitung von Out-of-Distribution-Szenarien, d.h. Inferenz auf Daten mit anderer Verteilung als Trainingsdaten.

Tiefgreifende Bewertung

Stärken

  1. Klare Problemdefinition: Identifiziert genau die Einschränkungen bestehender Methoden und formuliert das Problem angemessen als probabilistische Vorhersage neu
  2. Methodische Innovation: Kombiniert geschickt Diffusionsmodelle mit Zeitreihendynamik-Modellierung; technische Route ist neuartig
  3. Umfangreiche Experimente: Vergleich mit mehreren starken Baselines, Verwendung mehrerer Bewertungsmetriken mit überzeugenden Ergebnissen
  4. Technische Implementierung: Bietet detaillierte Implementierungsdetails, die Reproduzierbarkeit fördern

Mängel

  1. Fehlende theoretische Analyse: Mangel an theoretischer Analyse, warum die Methode effektiv ist, und Konvergenzbeweis
  2. Einzelne Datensätze: Validierung nur auf Netzwerkverzögerungsdaten; mangelnde Validierung anderer QoS-Metriken
  3. Rechnerische Effizienz: Unzureichende Diskussion des Rechenaufwands und der Echtzeitfähigkeit von Diffusionsmodellen
  4. Unzureichende Ablationsstudien: Mangel an detaillierter Analyse des Beitrags einzelner Komponenten

Auswirkungen

  1. Akademischer Beitrag: Bietet neue technische Wege für QoS-Vorhersage im DTN-Bereich
  2. Praktischer Wert: Probabilistische Vorhersagefähigkeit hat wichtigen Wert für praktische Netzwerkwartung
  3. Methodische Allgemeingültigkeit: Das vorgeschlagene Framework kann auf andere Zeitreihen-Vorhersageaufgaben verallgemeinert werden

Anwendungsszenarien

  1. DTN-Netzwerkoptimierung: Routing-Entscheidungen, Ressourcenallokation, Lastverteilung
  2. Netzwerkwartung: Fehlervorhersage, Leistungsüberwachung, Kapazitätsplanung
  3. Andere Zeitreihen-Vorhersage: Zeitreihen-Vorhersageaufgaben mit Anforderungen zur Unsicherheitsquantifizierung

Literaturverzeichnis

Das Papier zitiert 51 verwandte Arbeiten, die wichtige Arbeiten in mehreren Bereichen wie DTN, Zeitreihen-Vorhersage und Diffusionsmodelle abdecken und eine solide theoretische Grundlage für die Forschung bieten.


Gesamtbewertung: Dieses Papier schlägt eine technisch innovative und experimentell gut validierte Lösung für die praktischen Anforderungen der QoS-Vorhersage in DTN vor. Obwohl es gewisse Mängel in theoretischer Analyse und experimenteller Breite gibt, ist es insgesamt eine hochwertige Forschungsarbeit mit wichtigem Referenzwert für verwandte Bereiche.