2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.
Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.
academic

Prévision Probabiliste des Métriques QoS dans les Réseaux Tolérants aux Délais Utilisant des Modèles de Diffusion Conditionnelle sur la Dynamique Latente

Informations Fondamentales

  • ID de l'article: 2504.08821
  • Titre: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
  • Auteurs: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
  • Classification: cs.LG (Apprentissage Automatique), stat.ML (Statistiques - Apprentissage Automatique)
  • Date de publication: 15 octobre 2025 (arXiv v3)
  • Lien de l'article: https://arxiv.org/abs/2504.08821v3

Résumé

Cet article propose une méthode de prévision probabiliste basée sur des modèles de diffusion conditionnelle pour aborder le problème de la prévision des métriques QoS dans les réseaux tolérants aux délais (DTN). Les méthodes traditionnelles de régression sur la moyenne ont du mal à capturer adéquatement la complexité des données, ce qui entraîne une dégradation des performances dans les tâches opérationnelles telles que le routage dans les DTN. Cet article formalise le problème de la prévision des métriques QoS dans les DTN comme un problème de prévision probabiliste de séries temporelles multivariées, quantifiant l'incertitude de la prévision par le biais de modèles de diffusion combinés à la dynamique temporelle latente. Les résultats expérimentaux démontrent que cette approche surpasse les méthodes populaires de prévision probabiliste de séries temporelles.

Contexte de Recherche et Motivation

Définition du Problème

Les réseaux tolérants aux délais (DTN) jouent un rôle crucial dans les communications sur de très longues distances ou dans des environnements difficiles, avec des applications étendues dans les communications véhiculaires, les réseaux de surveillance de la faune sauvage et les communications en zones rurales. Les DTN font face à des défis tels que les interruptions fréquentes, les taux d'erreur élevés et les délais potentiellement prolongés pouvant durer des heures voire des jours.

Importance du Problème

  1. Optimisation des performances réseau: La prévision des métriques QoS peut améliorer les performances du réseau en termes de latence, débit, consommation d'énergie et fiabilité
  2. Planification des ressources: Les protocoles de routage peuvent distribuer les informations plus efficacement en fonction de l'état du réseau, réduisant ainsi la consommation d'énergie
  3. Gestion des priorités de trafic: Différents types de trafic réseau ont des exigences QoS différentes, et la prévision facilite l'attribution des priorités

Limitations des Méthodes Existantes

  1. Méthodes traditionnelles de régression sur la moyenne: Basées sur des modèles autorégressifs, elles se concentrent sur la fourniture de prévisions ponctuelles précises en minimisant des métriques telles que l'EQM
  2. Traitement insuffisant des données multimodales: Lorsque les données contiennent plusieurs modes, la régression sur la moyenne ne peut pas capturer la complexité complète des données
  3. Absence de quantification de l'incertitude: Les méthodes de régression déterministe ne peuvent pas quantifier l'incertitude des prévisions, ce qui est nécessaire pour les tâches opérationnelles telles que le routage dans les DTN

Motivation de la Recherche

Les séries temporelles QoS dans les DTN présentent des caractéristiques non-stationnaires et multimodales, nécessitant une approche capable de:

  • Capturer la dynamique complexe des données temporelles
  • Fournir un cadre de prévision probabiliste quantifiant l'incertitude
  • Traiter les données non-stationnaires et multimodales de manière robuste

Contributions Principales

  1. Redéfinition du problème: Reformulation du problème de prévision des métriques QoS dans les DTN comme un problème de prévision probabiliste de séries temporelles, capable de quantifier l'incertitude des prévisions
  2. Extension du modèle de diffusion: Extension des modèles de diffusion populaires pour déduire des échantillons de la distribution de prévision, combinant la dynamique contextuelle temporelle latente pour améliorer l'adaptabilité du modèle aux séries temporelles non-stationnaires et multimodales
  3. Cadre DiffTCN: Proposition d'un cadre de modèle de diffusion conditionnelle combinant les réseaux de convolution temporelle (TCN) et Transformer, capturant efficacement les dépendances à long terme
  4. Validation expérimentale: Démonstration par des expériences approfondies des avantages de la méthode proposée par rapport aux techniques existantes, atteignant les meilleures performances sur plusieurs métriques d'évaluation

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné une série temporelle multivariée X=(x1,x2,...,xt)Rm×tX = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}, où mm est le nombre de variables et tt est la longueur de la série temporelle. L'objectif est de prévoir la distribution des pp prochains pas de temps Y=(yt+1,yt+2,...,yt+p)Rn×pY = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}, où nmn \leq m.

Architecture du Modèle

1. Fondamentaux du Modèle de Diffusion

Le modèle de diffusion comprend deux processus:

  • Processus de diffusion avant: Ajout progressif de bruit gaussien aux données q(xsxs1)=N(xs;1βsxs1,βsI)q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)
  • Processus de débruitage inverse: Récupération des données à partir du bruit pθ(xs1xs)=N(xs1;μθ(xs,s),σθ(xs,s)I)p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)

La fonction de perte simplifiée est: Lsimple=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s)2]L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]

2. Modèle de Diffusion Conditionnelle

Pour améliorer la précision et la fiabilité des prévisions, des informations conditionnelles sont introduites: pθ(xs1xs,ej)=N(xs1;μθ(xs,s,ej),σθ(xs,s,ej)I)p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)

eje^j représente la dynamique temporelle au temps jj. La fonction de perte conditionnelle est: Lsimples=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s),ej2]L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]

3. Capture de la Dynamique Temporelle Latente

Un réseau de convolution temporelle (TCN) est utilisé pour capturer la dynamique contextuelle, dont les composants principaux incluent:

  • Convolution causale: Prévention de la fuite d'informations
  • Réseau entièrement convolutif 1D: Mappage de l'entrée à la sortie
  • Convolution dilatée: Extension du champ réceptif
  • Blocs temporels résiduels: Approfondissement du réseau

4. Intégration de Transformer

Utilisation de Transformer en remplacement des couches de convolution dilatée comme module de calcul principal:

  • Capture des relations de dépendance à long terme dans les séries temporelles
  • Pondération dynamique des valeurs de caractéristiques à différents pas de temps
  • Capture des interdépendances entre différentes variables par le biais du mécanisme d'attention

Points d'Innovation Technique

  1. Paradigme de prévision probabiliste: Transition de la prévision déterministe à la prévision probabiliste, capable de quantifier l'incertitude
  2. Conception de diffusion conditionnelle: Intégration de la dynamique temporelle contextuelle comme information conditionnelle dans le processus de diffusion
  3. Fusion TCN-Transformer: Combinaison du parallélisme du TCN et de la capacité de capture des dépendances à long terme du Transformer
  4. Stratégie de prévision itérative: Adoption d'une approche de prévision progressive, applicable à des horizons de prévision arbitraires

Configuration Expérimentale

Ensembles de Données

Utilisation d'ensembles de données de capteurs publics contenant des métriques QoS telles que la latence Internet:

  • Échelle des données: Données sur plus de 100 jours, échantillonnées une fois par minute
  • Division des données:
    • D1: Environ 80 000 horodatages
    • D2: Environ 40 000 horodatages, avec des plages de valeurs et des distributions différentes
  • Configuration de prévision: Utilisation des 120 horodatages les plus récents pour prévoir les valeurs de latence des 10 prochains horodatages

Métriques d'Évaluation

  1. MAE (Erreur Absolue Moyenne): Erreur absolue moyenne
  2. MSE (Erreur Quadratique Moyenne): Erreur quadratique moyenne
  3. CRPS (Score de Probabilité Classée Continue): Score de probabilité classée continue CRPS(F,x)=(F(y)1(xy))2dyCRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy

Méthodes de Comparaison

  • DeepAR: Méthode autorégressionelle profonde basée sur des réseaux récurrents
  • DeepFactor: Modèle hybride combinant les modèles classiques de séries temporelles et les réseaux de neurones profonds
  • TimeGrad: Méthode de débruitage autorégressif basée sur les modèles de diffusion
  • Diffusion: Modèle de diffusion vanilla original

Détails d'Implémentation

  • Optimiseur: Adam, taux d'apprentissage 0,001
  • Nombre d'étapes de diffusion: 50 étapes
  • Niveaux de bruit: β₁ = 0,0001, βₜ = 0,5
  • Taille de lot: 64
  • Nombre d'échantillons d'inférence: 100 échantillons pour approximer la distribution
  • Matériel: GPU Nvidia 3090 unique (24 Go)

Résultats Expérimentaux

Résultats Principaux

Résultats MAE et MSE

Ensemble de DonnéesPlage TemporelleMSEMAE
DiffusionTimeGradDiffTCNDiffusionTimeGradDiffTCN
D112,750±0,3122,372±0,0841,959±0,0331,150±0,0211,020±0,0110,749±0,014
D1102,594±0,1162,203±0,0871,924±0,0151,060±0,0130,915±0,0360,761±0,011
D216,042±0,5823,905±0,1633,371±0,0722,424±0,2301,926±0,1141,634±0,029
D2106,572±0,2194,455±0,3192,508±0,0962,324±0,1511,808±0,0131,707±0,010

Résultats CRPS

MéthodeD1D2
DeepAR0,065±0,0070,096±0,008
DeepFactor0,064±0,0010,095±0,001
Diffusion0,082±0,0090,127±0,010
TimeGrad0,067±0,0030,091±0,004
DiffTCN0,052±0,0010,081±0,002

Découvertes Expérimentales

  1. Avantage de cohérence: DiffTCN atteint les meilleures performances sur tous les horizons de prévision et tous les ensembles de données
  2. Quantification de l'incertitude: Les résultats CRPS démontrent que DiffTCN surpasse significativement les méthodes de base en termes de qualité de prévision probabiliste
  3. Stabilité: DiffTCN présente la variabilité de performance minimale, démontrant la robustesse de la méthode
  4. Avantage du TCN: Comparé à TimeGrad utilisant un encodeur RNN, le parallélisme du TCN apporte une amélioration de précision notable

Travaux Connexes

Prévision QoS dans les DTN

  • Approches par réseaux de neurones: Abdellah et al. utilisent NARX-RNN pour prévoir la latence réseau
  • Application LSTM: Nagai et al. construisent une plateforme de test de réseau de capteurs sans fil, utilisant LSTM pour prévoir la latence
  • Factorisation matricielle: Ghandi et al. formalisent le problème de prévision de latence réseau comme un problème de factorisation matricielle non-négative

Prévision de Séries Temporelles

  • Méthodes traditionnelles: Méthodes de prévision basées sur des modèles statistiques tels que ARMA
  • Apprentissage profond: Méthodes de réseaux de neurones récurrents tels que RNN, LSTM, GRU
  • Prévision probabiliste: Cadres de prévision probabiliste tels que DeepAR, DeepFactor

Applications des Modèles de Diffusion

  • Génération d'images: Applications réussies des modèles de diffusion dans les tâches de génération d'images
  • Séries temporelles: Application des modèles de diffusion à la prévision de séries temporelles, comme TimeGrad

Conclusion et Discussion

Conclusions Principales

  1. Avantages de la prévision probabiliste: La reformulation du problème de prévision QoS comme prévision probabiliste peut quantifier efficacement l'incertitude
  2. Efficacité du modèle de diffusion conditionnelle: Le modèle de diffusion conditionnelle peut traiter efficacement les données de séries temporelles non-stationnaires et multimodales
  3. Conception architecturale rationnelle: La combinaison du TCN et du Transformer exploite pleinement les avantages des deux approches

Limitations

  1. Complexité computationnelle: Les modèles de diffusion nécessitent un échantillonnage multi-étapes, entraînant des frais de calcul importants
  2. Échelle des ensembles de données: Les expériences ne sont validées que sur un seul type de données de latence réseau
  3. Déploiement pratique: Absence de déploiement et de validation dans des environnements DTN réels

Directions Futures

Les principales directions de recherche future proposées par l'article consistent à étendre le cadre pour traiter les scénarios hors-distribution (out-of-distribution), c'est-à-dire l'inférence sur des données suivant une distribution différente des données d'entraînement.

Évaluation Approfondie

Points Forts

  1. Définition claire du problème: Identification précise des limitations des méthodes existantes, reformulation raisonnable du problème comme prévision probabiliste
  2. Innovation méthodologique: Combinaison ingénieuse des modèles de diffusion avec la modélisation de la dynamique temporelle, approche technique novatrice
  3. Expériences approfondies: Comparaison avec plusieurs bases de référence fortes, utilisation de multiples métriques d'évaluation, résultats convaincants
  4. Implémentation technique: Fourniture de détails d'implémentation détaillés, facilitant la reproduction

Insuffisances

  1. Absence d'analyse théorique: Manque d'analyse théorique expliquant pourquoi la méthode est efficace et de preuves de convergence
  2. Ensemble de données unique: Validation uniquement sur des données de latence réseau, absence de validation sur d'autres types de métriques QoS
  3. Efficacité computationnelle: Discussion insuffisante des frais de calcul des modèles de diffusion et des problèmes de temps réel
  4. Expériences d'ablation insuffisantes: Manque d'analyse détaillée de la contribution de chaque composant

Impact

  1. Contribution académique: Fourniture d'une nouvelle voie technique pour la prévision QoS dans le domaine des DTN
  2. Valeur pratique: La capacité de prévision probabiliste a une valeur importante pour l'exploitation réelle des réseaux
  3. Généralité de la méthode: Le cadre proposé peut être généralisé à d'autres tâches de prévision de séries temporelles

Scénarios d'Application

  1. Optimisation des réseaux DTN: Décisions de routage, allocation des ressources, équilibrage de charge
  2. Exploitation des réseaux: Prévision des défaillances, surveillance des performances, planification de la capacité
  3. Autres prévisions de séries temporelles: Tâches de prévision de séries temporelles nécessitant la quantification de l'incertitude

Références

L'article cite 51 références connexes, couvrant plusieurs domaines tels que les DTN, la prévision de séries temporelles et les modèles de diffusion, fournissant une base théorique solide pour la recherche.


Évaluation Globale: Cet article propose une solution techniquement innovante et expérimentalement bien validée pour répondre aux besoins pratiques de la prévision QoS dans les DTN. Bien qu'il présente certaines insuffisances en matière d'analyse théorique et de largeur expérimentale, il s'agit globalement d'un travail de recherche de haute qualité ayant une valeur de référence importante pour les domaines connexes.