2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.

Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.

academic

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

基本信息

论文ID: 2504.08821
标题: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
作者: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
分类: cs.LG (Machine Learning), stat.ML (Statistics - Machine Learning)
发表时间: 2025年10月15日 (arXiv v3)
论文链接: https://arxiv.org/abs/2504.08821v3

摘要

本文针对延迟容忍网络(DTN)中的QoS指标预测问题，提出了一种基于条件扩散模型的概率预测方法。传统的均值回归方法难以充分捕获数据的复杂性，导致在DTN路由等操作任务中性能下降。本文将DTN中的QoS指标预测问题形式化为多变量时间序列的概率预测问题，通过扩散模型结合潜在时序动态来量化预测的不确定性。实验结果表明，该方法在流行的概率时间序列预测方法中表现最优。

研究背景与动机

问题定义

延迟容忍网络(DTN)在极长距离或恶劣环境下的通信中发挥重要作用，广泛应用于车载通信、野生动物追踪监控网络和农村地区通信等领域。DTN经常面临频繁中断、高错误率和可能持续数小时甚至数天的延迟等挑战。

问题重要性

网络性能优化: QoS指标预测能够提升网络在延迟、吞吐量、能耗和可靠性方面的表现
资源调度: 路由协议可以根据网络状态更高效地分发信息，降低能耗
流量优先级管理: 不同类型的网络流量有不同的QoS要求，预测有助于优先级分配

现有方法局限性

传统均值回归方法: 基于自回归模型，专注于通过最小化MSE等指标提供准确的点预测
多模态数据处理不足: 当数据包含多个模态时，均值回归无法捕获数据的完整复杂性
不确定性量化缺失: 确定性回归方法无法量化预测的不确定性，这在DTN的路由等操作任务中是必需的

研究动机

DTN中的QoS时间序列具有非平稳和多模态特征，需要一种能够：

捕获时序数据复杂动态的方法
量化预测不确定性的概率预测框架
处理非平稳和多模态数据的鲁棒模型

核心贡献

问题重新定义: 将DTN中的QoS指标预测问题重新形式化为概率时间序列预测问题，能够量化预测的不确定性
扩散模型扩展: 扩展了流行的扩散模型以推断预测分布的样本，结合潜在上下文动态提高模型对非平稳和多模态时间序列的适应性
DiffTCN框架: 提出了结合时序卷积网络(TCN)和Transformer的条件扩散模型框架，有效捕获长期依赖关系
实验验证: 通过广泛实验证明了所提方法相比现有技术的优势，在多个评价指标上取得最佳性能

方法详解

任务定义

给定多变量时间序列 $X = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}$ ，其中 $m$ 是变量数量， $t$ 是时间序列长度。目标是预测未来 $p$ 个时间步的分布 $Y = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}$ ，其中 $n \leq m$ 。

模型架构

1. 扩散模型基础

扩散模型包含两个过程：

前向扩散过程: 逐步向数据添加高斯噪声 $q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)$
反向去噪过程: 从噪声中恢复数据 $p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)$

损失函数简化为： $L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]$

2. 条件扩散模型

为了提高预测的准确性和可靠性，引入条件信息： $p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)$

其中 $e^j$ 表示时间 $j$ 的时序动态。条件损失函数为： $L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]$

3. 潜在时序动态捕获

采用时序卷积网络(TCN)捕获上下文动态，TCN的主要组件包括：

因果卷积: 防止信息泄露
1D全卷积网络: 输入到输出的映射
扩张卷积: 扩展感受野
残差时序块: 加深网络

4. Transformer集成

使用Transformer替代扩张卷积层作为主要计算模块：

捕获时间序列中的长期依赖关系
动态加权不同时间步的特征值
通过注意力机制捕获不同变量间的相互依赖关系

技术创新点

概率预测范式: 从确定性预测转向概率预测，能够量化不确定性
条件扩散设计: 将上下文时序动态作为条件信息融入扩散过程
TCN-Transformer融合: 结合TCN的并行性和Transformer的长期依赖捕获能力
迭代预测策略: 采用逐步预测方法，适用于任意预测时间范围

实验设置

数据集

使用公开的传感器数据集，包含互联网延迟等QoS指标：

数据规模: 超过100天的数据，每分钟采样一次
数据划分:
- D1: 约80,000个时间戳
- D2: 约40,000个时间戳，具有不同的数值范围和分布
预测设置: 使用最近120个时间戳预测未来10个时间戳的延迟值

评价指标

MAE (Mean Absolute Error): 平均绝对误差
MSE (Mean Squared Error): 均方误差
CRPS (Continuous Ranked Probability Score): 连续排名概率分数 $CRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy$

对比方法

DeepAR: 基于循环网络的深度自回归方法
DeepFactor: 结合经典时间序列模型和深度神经网络的混合模型
TimeGrad: 基于扩散模型的自回归去噪方法
Diffusion: 原始香草扩散模型

实现细节

优化器: Adam，学习率0.001
扩散步数: 50步
噪声水平: β₁ = 0.0001, βₜ = 0.5
批大小: 64
推理样本数: 100个样本近似分布
硬件: 单个Nvidia 3090 GPU (24GB)

实验结果

主要结果

MAE和MSE结果

数据集	时间范围	MSE			MAE
		Diffusion	TimeGrad	DiffTCN	Diffusion	TimeGrad	DiffTCN
D1	1	2.750±0.312	2.372±0.084	1.959±0.033	1.150±0.021	1.020±0.011	0.749±0.014
D1	10	2.594±0.116	2.203±0.087	1.924±0.015	1.060±0.013	0.915±0.036	0.761±0.011
D2	1	6.042±0.582	3.905±0.163	3.371±0.072	2.424±0.230	1.926±0.114	1.634±0.029
D2	10	6.572±0.219	4.455±0.319	2.508±0.096	2.324±0.151	1.808±0.013	1.707±0.010

CRPS结果

方法	D1	D2
DeepAR	0.065±0.007	0.096±0.008
DeepFactor	0.064±0.001	0.095±0.001
Diffusion	0.082±0.009	0.127±0.010
TimeGrad	0.067±0.003	0.091±0.004
DiffTCN	0.052±0.001	0.081±0.002