2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.
Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.
academic

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

基本信息

  • 论文ID: 2504.08821
  • 标题: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
  • 作者: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
  • 分类: cs.LG (Machine Learning), stat.ML (Statistics - Machine Learning)
  • 发表时间: 2025年10月15日 (arXiv v3)
  • 论文链接: https://arxiv.org/abs/2504.08821v3

摘要

本文针对延迟容忍网络(DTN)中的QoS指标预测问题,提出了一种基于条件扩散模型的概率预测方法。传统的均值回归方法难以充分捕获数据的复杂性,导致在DTN路由等操作任务中性能下降。本文将DTN中的QoS指标预测问题形式化为多变量时间序列的概率预测问题,通过扩散模型结合潜在时序动态来量化预测的不确定性。实验结果表明,该方法在流行的概率时间序列预测方法中表现最优。

研究背景与动机

问题定义

延迟容忍网络(DTN)在极长距离或恶劣环境下的通信中发挥重要作用,广泛应用于车载通信、野生动物追踪监控网络和农村地区通信等领域。DTN经常面临频繁中断、高错误率和可能持续数小时甚至数天的延迟等挑战。

问题重要性

  1. 网络性能优化: QoS指标预测能够提升网络在延迟、吞吐量、能耗和可靠性方面的表现
  2. 资源调度: 路由协议可以根据网络状态更高效地分发信息,降低能耗
  3. 流量优先级管理: 不同类型的网络流量有不同的QoS要求,预测有助于优先级分配

现有方法局限性

  1. 传统均值回归方法: 基于自回归模型,专注于通过最小化MSE等指标提供准确的点预测
  2. 多模态数据处理不足: 当数据包含多个模态时,均值回归无法捕获数据的完整复杂性
  3. 不确定性量化缺失: 确定性回归方法无法量化预测的不确定性,这在DTN的路由等操作任务中是必需的

研究动机

DTN中的QoS时间序列具有非平稳和多模态特征,需要一种能够:

  • 捕获时序数据复杂动态的方法
  • 量化预测不确定性的概率预测框架
  • 处理非平稳和多模态数据的鲁棒模型

核心贡献

  1. 问题重新定义: 将DTN中的QoS指标预测问题重新形式化为概率时间序列预测问题,能够量化预测的不确定性
  2. 扩散模型扩展: 扩展了流行的扩散模型以推断预测分布的样本,结合潜在上下文动态提高模型对非平稳和多模态时间序列的适应性
  3. DiffTCN框架: 提出了结合时序卷积网络(TCN)和Transformer的条件扩散模型框架,有效捕获长期依赖关系
  4. 实验验证: 通过广泛实验证明了所提方法相比现有技术的优势,在多个评价指标上取得最佳性能

方法详解

任务定义

给定多变量时间序列 X=(x1,x2,...,xt)Rm×tX = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t},其中 mm 是变量数量,tt 是时间序列长度。目标是预测未来 pp 个时间步的分布 Y=(yt+1,yt+2,...,yt+p)Rn×pY = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p},其中 nmn \leq m

模型架构

1. 扩散模型基础

扩散模型包含两个过程:

  • 前向扩散过程: 逐步向数据添加高斯噪声 q(xsxs1)=N(xs;1βsxs1,βsI)q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)
  • 反向去噪过程: 从噪声中恢复数据 pθ(xs1xs)=N(xs1;μθ(xs,s),σθ(xs,s)I)p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)

损失函数简化为: Lsimple=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s)2]L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]

2. 条件扩散模型

为了提高预测的准确性和可靠性,引入条件信息: pθ(xs1xs,ej)=N(xs1;μθ(xs,s,ej),σθ(xs,s,ej)I)p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)

其中 eje^j 表示时间 jj 的时序动态。条件损失函数为: Lsimples=Es[1,S],x0,εs[εsεθ(αˉsx0+1αˉsεs,s),ej2]L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]

3. 潜在时序动态捕获

采用时序卷积网络(TCN)捕获上下文动态,TCN的主要组件包括:

  • 因果卷积: 防止信息泄露
  • 1D全卷积网络: 输入到输出的映射
  • 扩张卷积: 扩展感受野
  • 残差时序块: 加深网络

4. Transformer集成

使用Transformer替代扩张卷积层作为主要计算模块:

  • 捕获时间序列中的长期依赖关系
  • 动态加权不同时间步的特征值
  • 通过注意力机制捕获不同变量间的相互依赖关系

技术创新点

  1. 概率预测范式: 从确定性预测转向概率预测,能够量化不确定性
  2. 条件扩散设计: 将上下文时序动态作为条件信息融入扩散过程
  3. TCN-Transformer融合: 结合TCN的并行性和Transformer的长期依赖捕获能力
  4. 迭代预测策略: 采用逐步预测方法,适用于任意预测时间范围

实验设置

数据集

使用公开的传感器数据集,包含互联网延迟等QoS指标:

  • 数据规模: 超过100天的数据,每分钟采样一次
  • 数据划分:
    • D1: 约80,000个时间戳
    • D2: 约40,000个时间戳,具有不同的数值范围和分布
  • 预测设置: 使用最近120个时间戳预测未来10个时间戳的延迟值

评价指标

  1. MAE (Mean Absolute Error): 平均绝对误差
  2. MSE (Mean Squared Error): 均方误差
  3. CRPS (Continuous Ranked Probability Score): 连续排名概率分数 CRPS(F,x)=(F(y)1(xy))2dyCRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy

对比方法

  • DeepAR: 基于循环网络的深度自回归方法
  • DeepFactor: 结合经典时间序列模型和深度神经网络的混合模型
  • TimeGrad: 基于扩散模型的自回归去噪方法
  • Diffusion: 原始香草扩散模型

实现细节

  • 优化器: Adam,学习率0.001
  • 扩散步数: 50步
  • 噪声水平: β₁ = 0.0001, βₜ = 0.5
  • 批大小: 64
  • 推理样本数: 100个样本近似分布
  • 硬件: 单个Nvidia 3090 GPU (24GB)

实验结果

主要结果

MAE和MSE结果

数据集时间范围MSEMAE
DiffusionTimeGradDiffTCNDiffusionTimeGradDiffTCN
D112.750±0.3122.372±0.0841.959±0.0331.150±0.0211.020±0.0110.749±0.014
D1102.594±0.1162.203±0.0871.924±0.0151.060±0.0130.915±0.0360.761±0.011
D216.042±0.5823.905±0.1633.371±0.0722.424±0.2301.926±0.1141.634±0.029
D2106.572±0.2194.455±0.3192.508±0.0962.324±0.1511.808±0.0131.707±0.010

CRPS结果

方法D1D2
DeepAR0.065±0.0070.096±0.008
DeepFactor0.064±0.0010.095±0.001
Diffusion0.082±0.0090.127±0.010
TimeGrad0.067±0.0030.091±0.004
DiffTCN0.052±0.0010.081±0.002

实验发现

  1. 一致性优势: DiffTCN在所有预测时间范围和数据集上均取得最佳性能
  2. 不确定性量化: CRPS结果表明DiffTCN在概率预测质量上显著优于基线方法
  3. 稳定性: DiffTCN展现出最小的性能变异性,表明方法的鲁棒性
  4. TCN优势: 相比TimeGrad使用RNN编码器,TCN的并行性带来明显的精度提升

相关工作

DTN中的QoS预测

  • 神经网络方法: Abdellah等使用NARX-RNN预测网络延迟
  • LSTM应用: Nagai等构建无线传感器网络测试平台,使用LSTM预测延迟
  • 矩阵分解: Ghandi等将网络延迟预测问题形式化为非负矩阵分解问题

时间序列预测

  • 传统方法: 基于ARMA等统计模型的预测方法
  • 深度学习: RNN、LSTM、GRU等循环神经网络方法
  • 概率预测: DeepAR、DeepFactor等概率预测框架

扩散模型应用

  • 图像生成: 扩散模型在图像生成任务中的成功应用
  • 时间序列: TimeGrad等将扩散模型应用于时间序列预测

结论与讨论

主要结论

  1. 概率预测优势: 将QoS预测问题重新形式化为概率预测能够有效量化不确定性
  2. 扩散模型有效性: 条件扩散模型能够有效处理非平稳和多模态时间序列数据
  3. 架构设计合理: TCN与Transformer的结合充分利用了两者的优势

局限性

  1. 计算复杂度: 扩散模型需要多步采样,计算开销较大
  2. 数据集规模: 实验仅在单一类型的网络延迟数据上验证
  3. 实际部署: 缺乏在真实DTN环境中的部署和验证

未来方向

论文提出的主要未来研究方向是扩展框架以处理分布外(out-of-distribution)场景,即在与训练数据不同分布的数据上进行推理。

深度评价

优点

  1. 问题定义清晰: 准确识别了现有方法的局限性,合理地将问题重新定义为概率预测
  2. 方法创新性: 巧妙地将扩散模型与时序动态建模结合,技术路线新颖
  3. 实验充分: 与多个强基线对比,使用多个评价指标,结果具有说服力
  4. 工程实现: 提供了详细的实现细节,有利于复现

不足

  1. 理论分析缺失: 缺乏对为什么该方法有效的理论分析和收敛性证明
  2. 数据集单一: 仅在网络延迟数据上验证,缺乏其他类型QoS指标的验证
  3. 计算效率: 未充分讨论扩散模型的计算开销和实时性问题
  4. 消融实验不足: 缺乏对各个组件贡献度的详细分析

影响力

  1. 学术贡献: 为DTN领域的QoS预测提供了新的技术路径
  2. 实用价值: 概率预测能力对实际网络运维具有重要价值
  3. 方法通用性: 所提框架可推广到其他时间序列预测任务

适用场景

  1. DTN网络优化: 路由决策、资源分配、负载均衡
  2. 网络运维: 故障预测、性能监控、容量规划
  3. 其他时序预测: 具有不确定性量化需求的时间序列预测任务

参考文献

论文引用了51篇相关文献,涵盖了DTN、时间序列预测、扩散模型等多个领域的重要工作,为研究提供了坚实的理论基础。


总体评价: 本文针对DTN中QoS预测的实际需求,提出了一个技术上创新、实验验证充分的解决方案。尽管在理论分析和实验广度方面存在一定不足,但整体上是一篇高质量的研究工作,对相关领域具有重要的参考价值。