Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.
論文ID : 2504.08821タイトル : Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics著者 : Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu分類 : cs.LG(機械学習)、stat.ML(統計-機械学習)発表日時 : 2025年10月15日(arXiv v3)論文リンク : https://arxiv.org/abs/2504.08821v3 本論文は、遅延許容ネットワーク(DTN)におけるQoS指標予測問題に対して、条件付き拡散モデルに基づく確率的予測手法を提案している。従来の平均回帰手法はデータの複雑性を十分に捉えることが困難であり、DTNルーティングなどの運用タスクにおけるパフォーマンス低下につながっている。本論文は、DTNにおけるQoS指標予測問題を多変量時系列の確率的予測問題として形式化し、拡散モデルと潜在時系列動力学を組み合わせることで予測の不確実性を定量化している。実験結果は、提案手法が一般的な確率的時系列予測手法の中で最高のパフォーマンスを示すことを明らかにしている。
遅延許容ネットワーク(DTN)は、極めて長距離または悪劣な環境下での通信において重要な役割を果たし、車両通信、野生動物追跡監視ネットワーク、農村地域通信など広範な応用分野を有している。DTNは頻繁な中断、高いエラー率、および数時間から数日間に及ぶ可能性のある遅延など、多くの課題に直面している。
ネットワークパフォーマンス最適化 : QoS指標予測は、遅延、スループット、エネルギー消費、信頼性に関するネットワークパフォーマンスを向上させることができるリソーススケジューリング : ルーティングプロトコルはネットワーク状態に基づいてより効率的に情報を配信でき、エネルギー消費を削減できるトラフィック優先度管理 : 異なるタイプのネットワークトラフィックは異なるQoS要件を有しており、予測は優先度割り当てに役立つ従来の平均回帰手法 : 自己回帰モデルに基づき、MSEなどの指標の最小化を通じた正確なポイント予測に焦点を当てているマルチモーダルデータ処理の不十分性 : データが複数のモーダルを含む場合、平均回帰はデータの完全な複雑性を捉えることができない不確実性定量化の欠落 : 決定論的回帰手法は予測の不確実性を定量化できず、これはDTNのルーティングなどの運用タスクに必要であるDTN内のQoS時系列は非定常性とマルチモーダル特性を有しており、以下を可能にする手法が必要である:
時系列データの複雑な動力学を捉える 予測の不確実性を定量化する確率的予測フレームワーク 非定常およびマルチモーダルデータを処理するロバストなモデル 問題の再定義 : DTNにおけるQoS指標予測問題を確率的時系列予測問題として再形式化し、予測の不確実性を定量化することが可能拡散モデルの拡張 : 予測分布のサンプルを推論するための一般的な拡散モデルを拡張し、潜在コンテキスト動力学と組み合わせることで、非定常およびマルチモーダル時系列への適応性を向上DiffTCNフレームワーク : 時系列畳み込みネットワーク(TCN)とTransformerを組み合わせた条件付き拡散モデルフレームワークを提案し、長期依存関係を効果的に捉える実験検証 : 広範な実験を通じて、提案手法が既存技術に対する優位性を実証し、複数の評価指標において最高のパフォーマンスを達成多変量時系列 X = ( x 1 , x 2 , . . . , x t ) ∈ R m × t X = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t} X = ( x 1 , x 2 , ... , x t ) ∈ R m × t が与えられた場合、ここで m m m は変数の数、t t t は時系列の長さである。目標は、未来の p p p 個のタイムステップの分布 Y = ( y t + 1 , y t + 2 , . . . , y t + p ) ∈ R n × p Y = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p} Y = ( y t + 1 , y t + 2 , ... , y t + p ) ∈ R n × p を予測することであり、ここで n ≤ m n \leq m n ≤ m である。
拡散モデルは2つのプロセスを含む:
前向き拡散プロセス : データに段階的にガウスノイズを追加
q ( x s ∣ x s − 1 ) = N ( x s ; 1 − β s x s − 1 , β s I ) q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I) q ( x s ∣ x s − 1 ) = N ( x s ; 1 − β s x s − 1 , β s I ) 逆向き除去プロセス : ノイズからデータを復元
p θ ( x s − 1 ∣ x s ) = N ( x s − 1 ; μ θ ( x s , s ) , σ θ ( x s , s ) I ) p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I) p θ ( x s − 1 ∣ x s ) = N ( x s − 1 ; μ θ ( x s , s ) , σ θ ( x s , s ) I ) 損失関数は以下のように簡略化される:
L s i m p l e = E s ∼ [ 1 , S ] , x 0 , ε s [ ∥ ε s − ε θ ( α ˉ s x 0 + 1 − α ˉ s ε s , s ) ∥ 2 ] L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2] L s im pl e = E s ∼ [ 1 , S ] , x 0 , ε s [ ∥ ε s − ε θ ( α ˉ s x 0 + 1 − α ˉ s ε s , s ) ∥ 2 ]
予測の正確性と信頼性を向上させるため、条件情報を導入する:
p θ ( x s − 1 ∣ x s , e j ) = N ( x s − 1 ; μ θ ( x s , s , e j ) , σ θ ( x s , s , e j ) I ) p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I) p θ ( x s − 1 ∣ x s , e j ) = N ( x s − 1 ; μ θ ( x s , s , e j ) , σ θ ( x s , s , e j ) I )
ここで e j e^j e j は時刻 j j j における時系列動力学を表す。条件付き損失関数は以下の通りである:
L s i m p l e s = E s ∼ [ 1 , S ] , x 0 , ε s [ ∥ ε s − ε θ ( α ˉ s x 0 + 1 − α ˉ s ε s , s ) , e j ∥ 2 ] L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2] L s im pl e s = E s ∼ [ 1 , S ] , x 0 , ε s [ ∥ ε s − ε θ ( α ˉ s x 0 + 1 − α ˉ s ε s , s ) , e j ∥ 2 ]
時系列畳み込みネットワーク(TCN)を採用してコンテキスト動力学を捕捉し、TCNの主要コンポーネントは以下を含む:
因果畳み込み : 情報漏洩を防止1D全畳み込みネットワーク : 入力から出力への写像拡張畳み込み : 受容野を拡張残差時系列ブロック : ネットワークを深化拡張畳み込み層の代わりにTransformerを主要な計算モジュールとして使用:
時系列における長期依存関係を捕捉 異なるタイムステップの特徴値に動的に重み付け 注意メカニズムを通じて異なる変数間の相互依存関係を捕捉 確率的予測パラダイム : 決定論的予測から確率的予測への転換により、不確実性を定量化可能条件付き拡散設計 : コンテキスト時系列動力学を条件情報として拡散プロセスに統合TCN-Transformer融合 : TCNの並列性とTransformerの長期依存関係捕捉能力を結合反復予測戦略 : 段階的予測手法を採用し、任意の予測時間範囲に適用可能インターネット遅延などのQoS指標を含む公開センサーデータセットを使用:
データ規模 : 100日以上のデータ、1分ごとのサンプリングデータ分割 :
D1: 約80,000個のタイムスタンプ D2: 約40,000個のタイムスタンプ、異なる数値範囲と分布を有する 予測設定 : 最新の120個のタイムスタンプを使用して、未来10個のタイムステップの遅延値を予測MAE(平均絶対誤差) : 平均絶対誤差MSE(平均二乗誤差) : 平均二乗誤差CRPS(連続ランク確率スコア) : 連続ランク確率スコア
C R P S ( F , x ) = ∫ − ∞ ∞ ( F ( y ) − 1 ( x ≤ y ) ) 2 d y CRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy CRPS ( F , x ) = ∫ − ∞ ∞ ( F ( y ) − 1 ( x ≤ y ) ) 2 d y DeepAR : 循環ネットワークに基づく深層自己回帰手法DeepFactor : 古典的時系列モデルと深層ニューラルネットワークを組み合わせたハイブリッドモデルTimeGrad : 拡散モデルに基づく自己回帰除去手法Diffusion : オリジナルのバニラ拡散モデルオプティマイザ : Adam、学習率0.001拡散ステップ数 : 50ステップノイズレベル : β₁ = 0.0001、βₜ = 0.5バッチサイズ : 64推論サンプル数 : 分布を近似するための100サンプルハードウェア : 単一Nvidia 3090 GPU(24GB)データセット 時間範囲 MSE MAE Diffusion TimeGrad DiffTCN Diffusion TimeGrad DiffTCN D1 1 2.750±0.312 2.372±0.084 1.959±0.033 1.150±0.021 1.020±0.011 0.749±0.014 D1 10 2.594±0.116 2.203±0.087 1.924±0.015 1.060±0.013 0.915±0.036 0.761±0.011 D2 1 6.042±0.582 3.905±0.163 3.371±0.072 2.424±0.230 1.926±0.114 1.634±0.029 D2 10 6.572±0.219 4.455±0.319 2.508±0.096 2.324±0.151 1.808±0.013 1.707±0.010
手法 D1 D2 DeepAR 0.065±0.007 0.096±0.008 DeepFactor 0.064±0.001 0.095±0.001 Diffusion 0.082±0.009 0.127±0.010 TimeGrad 0.067±0.003 0.091±0.004 DiffTCN 0.052±0.001 0.081±0.002
一貫した優位性 : DiffTCNはすべての予測時間範囲とデータセットにおいて最高のパフォーマンスを達成不確実性定量化 : CRPS結果は、DiffTCNが確率的予測品質においてベースライン手法を大幅に上回ることを示唆安定性 : DiffTCNは最小のパフォーマンス変動性を示し、手法のロバスト性を示唆TCNの優位性 : TimeGradがRNNエンコーダを使用するのに対し、TCNの並列性は明らかな精度向上をもたらすニューラルネットワーク手法 : Abdellahらはネットワーク遅延予測にNARX-RNNを使用LSTM応用 : Nagaiらは無線センサーネットワークテストプラットフォームを構築し、遅延予測にLSTMを使用行列分解 : Gandhiらはネットワーク遅延予測問題を非負行列分解問題として形式化従来の手法 : ARMAなどの統計モデルに基づく予測手法深層学習 : RNN、LSTM、GRUなどの循環ニューラルネットワーク手法確率的予測 : DeepAR、DeepFactorなどの確率的予測フレームワーク画像生成 : 画像生成タスクにおける拡散モデルの成功した応用時系列 : TimeGradなど時系列予測への拡散モデルの応用確率的予測の優位性 : QoS予測問題を確率的予測として再形式化することで、不確実性を効果的に定量化可能拡散モデルの有効性 : 条件付き拡散モデルは非定常およびマルチモーダル時系列データを効果的に処理可能アーキテクチャ設計の合理性 : TCNとTransformerの組み合わせは両者の利点を十分に活用計算複雑性 : 拡散モデルは多段階サンプリングを必要とし、計算オーバーヘッドが大きいデータセット規模 : 実験は単一タイプのネットワーク遅延データのみで検証実際の展開 : 実際のDTN環境での展開と検証が欠落論文が提案する主要な今後の研究方向は、分布外(out-of-distribution)シナリオを処理するようにフレームワークを拡張することであり、すなわち訓練データとは異なる分布のデータに対する推論である。
問題定義の明確性 : 既存手法の限界を正確に特定し、問題を合理的に確率的予測として再定義手法の革新性 : 拡散モデルと時系列動力学建模を巧妙に組み合わせ、技術的ルートが新規実験の充実 : 複数の強力なベースラインとの比較、複数の評価指標の使用、説得力のある結果工学的実装 : 詳細な実装詳細を提供し、再現を容易にする理論的分析の欠落 : 手法が有効である理由の理論的分析と収束性証明が欠落データセットの単一性 : ネットワーク遅延データのみで検証、他のタイプのQoS指標の検証が欠落計算効率 : 拡散モデルの計算オーバーヘッドとリアルタイム性の問題が十分に議論されていないアブレーション実験の不足 : 各コンポーネントの貢献度の詳細な分析が欠落学術的貢献 : DTN領域のQoS予測に新しい技術的パスを提供実用的価値 : 確率的予測能力は実際のネットワーク運用に重要な価値を有する手法の汎用性 : 提案フレームワークは他の時系列予測タスクに推広可能DTNネットワーク最適化 : ルーティング決定、リソース割り当て、負荷分散ネットワーク運用 : 障害予測、パフォーマンス監視、容量計画その他の時系列予測 : 不確実性定量化が必要な時系列予測タスク論文は51篇の関連文献を引用しており、DTN、時系列予測、拡散モデルなど複数の領域の重要な研究をカバーし、研究に堅実な理論的基礎を提供している。
総合評価 : 本論文は、DTNにおけるQoS予測の実際的ニーズに対して、技術的に革新的で実験検証が充実した解決策を提案している。理論的分析と実験の広さの面で若干の不足があるものの、全体的には高品質な研究成果であり、関連領域に重要な参考価値を有している。