2025-11-18T15:19:13.613978

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

Zhang, Liu, Xiang et al.

Active QoS metric prediction, commonly employed in the maintenance and operation of DTN, could enhance network performance regarding latency, throughput, energy consumption, and dependability. Naturally formulated as a multivariate time series forecasting problem, it attracts substantial research efforts. Traditional mean regression methods for time series forecasting cannot capture the data complexity adequately, resulting in deteriorated performance in operational tasks in DTNs such as routing. This paper formulates the prediction of QoS metrics in DTN as a probabilistic forecasting problem on multivariate time series, where one could quantify the uncertainty of forecasts by characterizing the distribution of these samples. The proposed approach hires diffusion models and incorporates the latent temporal dynamics of non-stationary and multi-mode data into them. Extensive experiments demonstrate the efficacy of the proposed approach by showing that it outperforms the popular probabilistic time series forecasting methods.

academic

विलंब-सहिष्णु नेटवर्क में सशर्त विसरण मॉडल का उपयोग करके गुप्त गतिशीलता पर संभाव्य QoS मेट्रिक पूर्वानुमान

मूल जानकारी

पेपर ID: 2504.08821
शीर्षक: Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics
लेखक: Enming Zhang, Zheng Liu, Yu Xiang, Yanwen Qu
वर्गीकरण: cs.LG (मशीन लर्निंग), stat.ML (सांख्यिकी - मशीन लर्निंग)
प्रकाशन समय: 2025 अक्टूबर 15 (arXiv v3)
पेपर लिंक: https://arxiv.org/abs/2504.08821v3

सारांश

यह पेपर विलंब-सहिष्णु नेटवर्क (DTN) में QoS मेट्रिक पूर्वानुमान की समस्या के लिए सशर्त विसरण मॉडल पर आधारित एक संभाव्य पूर्वानुमान विधि प्रस्तावित करता है। पारंपरिक माध्य प्रतिगमन विधियां डेटा की जटिलता को पूरी तरह से पकड़ने में विफल रहती हैं, जिससे DTN राउटिंग जैसे परिचालन कार्यों में प्रदर्शन में गिरावट आती है। यह पेपर DTN में QoS मेट्रिक पूर्वानुमान समस्या को बहुभिन्न समय श्रृंखला की संभाव्य पूर्वानुमान समस्या के रूप में औपचारिक रूप देता है, विसरण मॉडल को गुप्त समय श्रृंखला गतिशीलता के साथ जोड़कर पूर्वानुमान की अनिश्चितता को परिमाणित करता है। प्रयोगात्मक परिणाम दर्शाते हैं कि यह विधि लोकप्रिय संभाव्य समय श्रृंखला पूर्वानुमान विधियों में सर्वोत्तम प्रदर्शन करती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

विलंब-सहिष्णु नेटवर्क (DTN) अत्यंत लंबी दूरी या कठोर वातावरण में संचार में महत्वपूर्ण भूमिका निभाते हैं, जो वाहन संचार, वन्यजीव ट्रैकिंग निगरानी नेटवर्क और ग्रामीण क्षेत्र संचार जैसे अनुप्रयोगों में व्यापक रूप से उपयोग किए जाते हैं। DTN को अक्सर बार-बार व्यवधान, उच्च त्रुटि दर और संभवतः घंटों या दिनों तक चलने वाली देरी जैसी चुनौतियों का सामना करना पड़ता है।

समस्या की महत्ता

नेटवर्क प्रदर्शन अनुकूलन: QoS मेट्रिक पूर्वानुमान विलंब, थ्रूपुट, ऊर्जा खपत और विश्वसनीयता के संदर्भ में नेटवर्क प्रदर्शन को बढ़ा सकता है
संसाधन शेड्यूलिंग: राउटिंग प्रोटोकॉल नेटवर्क स्थिति के अनुसार अधिक कुशलतापूर्वक जानकारी वितरित कर सकते हैं, ऊर्जा खपत को कम कर सकते हैं
ट्रैफिक प्राथमिकता प्रबंधन: विभिन्न प्रकार के नेटवर्क ट्रैफिक के विभिन्न QoS आवश्यकताएं होती हैं, पूर्वानुमान प्राथमिकता आवंटन में सहायता करता है

मौजूदा विधियों की सीमाएं

पारंपरिक माध्य प्रतिगमन विधियां: स्वप्रतिगामी मॉडल पर आधारित, MSE जैसे मेट्रिक्स को कम करके सटीक बिंदु पूर्वानुमान प्रदान करने पर केंद्रित
बहुविध डेटा प्रसंस्करण अपर्याप्त: जब डेटा में कई विधाएं होती हैं, माध्य प्रतिगमन डेटा की पूर्ण जटिलता को पकड़ नहीं सकता
अनिश्चितता परिमाणीकरण की कमी: नियतात्मक प्रतिगमन विधियां पूर्वानुमान की अनिश्चितता को परिमाणित नहीं कर सकती, जो DTN के राउटिंग जैसे परिचालन कार्यों में आवश्यक है

अनुसंधान प्रेरणा

DTN में QoS समय श्रृंखला में गैर-स्थिर और बहुविध विशेषताएं होती हैं, जिसके लिए एक विधि की आवश्यकता होती है जो:

समय श्रृंखला डेटा की जटिल गतिशीलता को पकड़ सके
पूर्वानुमान अनिश्चितता को परिमाणित करने के लिए संभाव्य पूर्वानुमान ढांचा प्रदान करे
गैर-स्थिर और बहुविध डेटा को संभालने के लिए मजबूत मॉडल हो

मुख्य योगदान

समस्या पुनर्परिभाषा: DTN में QoS मेट्रिक पूर्वानुमान समस्या को संभाव्य समय श्रृंखला पूर्वानुमान समस्या के रूप में पुनः औपचारिक रूप दिया गया है, जो पूर्वानुमान की अनिश्चितता को परिमाणित कर सकता है
विसरण मॉडल विस्तार: लोकप्रिय विसरण मॉडल को पूर्वानुमान वितरण के नमूनों का अनुमान लगाने के लिए विस्तारित किया गया है, गुप्त संदर्भ गतिशीलता के साथ संयुक्त होकर गैर-स्थिर और बहुविध समय श्रृंखला के लिए मॉडल अनुकूलन में सुधार करता है
DiffTCN ढांचा: समय श्रृंखला कनवोल्यूशनल नेटवर्क (TCN) और Transformer को जोड़ने वाली सशर्त विसरण मॉडल ढांचा प्रस्तावित किया गया है, जो दीर्घकालीन निर्भरता को प्रभावी ढंग से पकड़ता है
प्रयोगात्मक सत्यापन: व्यापक प्रयोगों के माध्यम से मौजूदा तकनीकों की तुलना में प्रस्तावित विधि के लाभों का प्रदर्शन किया गया है, कई मूल्यांकन मेट्रिक्स पर सर्वोत्तम प्रदर्शन प्राप्त किया गया है

विधि विवरण

कार्य परिभाषा

बहुभिन्न समय श्रृंखला $X = (x_1, x_2, ..., x_t) \in \mathbb{R}^{m \times t}$ दी गई है, जहां $m$ चर की संख्या है, $t$ समय श्रृंखला की लंबाई है। लक्ष्य अगले $p$ समय चरणों के वितरण $Y = (y_{t+1}, y_{t+2}, ..., y_{t+p}) \in \mathbb{R}^{n \times p}$ का पूर्वानुमान लगाना है, जहां $n \leq m$ ।

मॉडल आर्किटेक्चर

1. विसरण मॉडल आधार

विसरण मॉडल में दो प्रक्रियाएं होती हैं:

अग्रगामी विसरण प्रक्रिया: डेटा में क्रमिक रूप से गॉसियन शोर जोड़ना $q(x^s|x^{s-1}) = \mathcal{N}(x^s; \sqrt{1-\beta_s}x^{s-1}, \beta_s I)$
विपरीत विनोइजिंग प्रक्रिया: शोर से डेटा को पुनः प्राप्त करना $p_\theta(x^{s-1}|x^s) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s), \sigma_\theta(x^s, s)I)$

हानि फलन को सरल बनाया गया है: $L_{simple} = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s)\|^2]$

2. सशर्त विसरण मॉडल

पूर्वानुमान की सटीकता और विश्वसनीयता में सुधार के लिए, सशर्त जानकारी को शामिल किया गया है: $p_\theta(x^{s-1}|x^s, e^j) = \mathcal{N}(x^{s-1}; \mu_\theta(x^s, s, e^j), \sigma_\theta(x^s, s, e^j)I)$

जहां $e^j$ समय $j$ पर समय श्रृंखला गतिशीलता को दर्शाता है। सशर्त हानि फलन है: $L_{simple}^s = \mathbb{E}_{s \sim [1,S], x^0, \varepsilon_s}[\|\varepsilon_s - \varepsilon_\theta(\sqrt{\bar{\alpha}_s}x^0 + \sqrt{1-\bar{\alpha}_s}\varepsilon_s, s), e^j\|^2]$

3. गुप्त समय श्रृंखला गतिशीलता पकड़ना

संदर्भ गतिशीलता को पकड़ने के लिए समय श्रृंखला कनवोल्यूशनल नेटवर्क (TCN) का उपयोग किया जाता है, TCN के मुख्य घटक हैं:

कारणात्मक कनवोल्यूशन: सूचना रिसाव को रोकना
1D पूर्ण कनवोल्यूशनल नेटवर्क: इनपुट से आउटपुट तक मैपिंग
विस्तारित कनवोल्यूशन: रिसेप्टिव फील्ड का विस्तार
अवशिष्ट समय श्रृंखला ब्लॉक: नेटवर्क को गहरा करना

4. Transformer एकीकरण

विस्तारित कनवोल्यूशन परत के बजाय मुख्य कम्प्यूटेशनल मॉड्यूल के रूप में Transformer का उपयोग किया जाता है:

समय श्रृंखला में दीर्घकालीन निर्भरता संबंध को पकड़ना
विभिन्न समय चरणों की विशेषताओं को गतिशील रूप से भारित करना
ध्यान तंत्र के माध्यम से विभिन्न चर के बीच पारस्परिक निर्भरता को पकड़ना

तकनीकी नवाचार बिंदु

संभाव्य पूर्वानुमान प्रतिमान: नियतात्मक पूर्वानुमान से संभाव्य पूर्वानुमान में स्थानांतरण, अनिश्चितता को परिमाणित कर सकता है
सशर्त विसरण डिजाइन: संदर्भ समय श्रृंखला गतिशीलता को विसरण प्रक्रिया में सशर्त जानकारी के रूप में एकीकृत करना
TCN-Transformer संलयन: TCN की समानता और Transformer की दीर्घकालीन निर्भरता पकड़ने की क्षमता का संयोजन
पुनरावृत्तीय पूर्वानुमान रणनीति: चरणबद्ध पूर्वानुमान विधि को अपनाना, किसी भी पूर्वानुमान समय सीमा के लिए लागू

प्रयोगात्मक सेटअप

डेटासेट

सार्वजनिक सेंसर डेटासेट का उपयोग किया गया है, जिसमें इंटरनेट विलंब जैसे QoS मेट्रिक्स शामिल हैं:

डेटा स्केल: 100 दिनों से अधिक का डेटा, प्रति मिनट नमूना लिया गया
डेटा विभाजन:
- D1: लगभग 80,000 समय टिकट
- D2: लगभग 40,000 समय टिकट, विभिन्न संख्यात्मक श्रेणी और वितरण के साथ
पूर्वानुमान सेटअप: अगले 10 समय चरणों के विलंब मान का पूर्वानुमान लगाने के लिए सबसे हाल के 120 समय टिकट का उपयोग

मूल्यांकन मेट्रिक्स

MAE (माध्य निरपेक्ष त्रुटि): औसत निरपेक्ष त्रुटि
MSE (माध्य वर्ग त्रुटि): माध्य वर्ग त्रुटि
CRPS (सतत रैंक की गई संभावना स्कोर): सतत रैंक की गई संभावना स्कोर $CRPS(F,x) = \int_{-\infty}^{\infty} (F(y) - \mathbf{1}(x \leq y))^2 dy$

तुलना विधियां

DeepAR: पुनरावर्ती नेटवर्क पर आधारित गहरी स्वप्रतिगामी विधि
DeepFactor: शास्त्रीय समय श्रृंखला मॉडल और गहरे तंत्रिका नेटवर्क को जोड़ने वाली संकर मॉडल
TimeGrad: विसरण मॉडल पर आधारित स्वप्रतिगामी विनोइजिंग विधि
Diffusion: मूल वेनिला विसरण मॉडल

कार्यान्वयन विवरण

अनुकूलक: Adam, सीखने की दर 0.001
विसरण चरण: 50 चरण
शोर स्तर: β₁ = 0.0001, βₜ = 0.5
बैच आकार: 64
अनुमान नमूने: वितरण का अनुमान लगाने के लिए 100 नमूने
हार्डवेयर: एकल Nvidia 3090 GPU (24GB)

प्रयोगात्मक परिणाम

मुख्य परिणाम

MAE और MSE परिणाम

डेटासेट	समय श्रेणी	MSE			MAE
		Diffusion	TimeGrad	DiffTCN	Diffusion	TimeGrad	DiffTCN
D1	1	2.750±0.312	2.372±0.084	1.959±0.033	1.150±0.021	1.020±0.011	0.749±0.014
D1	10	2.594±0.116	2.203±0.087	1.924±0.015	1.060±0.013	0.915±0.036	0.761±0.011
D2	1	6.042±0.582	3.905±0.163	3.371±0.072	2.424±0.230	1.926±0.114	1.634±0.029
D2	10	6.572±0.219	4.455±0.319	2.508±0.096	2.324±0.151	1.808±0.013	1.707±0.010

CRPS परिणाम

विधि	D1	D2
DeepAR	0.065±0.007	0.096±0.008
DeepFactor	0.064±0.001	0.095±0.001
Diffusion	0.082±0.009	0.127±0.010
TimeGrad	0.067±0.003	0.091±0.004
DiffTCN	0.052±0.001	0.081±0.002

प्रयोगात्मक निष्कर्ष

सुसंगत लाभ: DiffTCN सभी पूर्वानुमान समय श्रेणी और डेटासेट पर सर्वोत्तम प्रदर्शन प्राप्त करता है
अनिश्चितता परिमाणीकरण: CRPS परिणाम दर्शाते हैं कि DiffTCN संभाव्य पूर्वानुमान गुणवत्ता में आधार रेखा विधियों से काफी बेहतर है
स्थिरता: DiffTCN न्यूनतम प्रदर्शन परिवर्तनशीलता प्रदर्शित करता है, विधि की मजबूती को दर्शाता है
TCN लाभ: TimeGrad द्वारा RNN एनकोडर का उपयोग करने की तुलना में, TCN की समानता स्पष्ट सटीकता सुधार लाती है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

संभाव्य पूर्वानुमान लाभ: QoS पूर्वानुमान समस्या को संभाव्य पूर्वानुमान के रूप में पुनः औपचारिक रूप देना अनिश्चितता को प्रभावी ढंग से परिमाणित कर सकता है
विसरण मॉडल प्रभावशीलता: सशर्त विसरण मॉडल गैर-स्थिर और बहुविध समय श्रृंखला डेटा को प्रभावी ढंग से संभाल सकता है
आर्किटेक्चर डिजाइन तर्कसंगत: TCN और Transformer का संयोजन दोनों के लाभों का पूरी तरह से उपयोग करता है

सीमाएं

कम्प्यूटेशनल जटिलता: विसरण मॉडल को कई चरणों के नमूने की आवश्यकता होती है, कम्प्यूटेशनल ओवरहेड बड़ा होता है
डेटासेट स्केल: प्रयोग केवल एकल प्रकार के नेटवर्क विलंब डेटा पर सत्यापित किए गए हैं
व्यावहारिक तैनाती: वास्तविक DTN वातावरण में तैनाती और सत्यापन की कमी

भविष्य की दिशाएं

पेपर द्वारा प्रस्तावित मुख्य भविष्य अनुसंधान दिशा वितरण से बाहर (out-of-distribution) परिदृश्यों को संभालने के लिए ढांचे को विस्तारित करना है, अर्थात प्रशिक्षण डेटा से भिन्न वितरण वाले डेटा पर अनुमान लगाना।

गहन मूल्यांकन

शक्तियां

समस्या परिभाषा स्पष्ट: मौजूदा विधियों की सीमाओं की सटीक पहचान, समस्या को संभाव्य पूर्वानुमान के रूप में तर्कसंगत पुनर्परिभाषा
विधि नवाचार: विसरण मॉडल को समय श्रृंखला गतिशीलता मॉडलिंग के साथ चतुराई से जोड़ना, तकनीकी मार्ग नवीन
प्रयोग पर्याप्त: कई मजबूत आधार रेखाओं के साथ तुलना, कई मूल्यांकन मेट्रिक्स का उपयोग, परिणाम प्रेरक
इंजीनियरिंग कार्यान्वयन: विस्तृत कार्यान्वयन विवरण प्रदान किए गए हैं, पुनरुत्पादन में सहायक

कमियां

सैद्धांतिक विश्लेषण की कमी: यह विश्लेषण करने के लिए कि विधि प्रभावी क्यों है, सैद्धांतिक विश्लेषण और अभिसरण प्रमाण की कमी
डेटासेट एकल: केवल नेटवर्क विलंब डेटा पर सत्यापित, अन्य प्रकार के QoS मेट्रिक्स की कमी
कम्प्यूटेशनल दक्षता: विसरण मॉडल की कम्प्यूटेशनल लागत और वास्तविक समय समस्या पर पर्याप्त चर्चा नहीं
विलोपन प्रयोग अपर्याप्त: प्रत्येक घटक के योगदान की विस्तृत विश्लेषण की कमी

प्रभाव

शैक्षणिक योगदान: DTN क्षेत्र में QoS पूर्वानुमान के लिए नए तकनीकी मार्ग प्रदान करता है
व्यावहारिक मूल्य: संभाव्य पूर्वानुमान क्षमता वास्तविक नेटवर्क संचालन के लिए महत्वपूर्ण मूल्य रखती है
विधि सामान्यता: प्रस्तावित ढांचा अन्य समय श्रृंखला पूर्वानुमान कार्यों तक विस्तारित किया जा सकता है

लागू परिदृश्य

DTN नेटवर्क अनुकूलन: राउटिंग निर्णय, संसाधन आवंटन, भार संतुलन
नेटवर्क संचालन: विफलता पूर्वानुमान, प्रदर्शन निगरानी, क्षमता योजना
अन्य समय श्रृंखला पूर्वानुमान: अनिश्चितता परिमाणीकरण आवश्यकताओं वाले समय श्रृंखला पूर्वानुमान कार्य

संदर्भ

पेपर ने 51 संबंधित संदर्भों का हवाला दिया है, जिसमें DTN, समय श्रृंखला पूर्वानुमान, विसरण मॉडल आदि कई क्षेत्रों के महत्वपूर्ण कार्य शामिल हैं, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करते हैं।

समग्र मूल्यांकन: यह पेपर DTN में QoS पूर्वानुमान की व्यावहारिक आवश्यकता के लिए, तकनीकी रूप से नवीन और प्रयोगात्मक सत्यापन से भरपूर समाधान प्रस्तावित करता है। यद्यपि सैद्धांतिक विश्लेषण और प्रयोगात्मक व्यापकता के संदर्भ में कुछ कमियां हैं, लेकिन समग्र रूप से यह उच्च गुणवत्ता का अनुसंधान कार्य है, जो संबंधित क्षेत्रों के लिए महत्वपूर्ण संदर्भ मूल्य रखता है।