Prioritizing Latency with Profit: A DRL-Based Admission Control for 5G Network Slices
Chakraborty, Asrar, Sengupta et al.
5G networks enable diverse services such as eMBB, URLLC, and mMTC through network slicing, necessitating intelligent admission control and resource allocation to meet stringent QoS requirements while maximizing Network Service Provider (NSP) profits. However, existing Deep Reinforcement Learning (DRL) frameworks focus primarily on profit optimization without explicitly accounting for service delay, potentially leading to QoS violations for latency-sensitive slices. Moreover, commonly used epsilon-greedy exploration of DRL often results in unstable convergence and suboptimal policy learning. To address these gaps, we propose DePSAC -- a Delay and Profit-aware Slice Admission Control scheme. Our DRL-based approach incorporates a delay-aware reward function, where penalties due to service delay incentivize the prioritization of latency-critical slices such as URLLC. Additionally, we employ Boltzmann exploration to achieve smoother and faster convergence. We implement and evaluate DePSAC on a simulated 5G core network substrate with realistic Network Slice Request (NSLR) arrival patterns. Experimental results demonstrate that our method outperforms the DSARA baseline in terms of overall profit, reduced URLLC slice delays, improved acceptance rates, and improved resource consumption. These findings validate the effectiveness of the proposed DePSAC in achieving better QoS-profit trade-offs for practical 5G network slicing scenarios.
academic
विलंबता को लाभ के साथप्राथमिकता देना: 5G नेटवर्क स्लाइस के लिए DRL-आधारित प्रवेश नियंत्रण
यह पेपर 5G नेटवर्क स्लाइस के प्रवेश नियंत्रण समस्या के लिए DePSAC (विलंबता और लाभ-जागरूक स्लाइस प्रवेश नियंत्रण) प्रस्ताव प्रस्तुत करता है। यह योजना गहन सुदृढ़ीकरण सीखने की रूपरेखा के माध्यम से, नेटवर्क सेवा प्रदाता के लाभ को अधिकतम करते हुए, सेवा विलंबता को स्पष्ट रूप से विचार करती है, विशेष रूप से विलंबता-संवेदनशील URLLC स्लाइस की प्राथमिकता प्रबंधन। यह योजना विलंबता-जागरूक पुरस्कार फ़ंक्शन और बोल्ट्जमैन अन्वेषण रणनीति का उपयोग करती है, अनुकृत 5G कोर नेटवर्क पर सत्यापित की गई है जो लाभ, विलंबता, स्वीकृति दर और संसाधन खपत के संदर्भ में आधारभूत DSARA विधि की तुलना में सुधार दिखाती है।
5G नेटवर्क नेटवर्क स्लाइसिंग तकनीक के माध्यम से विविध सेवाओं का समर्थन करते हैं, जिनमें संवर्धित मोबाइल ब्रॉडबैंड (eMBB), अति-विश्वसनीय कम विलंबता संचार (URLLC) और बड़े पैमाने पर मशीन-प्रकार संचार (mMTC) शामिल हैं। ये सेवाएं विषम QoS आवश्यकताओं के साथ हैं, जिन्हें कठोर QoS आवश्यकताओं और नेटवर्क सेवा प्रदाता (NSP) की लाभप्रदता को संतुलित करने के लिए बुद्धिमान प्रवेश नियंत्रण और संसाधन आवंटन रणनीति की आवश्यकता है।
आधारभूत DSARA विधि हालांकि लाभ को प्रभावी ढंग से अधिकतम कर सकती है, लेकिन विभिन्न स्लाइस प्रकारों की विलंबता भिन्नता पर विचार नहीं करती है, जिससे QoS उल्लंघन हो सकता है। यह पेपर विलंबता और लाभ दोनों पर विचार करने वाली स्लाइस प्रवेश नियंत्रण योजना विकसित करने का लक्ष्य रखता है।
विलंबता-जागरूक पुरस्कार फ़ंक्शन: QoS आवश्यकताओं और NSP लाभप्रदता को संतुलित करने वाले लाभ-विलंबता-जागरूक पुरस्कार सूत्र का प्रस्ताव
बोल्ट्जमैन अन्वेषण रणनीति: DRL एजेंट में बोल्ट्जमैन अन्वेषण को एकीकृत करना, सीखने की स्थिरता में सुधार, epsilon-greedy विधि की स्थानीय इष्टतम समस्या से बचना
व्यापक प्रायोगिक मूल्यांकन: अनुकृत 5G कोर नेटवर्क पर DePSAC को लागू करना, यथार्थवादी नेटवर्क स्लाइस अनुरोध आगमन पैटर्न के साथ मूल्यांकन
प्रदर्शन सुधार सत्यापन: प्रायोगिक परिणाम विलंबता-QoS व्यापार-बंद में DePSAC के सुधार को सत्यापित करते हैं, कम सेवा विलंबता, उच्च स्वीकृति दर और कम बैंडविड्थ उपयोग प्राप्त करते हैं
इनपुट: नेटवर्क स्लाइस अनुरोध (NSLR) प्रवाह, स्लाइस प्रकार, संसाधन आवश्यकताएं, रनटाइम सहित
आउटपुट: प्रवेश निर्णय और संसाधन आवंटन रणनीति
उद्देश्य: NSP लाभ को अधिकतम करना और सेवा विलंबता को कम करना, विशेष रूप से URLLC स्लाइस की विलंबता
विलंबता दंड तंत्र: पुरस्कार फ़ंक्शन में विलंबता दंड अवधि को शामिल करके, एजेंट को विलंबता-संवेदनशील स्लाइस को प्राथमिकता देने के लिए प्रोत्साहित करता है
सुचारु अन्वेषण रणनीति: बोल्ट्जमैन अन्वेषण Q-मान के संभाव्यता वितरण के आधार पर कार्य चुनता है, शुद्ध यादृच्छिक या लालची व्यवहार से बचता है
बहु-उद्देश्य अनुकूलन: लाभ अधिकतमकरण और विलंबता न्यूनीकरण दोनों पर विचार करता है, बेहतर QoS-लाभ व्यापार-बंद प्राप्त करता है
पेपर DSARA के साथ तुलना के माध्यम से विलंबता-जागरूक पुरस्कार फ़ंक्शन और बोल्ट्जमैन अन्वेषण की प्रभावशीलता को सत्यापित करता है, लेकिन घटक-स्तरीय विलोपन विश्लेषण विस्तृत नहीं प्रदान करता है।
मौजूदा कार्य की तुलना में, यह पेपर पहली बार DRL ढांचे में विलंबता और लाभ दोनों को स्पष्ट रूप से विचार करता है और अधिक स्थिर अन्वेषण रणनीति को अपनाता है।
पेपर 12 संबंधित संदर्भों का हवाला देता है, जिसमें 5G नेटवर्क स्लाइसिंग, गहन सुदृढ़ीकरण सीखने, संसाधन आवंटन आदि मुख्य क्षेत्रों के महत्वपूर्ण कार्य शामिल हैं, जो अनुसंधान के लिए पर्याप्त सैद्धांतिक आधार और तुलना बेंचमार्क प्रदान करते हैं।
समग्र मूल्यांकन: यह पेपर 5G नेटवर्क स्लाइस प्रवेश नियंत्रण में विलंबता-लाभ व्यापार-बंद समस्या के लिए एक नवीन और व्यावहारिक समाधान प्रस्तुत करता है। विधि डिजाइन उचित है, प्रायोगिक सत्यापन पर्याप्त है, इस क्षेत्र में अच्छी शैक्षणिक मूल्य और अनुप्रयोग संभावनाएं हैं। मुख्य कमियां सैद्धांतिक विश्लेषण और वास्तविक तैनाती विचार के पहलुओं में सुधार की गुंजाइश है।