Prioritizing Latency with Profit: A DRL-Based Admission Control for 5G Network Slices
Chakraborty, Asrar, Sengupta et al.
5G networks enable diverse services such as eMBB, URLLC, and mMTC through network slicing, necessitating intelligent admission control and resource allocation to meet stringent QoS requirements while maximizing Network Service Provider (NSP) profits. However, existing Deep Reinforcement Learning (DRL) frameworks focus primarily on profit optimization without explicitly accounting for service delay, potentially leading to QoS violations for latency-sensitive slices. Moreover, commonly used epsilon-greedy exploration of DRL often results in unstable convergence and suboptimal policy learning. To address these gaps, we propose DePSAC -- a Delay and Profit-aware Slice Admission Control scheme. Our DRL-based approach incorporates a delay-aware reward function, where penalties due to service delay incentivize the prioritization of latency-critical slices such as URLLC. Additionally, we employ Boltzmann exploration to achieve smoother and faster convergence. We implement and evaluate DePSAC on a simulated 5G core network substrate with realistic Network Slice Request (NSLR) arrival patterns. Experimental results demonstrate that our method outperforms the DSARA baseline in terms of overall profit, reduced URLLC slice delays, improved acceptance rates, and improved resource consumption. These findings validate the effectiveness of the proposed DePSAC in achieving better QoS-profit trade-offs for practical 5G network slicing scenarios.
academic
أولويات الكمون مع الربح: التحكم في القبول القائم على التعلم العميق بالتعزيز لشرائح شبكات الجيل الخامس
تقترح هذه الورقة حلاً يُسمى DePSAC (التحكم في القبول في الشرائح مع الوعي بالكمون والربح) لمعالجة مشكلة التحكم في القبول في شرائح شبكات الجيل الخامس. يعتمد الحل على إطار عمل التعلم العميق بالتعزيز، ويوازن بين تعظيم ربح مزودي خدمات الشبكة وإعطاء الأولوية للكمون، خاصة لشرائح الاتصالات الموثوقة للغاية منخفضة الكمون (URLLC). يستخدم الحل دالة مكافأة واعية بالكمون واستراتيجية استكشاف بولتسمان، وقد تم التحقق من فعاليته على شبكة نواة الجيل الخامس المحاكاة، حيث أظهر تحسنًا مقارنة بطريقة DSARA الأساسية من حيث الربح والكمون ومعدل القبول واستهلاك الموارد.
تدعم شبكات الجيل الخامس خدمات متنوعة من خلال تقنية تقسيم الشبكة، بما في ذلك النطاق الترددي المحسّن للهاتف المحمول (eMBB)، والاتصالات الموثوقة للغاية منخفضة الكمون (URLLC)، والاتصالات الضخمة من نوع الآلة (mMTC). تتطلب هذه الخدمات متطلبات جودة خدمة (QoS) غير متجانسة، مما يستدعي استراتيجيات تحكم قبول وتخصيص موارد ذكية لموازنة متطلبات جودة الخدمة الصارمة مع ربحية مزودي خدمات الشبكة (NSP).
على الرغم من أن طريقة DSARA الأساسية يمكنها تعظيم الربح بشكل فعال، إلا أنها لا تأخذ في الاعتبار الاختلافات في الكمون بين أنواع الشرائح المختلفة، مما قد يؤدي إلى انتهاكات جودة الخدمة. تهدف هذه الورقة إلى تطوير حل للتحكم في قبول الشرائح يأخذ في الاعتبار الكمون والربح معًا.
دالة مكافأة واعية بالكمون: تقترح صيغة مكافأة واعية بالربح والكمون توازن بين متطلبات جودة الخدمة وربحية مزودي الخدمات
استراتيجية استكشاف بولتسمان: تدمج استكشاف بولتسمان في وكيل التعلم العميق بالتعزيز، مما يحسن استقرار التعلم ويتجنب مشكلة الحد الأدنى المحلي في طريقة epsilon-greedy
تقييم تجريبي شامل: تطبيق DePSAC على شبكة نواة الجيل الخامس المحاكاة، مع استخدام أنماط وصول طلبات شرائح الشبكة الواقعية
التحقق من تحسن الأداء: تؤكد نتائج التجارب على تحسن DePSAC في موازنة الربح وجودة الخدمة، مع تحقيق كمون خدمة أقصر ومعدل قبول أعلى واستهلاك نطاق ترددي أقل
الإدخال: تدفق طلبات شرائح الشبكة (NSLR)، يتضمن نوع الشريحة ومتطلبات الموارد ووقت التشغيل
الإخراج: قرارات القبول واستراتيجية تخصيص الموارد
الهدف: تعظيم ربح مزودي الخدمات مع تقليل كمون الخدمة، خاصة كمون شرائح URLLC
تتحقق الورقة من فعالية دالة المكافأة الواعية بالكمون واستكشاف بولتسمان من خلال المقارنة مع DSARA، لكنها لا توفر تحليل استئصال تفصيلي على مستوى المكونات.
بالمقارنة مع الأعمال الموجودة، تأخذ هذه الورقة في الاعتبار الكمون والربح معًا بشكل صريح في إطار عمل التعلم العميق بالتعزيز لأول مرة، وتستخدم استراتيجية استكشاف أكثر استقرارًا.
تستشهد الورقة بـ 12 مرجعًا ذا صلة، تغطي الأعمال المهمة في مجالات تقسيم شبكات الجيل الخامس والتعلم العميق بالتعزيز وتخصيص الموارد، مما يوفر أساسًا نظريًا كافيًا ومعايير مقارنة للبحث.
التقييم الإجمالي: تقترح هذه الورقة حلاً مبتكرًا وعمليًا لمشكلة موازنة الكمون والربح في التحكم في قبول شرائح شبكات الجيل الخامس. يتمتع تصميم الطريقة بمعقولية جيدة والتحقق التجريبي شامل، مما يوفر قيمة أكاديمية وآفاق تطبيق جيدة في هذا المجال. يتمثل القصور الرئيسي في أن هناك مجالًا للتحسن في جوانب التحليل النظري والاعتبارات العملية للنشر الفعلي.