2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic

الإفصاح اللامركزي التكيفي عن الطوابير للمستأجرين غير الصبورين في أنظمة الحافة والأنظمة غير الأرضية

المعلومات الأساسية

  • معرّف الورقة: 2508.04241
  • العنوان: الإفصاح اللامركزي التكيفي عن الطوابير للمستأجرين غير الصبورين في أنظمة الحافة والأنظمة غير الأرضية
  • المؤلفون: Anthony Kiggundu, Bin Han, Hans D. Schotten
  • التصنيف: eess.SY (الأنظمة والتحكم)، cs.SY (الأنظمة والتحكم)
  • تاريخ النشر: 13 أكتوبر 2025 (arXiv v2)
  • المؤسسات: مركز الأبحاث الألماني للذكاء الاصطناعي (DFKI)، جامعة RPTU بكايزرسلاوترن-لاندو
  • رابط الورقة: https://arxiv.org/abs/2508.04241

الملخص

تدرس هذه الورقة كيفية تأثير الإفصاح عن معلومات حالة الطابور على المستأجرين غير الصبورين في الأنظمة الحافية متعددة المستأجرين. يقترح المؤلفون استراتيجية إعلان معلومات حيث يبث كل طابور بشكل دوري نموذجي ماركوف: أحدهما نموذج سلوك معدل الخدمة في الحالة المستقرة، والآخر نموذج توقيت تغيير طول الطابور. يتخذ المستأجرون قرارات مستقلة بناءً على هذه المعلومات بشأن ما إذا كانوا سيتخلون أو ينتقلون إلى طابور آخر. يراقب الطابور استجابات المستأجرين ويتكيف مع معدل الخدمة من خلال استراتيجية تنبؤ قائمة على القواعد مصممة للبيئات اللامركزية والمراقبة الجزئية والمتغيرة بمرور الوقت. تحدد التجارب الرقمية المقايضات بين متوسط التأخير ودرجة عدم الصبر والمتانة تجاه المعلومات القديمة.

السياق البحثي والدافع

تعريف المشكلة

في عمليات النشر غير المتجانسة 5G/6G، لا يقتصر تقاسم الموارد متعدد المستأجرين على التكوين الثابت فحسب، بل يتم تشغيله بشكل متزايد من خلال القرارات المستقلة للمستأجرين (على سبيل المثال، ما إذا كان يجب تفريغ المهام إلى طابور بعيد أو معالجتها محليًا). يمكن للإفصاح عن حالة الطابور (مثل طول الطابور أو تقديرات وقت الانتظار أو إحصائيات الخدمة) أن يغير سلوك المستأجرين بشكل كبير ويثير المنافسة على الموارد من خلال تبديل الطوابير والتخلي عنها.

أهمية البحث

تتميز بيئات الحوسبة الحافية متعددة الوصول (MEC) والشبكات غير الأرضية (NTN) الحديثة باللامركزية، مع وجود بث حالة جزئي وقديم، وتظهر قنوات متغيرة بمرور الوقت والحركة. في مثل هذه البيئات، من غير الواقعي افتراض وحدة تحكم مركزية واحدة بها حالة عامة فورية. ومع ذلك، عادة ما يتم تطوير قواعد الإفصاح والطرق الاستكشافية الموجودة للإعدادات الثابتة أو ذات الحركة الخفيفة، وتفشل في الإجابة على ثلاثة أسئلة أساسية للتحكم اللامركزي:

  1. ما معلومات الحالة التي يجب مشاركتها
  2. كيف يجب تمثيل المعلومات
  3. ما مدى تكرار توزيع التحديثات

قيود الطرق الموجودة

تفترض طرق التحسين المركزية التقليدية (مثل استراتيجيات نقطة التوازن) معلومات حالة كاملة وفورية وشروط الاستقرار، لكن هذه الافتراضات غالبًا ما تفشل في ظل الظروف النموذجية لنشر السحابة الحافية والنشر غير الأرضي. ينخفض الأداء بشكل كبير عندما تصبح المعلومات جزئية أو قديمة.

المساهمات الأساسية

  1. مفهوم الإعلان عن المعلومات: تقديم مفهوم الإعلان عن المعلومات للطوابير متعددة المستأجرين، وتشكيل وصفين ماركوف (توزيع معدل الخدمة ووقت التغيير) كملخصات حالة قابلة للجدولة مناسبة لقنوات التحكم المحدودة الموارد.
  2. التحليل النظري: اشتقاق تعبيرات الشكل المغلق لاحتمالات تبديل الطوابير والتخلي عنها في ظل هذه الواصفات، وصياغة مشكلة تقليل عدم الصبر المشترك الذي يوازن بين التأخير والتبديل والتخلي. إثبات أن مشكلة التحسين هذه يصعب معالجتها تحليليًا.
  3. استراتيجية عملية: اقتراح استراتيجية تنبؤ قائمة على القواعد تتعلم من استجابات المستأجرين وتتكيف مع معدل الخدمة عبر الإنترنت.
  4. التقييم الشامل: تحديد قيمة نماذج الإعلان المختلفة وفترات التوزيع من خلال تقييم رقمي واسع النطاق، وإظهار متانة استراتيجية التعلم تحت أحمال العمل غير المتجانسة.

شرح التفاصيل الطريقة

تعريف المهمة

النظر في نظام طابور M/M/2 يحتوي على طابورين i و j. تتبع الوصول الجديد توزيع بواسون، مع معدل وصول إجمالي λ = λᵢ + λⱼ. يوزع كل طابور معلومات حالته على المستأجرين على فترات r ثانية، مما يدخل درجة معينة من التقادم. الهدف هو تقليل مقياس الأداء المركب لمتوسط التأخير وأحداث التبديل والتخلي (عدم صبر المستأجرين).

معمارية النموذج

1. نموذج معدل الخدمة ماركوف

يتبع توزيع معدل الخدمة للطابور i أو j في حالة التوازن سلسلة ماركوف في الوقت المستمر (CTMC) بـ K حالة، مع معدلات خدمة {μᵢ}ᵢ₌₁ᴷ و {μⱼ}ⱼ₌₁ᴷ. يُعرّف معدل الخدمة الفعال على أنه:

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

حيث πₓᵢ و πᵧⱼ هي الاحتمالات في الحالة المستقرة.

2. نموذج ديناميكا طول الطابور - توزيع وقت التغيير (ICD)

يحدد هذا النموذج تكرار حدوث التحولات في نظام الطابور. بالنسبة للطابور في الحالة n، عندما تكون n=0 فقط أحداث الوصول تغير الحالة، وعندما تكون n≥1 قد تغير أحداث الوصول أو المغادرة الحالة. يُعرّف النموذج ماركوف على أنه:

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

وقت الفاصل الزمني المتوقع للتغيير هو:

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

3. الهيمنة العشوائية من الدرجة الأولى (FSD)

يتم تحديد الطابور الأفضل من خلال مقارنة دوال التوزيع التراكمي FX(μₖ) و FY(μₖ). إذا كانت PX > x ≥ PY > x ∀x ∈ ℝ، فإن X يهيمن على Y بشكل عشوائي من الدرجة الأولى.

نمذجة السلوك

سلوك التخلي

يُعرّف احتمال التخلي بناءً على FSD على أنه:

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

حيث Δ = Tₗₒcₐₗ - ηr، و η ∈ 0,1 يمثل درجة تقادم المعلومات.

سلوك التبديل

يتم نمذجة احتمال التبديل بناءً على ICD باستخدام دالة السيجمويد:

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

مشكلة التحسين

تُشكّل مشكلة التحسين المشترك على أنها:

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

تحت القيود: μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

نقاط الابتكار التقني

  1. تجريد المعلومات: تجريد حالة الطابور المعقدة إلى نموذجي ماركوف مدمجين، مناسبين لقنوات التحكم المحدودة بعرض النطاق الترددي.
  2. التعلم التكيفي: استراتيجية التنبؤ القائمة على القواعد قادرة على التعلم من استجابات المستأجرين والتكيف مع معدل الخدمة عبر الإنترنت.
  3. تصميم المتانة: يأخذ في الاعتبار تقادم المعلومات والمراقبة الجزئية، وهو أكثر ملاءمة لبيئات الحوسبة الحافية الفعلية.

إعداد التجربة

معاملات التجربة

  • فترات التوزيع: r ∈ {3, 5, 7, 9} ثانية
  • نطاق معدل الوصول: 3 ≤ λ ≤ 17
  • 300 محاكاة لكل تكوين
  • إعداد نظام M/M/2

مؤشرات التقييم

  • متوسط التأخير
  • معدل التخلي
  • معدل التبديل
  • قيمة دالة الهدف المركبة (الجمع بين التأخير ومقاييس عدم الصبر)

الطرق المقارنة

  • خط الأساس بدون استراتيجية
  • استراتيجية نقطة التوازن MDP المركزية الكلاسيكية
  • استراتيجية التنبؤ القائمة على القواعد المقترحة

نتائج التجربة

النتائج الرئيسية

  1. مقارنة نماذج المعلومات: ينتج نموذج معدل الخدمة ماركوف سلوكًا أقل عدم صبر مقارنة بنموذج وقت تغيير طول الطابور، لأنه يوفر تعيينًا مباشرًا لسرعة المعالجة.
  2. تحسين تكرار التوزيع: يتم تحقيق الأمثلية بين فترات 5-7 ثوان، حيث يتم تقليل درجة عدم الصبر واستقرار النظام، خاصة عندما تحصل الطلبات على معلومات معدل الخدمة.
  3. مقارنة الاستراتيجيات:
    • استراتيجية نقطة التوازن: أكثر استقرارًا لكن معدلات تخلي وتبديل أعلى
    • الاستراتيجية القائمة على القواعد: أكثر تقلبًا لكن قد تسجل معدلات أقل في الفترات الأقصر
  4. تأثير التحسين: استراتيجية التحسين قوية إحصائيًا، مما ينتج عنه قيم هدف أقل وأكثر اتساقًا (المتوسط = 0.53 مقابل 1.78 بدون تحسين).

النتائج الرئيسية

وفقًا للملخص الكمي في الجدول الأول:

  • تباين أقل في نتائج التحسين (الانحراف المعياري = 0.15 مقابل 0.97)
  • متوسط التحسن 1.26
  • يمكن العثور على حلول أفضل في جميع فترات التوزيع

تحليل وقت الانتظار

عند دمج الاستراتيجية، ينخفض وقت الانتظار للطلبات المتخلى عنها والمبدلة بشكل كبير، خاصة عند ملاحظة المزيد من الأمثلية عند توزيع نموذج معدل الخدمة ماركوف.

الأعمال ذات الصلة

تشمل الاتجاهات البحثية الرئيسية في هذا المجال:

  1. استراتيجيات الإفصاح عن المعلومات في أنظمة الطوابير
  2. التحكم اللامركزي للأنظمة متعددة الخوادم
  3. تخصيص الموارد في الحوسبة الحافية
  4. نمذجة السلوك للعملاء غير الصبورين

تتمثل مزايا هذه الورقة مقارنة بالأعمال ذات الصلة في:

  • النظر في تأثير تقادم المعلومات
  • توفير حلول مناسبة للبيئات اللامركزية
  • دمج آليات التعلم والتكيف

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. تلعب معلومات حالة النظام دورًا حاسمًا في تشكيل قرارات المستأجرين غير الصبورين
  2. استراتيجية التنبؤ القائمة على القواعد تتمتع بمتانة أقوى تجاه تقادم المعلومات
  3. تكرار الإفصاح عن المعلومات المناسب أمر حاسم لأداء النظام
  4. نموذج معدل الخدمة ماركوف أكثر فعالية من نموذج ديناميكا الطابور

القيود

  1. مقتصر على إعداد M/M/2 بواسون
  2. يتطلب تحديد تكاليف الحساب والاتصالات لآلية الإعلان
  3. لم يأخذ في الاعتبار عمليات الوصول المتفجرة والذيل الثقيل وأوقات الخدمة غير الأسية

الاتجاهات المستقبلية

  1. تضمين نماذج معلومات تتضمن تكاليف الاشتراك الأكثر تجريدًا
  2. استبدال الاستدلالات القائمة على القواعد بتقنيات التعلم المعزز
  3. التوسع إلى خوادم متعددة الطوابير غير متجانسة
  4. التحقق من الطريقة على منصة اختبار MEC النموذجية

التقييم العميق

المزايا

  1. الابتكار: تقديم مفهوم جديد للإعلان عن المعلومات، يوفر أفكارًا جديدة للتحكم اللامركزي في الطوابير
  2. الجدوى العملية: يأخذ في الاعتبار تقادم المعلومات والمراقبة الجزئية في بيئات الحوسبة الحافية الفعلية
  3. الصرامة النظرية: توفير إطار عمل نمذجة وتحليل رياضي شامل
  4. التجارب الكافية: التحقق من فعالية الطريقة من خلال تجارب رقمية واسعة النطاق

أوجه القصور

  1. قيود النموذج: يأخذ في الاعتبار فقط نظام M/M/2، والأنظمة في التطبيقات الفعلية أكثر تعقيدًا
  2. حساسية المعاملات: اختيار بعض المعاملات (مثل δλ, η) يفتقر إلى إرشادات نظرية كافية
  3. تحليل التعقيد الحسابي: تحليل التعقيد الحسابي لحل شروط KKT غير مفصل بما فيه الكفاية
  4. التحقق العملي: يفتقر إلى تجارب التحقق على الأنظمة الفعلية

التأثير

  1. المساهمة الأكاديمية: توفير اتجاه بحثي جديد لمجالات نظرية الطوابير والحوسبة الحافية
  2. القيمة العملية: توفير إرشادات لتخصيص الموارد في شبكات 6G
  3. قابلية التوسع: معمارية الطريقة لها قابلية توسع جيدة

السيناريوهات المناسبة

هذه الطريقة مناسبة بشكل خاص لـ:

  1. أنظمة الحوسبة الحافية متعددة المستأجرين
  2. بيئات الشبكات غير الأرضية
  3. الأنظمة اللامركزية ذات نقل المعلومات المحدود
  4. أنظمة الخدمات التي تحتاج إلى النظر في سلوك عدم صبر المستخدمين

المراجع

تستشهد الورقة بأدبيات مهمة في مجالات نظرية الطوابير والنمذجة السلوكية والحوسبة الحافية، بما في ذلك:

  • أبحاث Y. Ouyang و D. Teneketzis حول إشارات التوجيه اللامركزية
  • عمل B. Lin وآخرين حول الاستراتيجيات المثلى لأنظمة الطوابير ثنائية الخادم
  • المواصفات التقنية 3GPP حول إدارة وتنسيق شرائح الشبكة

التقييم الإجمالي: هذه ورقة بحثية عالية الجودة في مجال التقاطع بين نظرية الطوابير والحوسبة الحافية، وتقترح استراتيجية إفصاح معلومات مبتكرة للتعامل مع مشكلة عدم صبر المستأجرين في البيئات اللامركزية. على الرغم من وجود بعض القيود، فإن مساهماتها النظرية وقيمتها العملية تجعلها تقدمًا مهمًا في هذا المجال.