2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.
Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.
academic

تحليل السرعة والكثافة للمراقبة والتحسين في تقليل AoI في IoV SPS

المعلومات الأساسية

الملخص

تقدم هذه الورقة طريقة تحسين قائمة على نماذج اللغة الكبيرة (LLM) والتدرج السياسي الحتمي العميق (DDPG) لمعالجة مشكلة تدهور عمر المعلومات (AoI) في الجدولة شبه الدائمة (SPS) لشبكات المركبات (IoV)، والناجمة عن تصادمات الحزم وعدم اليقين في القنوات المرتبطة بسرعة المركبات. يتم أولاً إنشاء نموذج حساب AoI يتأثر بسرعة المركبة وكثافة المركبات وفاصل الحجز الموارد (RRI)، ثم يتم تصميم خطة تحسين ثنائية المسار. يتم توجيه DDPG من خلال فضاء الحالة ودالة المكافأة، بينما يستخدم LLM التعلم السياقي لإنشاء تكوينات معاملات مثلى. تُظهر النتائج التجريبية أن LLM يمكنه تقليل AoI بشكل كبير بعد تجميع عدد قليل من العينات دون الحاجة إلى تدريب النموذج، بينما يمكن لطريقة DDPG تحقيق أداء أكثر استقراراً بعد التدريب.

خلفية البحث والدافع

تعريف المشكلة

تعتبر شبكات المركبات (IoV) التكنولوجيا الأساسية لأنظمة النقل الذكية، حيث يتطلب الاتصال بين المركبات (V2V) نقل رسائل السلامة الأساسية الحرجة (BSM). في معيار 5G NR V2X، يستخدم الاتصال V2V عادة الوضع 2 للاختيار الذاتي للموارد، مع استخدام الجدولة شبه الدائمة (SPS) للمنافسة على الموارد واحتلالها.

المشاكل الأساسية

  1. قيود SPS التقليدية: تعتمد SPS الحالية على معاملات ثابتة تجريبية (مثل RRI)، والتي قد تؤدي إلى أداء دون الأمثل في كثافات مركبات مختلفة
  2. تدهور أداء AoI: تصادمات الحزم والفشل المستمر في الإرسال يقللان بشكل كبير من أداء AoI
  3. الاقتران متعدد العوامل: توجد علاقة اقتران غير خطية معقدة بين سرعة المركبة والكثافة و RRI

دافع البحث

  • تنتج المركبات عالية السرعة (خاصة في الاتجاهات المعاكسة) تحولاً دوبلري كبيراً، مما قد يؤدي إلى فشل إرسال إضافي
  • في الحالات التي لا يتم فيها تكوين قناة ردود فعل الارتباط الفيزيائي (PSFCH)، تستخدم الرسائل البث مثل BSM عادة إعادة الإرسال العمياء
  • هناك حاجة للنظر في سرعة المركبة والكثافة معاً لتحسين اختيار RRI وتحسين أداء الاتصال

المساهمات الأساسية

  1. إنشاء نموذج AoI شامل: يقترح نموذج حساب AoI يأخذ في الاعتبار تأثير سرعة المركبة وكثافة المركبات و RRI في نفس الوقت، مع دمج عدم اليقين في ظروف القنوات الفيزيائية واحتمالية تصادم حزم الموارد
  2. إطار تحسين ثنائي المسار: يصمم استراتيجية تحسين مزدوجة قائمة على LLM و DDPG، حيث يستخدم LLM التعلم السياقي للتقارب السريع، و DDPG يوفر استكشافاً مستقراً للفضاء المستمر
  3. نمذجة قنوات تدرك السرعة: يدرج تأثير دوبلر الناجم عن سرعة المركبة في نموذج القناة ماركوفيان، مما يصف بدقة احتمالية فشل الإرسال في السيناريوهات عالية السرعة
  4. التحقق التجريبي: يتحقق من خلال محاكاة تجريبية من أن التحسين المشترك لكثافة المركبات و RRI وسرعة المركبة يقلل بشكل كبير من AoI في نظام IoV

شرح الطريقة

تعريف المهمة

الإدخال: سرعة المركبة v، كثافة المركبات ρ، فاصل الحجز الموارد RRI
الإخراج: تكوين معاملات مثلى يقلل من AoI النظام
القيود: علاقة السرعة والكثافة تحت تدفق حركة ثابت Q: ρ = Q/v

نموذج النظام

1. طوبولوجيا الشبكة

يأخذ في الاعتبار قطاع طريق سريع محدود بطول 2L، يتضمن مسارين متعاكسين. العدد الإجمالي للمركبات هو:

mtotal = 2ρlL

2. نموذج احتمالية التصادم

احتمالية تصادم حزمة المركبة n هي:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

حيث Nr هو الحد الأقصى لعدد RBGs القابلة للاختيار في نافذة الاختيار، و Ns هو عدد المركبات في نطاق الاستشعار.

3. نمذجة حالة القناة

يتم نمذجة حالة القناة بناءً على عملية ماركوفيان، مع الأخذ في الاعتبار تأثير تحول دوبلر fd = fcv/c:

  • احتمالات الانتقال pp (الحفاظ على حالة سيئة) و pi (الحفاظ على حالة مثالية)
  • الحساب التكراري لاحتمالية فقدان الحزمة الإجمالية pd

4. نموذج حساب AoI

يتم التعبير عن AoI النظام كمجموع تأخير الانتظار وتأخير الإرسال:

A = Tq + Tt

يأخذ تأخير الانتظار Tq في الاعتبار التأثير المشترك لإعادة الإرسال بسبب التصادم وفشل القناة:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

استراتيجيات التحسين

1. طريقة DDPG

يتم نمذجة المشكلة كعملية قرار ماركوفيان (MDP):

  • فضاء الحالة: st = vt, ρt, RRIt, pd,t, Pcoll,t
  • فضاء الحركة: at = RRIt+1, vt+1
  • دالة المكافأة: تصميم دالة مكافأة متعددة المراحل، توفير مكافآت بمنحدرات مختلفة لفترات AoI مختلفة

استخدام معمارية Actor-Critic:

  • شبكة الممثل: μ(st|θμ) تخرج حركة حتمية
  • شبكة الناقد: Q(st,at|θQ) تقيم قيمة الحالة والحركة
  • الشبكات المستهدفة وإعادة التشغيل من الذاكرة تحسن استقرار التدريب

2. طريقة LLM

تصميم هيكل موجه من خمسة أجزاء:

  1. خلفية المهمة: شرح مكونات AoI والعوامل المؤثرة
  2. هدف المهمة: توضيح الهدف من تقليل AoI النظام
  3. المهمة الرئيسية: تحديد دور LLM كخوارزمية تحسين
  4. صيغة الإخراج: توحيد عرض النتائج
  5. مجموعة الأمثلة: توفير اختيارات معاملات تمثيلية وقيم AoI المقابلة

إطار خوارزمية LLM:

  • التفكير متعدد الخطوات لإنشاء نتائج إخراج متعددة
  • محاكي البيئة يحسب AoI للحصول على الحل الأمثل الحالي
  • استبعاد التجارب المكررة، إضافة التجارب الفعالة إلى مجموعة القرارات التاريخية
  • الحكم على التقارب عندما لا يكون هناك تحسن كبير في التفكير المتكرر

إعداد التجربة

معاملات المحاكاة

  • السيناريو: طريق سريع ثنائي الاتجاه
  • تدفق حركة المرور: 6000 مركبة/ساعة (ثابت)
  • نطاق RRI: 10-100 ميلي ثانية
  • نطاق كثافة المركبات: 50-200 مركبة/كيلومتر
  • نطاق السرعة: 30-120 كم/ساعة
  • طول الطريق السريع: 2L (L هو نصف الطول)

مؤشرات التقييم

  • المؤشر الرئيسي: متوسط AoI النظام
  • التقارب: اتجاه تغيير AoI خلال 50 جولة تدريب

طرق المقارنة

  1. طريقة LLM: ثلاثة نماذج لغة كبيرة مختلفة
  2. خوارزمية DDPG: التدرج السياسي الحتمي العميق
  3. الخوارزمية الجينية: طريقة تحسين تقليدية
  4. الحل الأمثل: القيمة المثلى النظرية التي تم الحصول عليها من خلال البحث الشامل

نتائج التجربة

النتائج الرئيسية

1. تأثير سرعة المركبة على AoI (الشكل 3a)

  • السرعة المنخفضة (الكثافة العالية): يرجع الزيادة في AoI بشكل أساسي إلى احتمالية تصادم حزم البيانات العالية عند اختيار موارد SPS
  • السرعة العالية (الكثافة المنخفضة): على الرغم من قلة التصادمات، فإن تدهور القناة الدوبلري الشديد يزيد من معدل الفشل على المستوى الفيزيائي
  • تأثير RRI:
    • عند RRI كبير، يمكن تجاهل احتمالية التصادم، ويزداد AoI تدريجياً مع السرعة
    • عند RRI صغير، يهيمن التصادم، ويصل AoI إلى ذروته عند السرعة المنخفضة ثم ينخفض مع زيادة السرعة

2. تأثير RRI على AoI (الشكل 3b)

  • السرعة المنخفضة (الكثافة العالية): عند قيم RRI المنخفضة، تؤدي احتمالية التصادم العالية إلى AoI أكبر، والعلاقة تصبح خطية تقريباً مع زيادة RRI
  • السرعة العالية (الكثافة المنخفضة): تزداد احتمالية فقدان الحزمة في القناة، ويزداد معدل نمو AoI مع RRI بشكل أسرع

3. مقارنة الأداء بين الطرق المختلفة (الشكل 3c)

  • طريقة LLM:
    • في المرحلة الأولية، يكون هناك تذبذب كبير في AoI بسبب استكشاف مجموعات معاملات مختلفة
    • نظراً لأن الموجه يتضمن أمثلة تمثيلية، فإنه يتمتع بحل ابتدائي جيد
    • يتقارب بسرعة مع عدد قليل من التكرارات فقط
  • خوارزمية DDPG:
    • تتطلب المزيد من خطوات الاستكشاف وتعديل معاملات الشبكة
    • تتمتع بأداء أكثر استقراراً بعد التدريب
  • الخوارزمية الجينية: سرعة التقارب بين طريقة LLM و DDPG

الاكتشافات الرئيسية

  1. اقتران ثلاثي السرعة والكثافة و RRI: يحقق التحسين المشترك تحسناً كبيراً مقارنة بالتحسين أحادي العامل
  2. التقارب السريع لـ LLM: يمكن للتعلم السياقي القائم على الأمثلة أن يتقارب بسرعة دون الحاجة إلى التدريب عبر الإنترنت
  3. استقرار DDPG: على الرغم من أن التقارب أبطأ، فإنه يُظهر أداء أكثر استقراراً في استكشاف الفضاء المستمر
  4. أهمية تأثير دوبلر: لا يمكن تجاهل تأثير ظروف القناة على AoI في السيناريوهات عالية السرعة

الأعمال ذات الصلة

أبحاث تحسين SPS

  • الطرق التقليدية: تركز بشكل أساسي على تأثير كثافة المركبات على اختيار RRI
  • المخططات التكيفية: تعديل ديناميكي لعداد إعادة الاختيار (RC) و RRI بناءً على توفر القناة
  • تحليل AoI: دراسة تأثير الاحتلال المستمر للموارد في SPS على AoI النظام

نقاط الابتكار في هذه الورقة

  1. النمذجة متعددة العوامل: أول مرة يتم فيها النظر في التأثير المقترن لسرعة المركبة والكثافة و RRI
  2. تحسين الذكاء الاصطناعي: إدخال استراتيجية تحسين ثنائية المسار من LLM و DDPG
  3. نمذجة القناة: دمج تأثير دوبلر في نموذج القناة ماركوفيان

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. صحة النموذج: يمكن للنموذج المُنشأ لـ AoI أن يعكس بدقة التأثير المشترك لسرعة المركبة والكثافة و RRI
  2. تأثير التحسين: يمكن للتحسين المشترك أن يقلل بشكل كبير من AoI في نظام IoV
  3. مقارنة الطرق: تتقارب طريقة LLM بسرعة لكنها تتطلب أمثلة جيدة، بينما تتمتع طريقة DDPG باستقرار لكنها تتطلب تدريباً

القيود

  1. قيود السيناريو: يأخذ في الاعتبار فقط سيناريو الطريق السريع ثنائي الاتجاه
  2. الافتراضات: افتراض التوزيع المنتظم للمركبات وتدفق حركة ثابت
  3. نموذج القناة: قد لا يعكس نموذج القناة ماركوفيان المبسط بشكل كامل بيئة القناة المعقدة الفعلية
  4. اعتماد LLM: تعتمد طريقة LLM على أمثلة عالية الجودة وتصميم موجه

الاتجاهات المستقبلية

  1. الضبط الدقيق الخفيف الوزن: تصميم مخطط ضبط دقيق خفيف الوزن لـ LLM لتقليل الاعتماد على الأمثلة
  2. النشر في الوقت الفعلي: دمج محرك التحسين في وحدة جانب الطريق C-V2X لتحقيق تكوين RRI ديناميكي
  3. سيناريو متعدد المحطات: النظر في سيناريو متعدد المحطات لحل ذروة AoI الناجمة عن تبديل الإشارة
  4. سيناريوهات أكثر تعقيداً: التوسع إلى طرق حضرية وتقاطعات وسيناريوهات حركة مرور أكثر تعقيداً

التقييم المتعمق

المميزات

  1. أهمية المشكلة: يعالج مشكلة تحسين AoI المهمة في IoV، مع قيمة تطبيقية عملية
  2. نمذجة شاملة: يأخذ في الاعتبار بشكل شامل التأثير المقترن لعوامل متعددة مثل التصادم وفشل القناة وإعادة الإرسال العمياء
  3. ابتكار الطريقة: أول مرة يتم إدخال LLM في تحسين معاملات IoV، مما يوفر منظوراً حلاً جديداً
  4. تجارب كافية: التحقق من فعالية الطريقة من خلال محاكاة متعددة الزوايا

أوجه القصور

  1. قيود السيناريو: يأخذ في الاعتبار فقط سيناريو الطريق السريع، وتطبيقه على بيئات الطرق الحضرية المعقدة يحتاج إلى التحقق
  2. افتراضات النموذج: افتراضات مثل التوزيع المنتظم للمركبات مثالية جداً
  3. قابلية تفسير LLM: تفتقر عملية اتخاذ القرار في LLM إلى القابلية للتفسير، مما يصعب فهم آلية التحسين
  4. اعتبارات الوقت الفعلي: لم يتم مناقشة متطلبات التعقيد الحسابي والوقت الفعلي في النشر الفعلي بشكل كافٍ

التأثير

  1. المساهمة الأكاديمية: توفير نموذج نظري جديد وطريقة تحسين لتحسين AoI في IoV
  2. القيمة العملية: يمكن أن توفر مرجعاً لوضع معايير 5G/6G للمركبات وتصميم النظام
  3. الإلهام الطريقة: تطبيق LLM في تحسين الشبكة يمكن أن يلهم المزيد من الأبحاث ذات الصلة

السيناريوهات المعمول بها

  • تحسين معاملات نظام المركبات على الطريق السريع
  • تكوين معاملات SPS في 5G NR V2X الوضع 2
  • مشاكل تحسين الشبكة التي تتطلب النظر في الاقتران متعدد العوامل
  • أنظمة الاتصالات في الوقت الفعلي الحساسة لـ AoI

المراجع

تستشهد هذه الورقة بـ 20 مرجعاً ذا صلة، تغطي بشكل أساسي:

  • أبحاث أساسية في IoV واتصالات V2X
  • آلية SPS وتحسين المعاملات
  • نظرية وتطبيقات AoI
  • طرق التعلم المعزز العميق
  • تطبيقات نماذج اللغة الكبيرة

التقييم الشامل: تقدم هذه الورقة حلاً مبتكراً لمشكلة مهمة في شبكات المركبات، مع مساهمات معينة في النمذجة النظرية وتصميم الطريقة. يتمتع تطبيق LLM في تحسين الشبكة بدرجة معينة من الجدة، لكن لا يزال يتطلب التحقق الإضافي من فعاليته وجدواه العملية في سيناريوهات أكثر تعقيداً.