Fluid antenna systems (FAS) enable dynamic antenna positioning, offering new opportunities to enhance integrated sensing and communication (ISAC) performance. However, existing studies primarily focus on communication enhancement or single-target sensing, leaving multi-target scenarios underexplored. Additionally, the joint optimization of beamforming and antenna positions poses a highly non-convex problem, with traditional methods becoming impractical as the number of fluid antennas increases. To address these challenges, this letter proposes a block coordinate descent (BCD) framework integrated with a deep reinforcement learning (DRL)-based approach for intelligent antenna positioning. By leveraging the deep deterministic policy gradient (DDPG) algorithm, the proposed framework efficiently balances sensing and communication performance. Simulation results demonstrate the scalability and effectiveness of the proposed approach.
- معرّف الورقة: 2501.01281
- العنوان: Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems
- المؤلفون: Shunxing Yang, Junteng Yao, Jie Tang, Tuo Wu, Maged Elkashlan, Chau Yuen, Mérouane Debbah, Hyundong Shin, Matthew Valenti
- التصنيف: eess.SP (الهندسة الكهربائية وعلوم الأنظمة - معالجة الإشارات)
- تاريخ النشر: 2 يناير 2025 (نسخة arXiv المسبقة)
- رابط الورقة: https://arxiv.org/abs/2501.01281
تتيح أنظمة الهوائيات السائلة (FAS) تحديد موضع ديناميكي للهوائيات، مما يوفر فرصاً جديدة لتحسين أداء الأنظمة المتكاملة للاستشعار والاتصالات (ISAC). ومع ذلك، تركز الأبحاث الحالية بشكل أساسي على تحسين الاتصالات أو الاستشعار بهدف واحد، بينما لم يتم استكشاف سيناريوهات الأهداف المتعددة بشكل كافٍ. علاوة على ذلك، يشكل التحسين المشترك لتشكيل الحزم وموضع الهوائي مشكلة غير محدبة للغاية، وتصبح الطرق التقليدية غير عملية مع زيادة عدد الهوائيات السائلة. لمعالجة هذه التحديات، تقترح هذه الورقة إطار عمل للنزول بالإحداثيات الكتلية (BCD) متكامل مع التعلم العميق بالتعزيز (DRL) لتحديد موضع الهوائيات الذكي. من خلال الاستفادة من خوارزمية تدرج السياسة الحتمية العميقة (DDPG)، يوازن الإطار المقترح بفعالية بين أداء الاستشعار والاتصالات. تثبت نتائج المحاكاة قابلية التوسع والفعالية للطريقة المقترحة.
تتمثل المشكلة الأساسية التي يعالجها هذا البحث في كيفية تحقيق التحسين المشترك لتشكيل الحزم وموضع الهوائي في أنظمة ISAC متعددة الأهداف من خلال أنظمة الهوائيات السائلة، بما يلبي متطلبات أداء الاتصالات والاستشعار متعدد الأهداف في نفس الوقت.
- متطلبات شبكات الجيل السادس: يعتبر ISAC ابتكاراً رئيسياً في شبكات الجيل السادس اللاسلكية، ويتطلب تحقيق وظائف الاتصالات والاستشعار على موارد الطيف المشتركة
- استخدام الموارد المكانية: تواجه أنظمة الهوائيات ذات الموضع الثابت (FPA) التقليدية قيوداً أساسية في استخدام الموارد المكانية
- السيناريوهات متعددة الأهداف: غالباً ما تتطلب التطبيقات العملية استشعار أهداف متعددة في نفس الوقت، مما يزيد من تعقيد تصميم النظام
- نطاق البحث المحدود: تركز أبحاث FAS الحالية بشكل أساسي على تحسين الاتصالات أو الاستشعار بهدف واحد، مع نقص في دراسة السيناريوهات متعددة الأهداف
- تعقيد التحسين: التحسين المشترك لتشكيل الحزم وموضع الهوائي يشكل مشكلة غير محدبة للغاية، وتصبح طرق التحسين البديل التقليدية غير قابلة للتطبيق مع زيادة عدد الهوائيات
- معالجة التقسيم: تأخذ بعض الأبحاث في الاعتبار فقط تفعيل أي منافذ، وليس التحسين المستمر لموضع الهوائي
بناءً على القيود المذكورة أعلاه، تهدف هذه الورقة إلى تطوير مخطط تحديد موضع هوائي ذكي يمكنه التعامل مع سيناريوهات الاستشعار متعددة الأهداف، من خلال تحقيق اتخاذ القرارات في الوقت الفعلي والتحسين القابل للتوسع باستخدام التعلم العميق بالتعزيز.
- تصميم نظام ISAC متعدد الأهداف: أول دراسة منهجية لتطبيق FAS في سيناريوهات الاستشعار متعددة الأهداف، ملء الفجوة في الأبحاث الحالية
- إطار عمل BCD-DRL الهجين: اقتراح إطار عمل تحسين جديد يجمع بين النزول بالإحداثيات الكتلية والتعلم العميق بالتعزيز
- تحسين الموضع المستمر: تحقيق تحسين مستمر لموضع الهوائي، وليس فقط اختيار المنافذ المنفصلة
- التحقق من قابلية التوسع: التحقق من خلال المحاكاة من قابلية التوسع والفعالية للطريقة في سيناريوهات متعددة المستخدمين والأهداف
المدخلات:
- منطقة قيود موضع N من الهوائيات السائلة في محطة القاعدة At
- منطقة قيود موضع الهوائي السائل الواحد في طرف المستخدم Ar
- معلومات موضع K من أهداف الاستشعار
- معاملات القناة وقيود النظام
المخرجات:
- مصفوفة تشكيل الحزم المحسّنة U
- موضع الهوائيات السائلة في محطة القاعدة p = p1, p2, ..., pN
- موضع الهوائي في طرف المستخدم q
شروط القيد:
- قيد الطاقة المرسلة القصوى: Tr(U) ≤ Pmax
- قيد كسب الاستشعار: ϖ(p(k)) ≥ Γ, ∀k ∈ K
- قيد الحد الأدنى للمسافة بين الهوائيات: ||pα - pβ||2 ≥ Ds
- قيد الرتبة الواحدة: rank(U) = 1
تستخدم الخوارزمية طريقة النزول بالإحداثيات الكتلية، وتقسم المشكلة الأصلية غير المحدبة إلى مشكلتين فرعيتين:
- المشكلة الفرعية 1: تثبيت موضع الهوائي، تحسين مصفوفة التغاير المرسلة (تحسين محدب)
- المشكلة الفرعية 2: تثبيت مصفوفة تشكيل الحزم، تحسين موضع الهوائي (حل بـ DRL)
بالنسبة لموضع الهوائي الثابت، يتم تحويل المشكلة إلى تحسين محدب من خلال إرخاء مؤقت لقيد الرتبة الواحدة:
maxU⪰0log2(1+σ2f(p,q)Uf†(p,q))
يتم الحل باستخدام مجموعة أدوات CVX، وإذا كانت رتبة الحل أكبر من 1، يتم استخدام التعشوية الغاوسية لإعادة بناء حل الرتبة الواحدة.
نمذجة عملية اتخاذ القرار ماركوفي (MDP):
- فضاء الحالة: st∈R2(N+1)+3، يتضمن جميع إحداثيات الهوائيات وميزات تشكيل الحزم
- فضاء الحركة: at∈R2(N+1)، يمثل التعديلات الإضافية لموضع الهوائي
- دالة المكافأة:
rt=R(st,at)−α1∑m=1Mmax(0,ϖ(p(m))−Γ)−α2max(0,Pmax−Tr(U))−α3N+11∑i=1N+1∣∣Δpi∣∣2
معمارية الشبكة:
- شبكة الممثل (Actor): شبكة متصلة بالكامل ثلاثية الطبقات (400-300 خلية عصبية)، تستخدم طبقة الإخراج تفعيل tanh مع التحجيم
- شبكة الناقد (Critic): معالجة أزواج الحالة-الحركة، إخراج تقدير قيمة Q
- الشبكات المستهدفة: استخدام سياسة التحديث الناعم لتثبيت التدريب
- تصميم فضاء الحالة: دمج مبتكر لمعلومات التكوين المكاني وميزات تشكيل الحزم، بما في ذلك الأثر والقيمة الذاتية القصوى والقيمة الذاتية المتوسطة
- تصميم دالة المكافأة: دالة مكافأة متعددة الأهداف تأخذ في الاعتبار معدل الاتصالات وقيود الاستشعار وقيود الطاقة وتكاليف الحركة
- سياسة الاستكشاف: استخدام عملية Ornstein-Uhlenbeck لإنشاء ضوضاء استكشاف مرتبطة زمنياً، مناسبة للمهام الفيزيائية
- التحسين المستمر: تحقيق تحسين موضع حقيقي ومستمر، وليس اختيار منفصل
- نموذج القناة: نموذج المجال البعيد، زوايا الارتفاع والسمت θ و ψ موزعة بشكل مستقل وموحد في 0,π
- قيود الهوائي: الحد الأدنى للمسافة D = λ/2، نطاق الحركة A×A، أقصى إزاحة A = 4λ
- إعدادات المسار: عدد مسارات الإرسال والاستقبال D = I = 3
- نسبة الطاقة: نسبة قوة مسار LoS إلى NLoS τ = 1
- معاملات الشبكة: مخزن مؤقت لإعادة التشغيل التجريبي 10000، حجم الدفعة 64، معامل التحديث الناعم τ = 0.001
- أداء الاتصالات: متوسط معدل الاتصالات والحد الأقصى لمعدل الاتصالات (bps/Hz)
- تكوين النظام: مجموعات مختلفة من عدد الهوائيات N (4,8,12) وعدد الأهداف K (1,3)
- عدد المستخدمين: سيناريوهات مستخدم واحد (M=1) ومستخدمين متعددين (M=3)
- خط أساس FPA: نظام الهوائيات ذو الموضع الثابت كمرجع
- مقارنة التكوينات المختلفة: مقارنة الأداء مع تغيير عدد الهوائيات وعدد الأهداف
تحليل متوسط معدل الاتصالات:
- يتفوق FAS على خط أساس FPA بشكل كبير في جميع التكوينات
- مع زيادة عدد الأهداف K، تصبح قيود ISAC أكثر صرامة، ينخفض معدل الاتصالات
- حتى في سيناريوهات الأهداف المتعددة (K>1)، يظل معدل اتصالات FAS أعلى من FPA بهدف واحد
تحسين الحد الأقصى لمعدل الاتصالات:
- في تكوين 30dB SNR و N=12 هوائي:
- M=1: 11.64 bps/Hz
- M=3: 14.84 bps/Hz
- نسبة التحسين: 27.6%
- توسع عدد الهوائيات: من N=4 إلى N=12، استمرار تحسن الأداء
- التكيف مع عدد الأهداف: القدرة على التعامل الفعال مع التحول من سيناريوهات الهدف الواحد إلى الأهداف المتعددة
- توسع عدد المستخدمين: تحقيق تحسن أداء كبير في سيناريوهات المستخدمين المتعددين
- مزايا FAS واضحة: يظهر FAS مزايا واضحة مقارنة بـ FPA في جميع سيناريوهات الاختبار
- التوازن متعدد الأهداف: تؤدي زيادة عدد أهداف الاستشعار إلى انخفاض أداء الاتصالات، لكن FAS يوازن هذه المقايضة بشكل أفضل
- قابلية التوسع الجيدة: يمكن لإطار عمل DRL التكيف بسلاسة مع بيئات متعددة المستخدمين الأكثر تعقيداً
- أنظمة الهوائيات السائلة: تقنية تحديد الموضع الديناميكي للهوائيات، توفر مرونة مكانية إضافية
- أنظمة ISAC: تقنية دمج الاتصالات والاستشعار في شبكات الجيل السادس
- التعلم العميق بالتعزيز: تطبيقات التحسين في الاتصالات اللاسلكية
- مقارنة بالمرجع 8: دعم صريح لمستخدمي استشعار متعددين بدلاً من هدف واحد
- مقارنة بالمراجع 9,10: تحقيق اختيار موضع مستمر بدلاً من تفعيل منفصل للمنافذ
- المساهمة التقنية: أول دمج لـ BCD مع DRL لحل مشكلة التحسين المشترك لـ FAS-ISAC
- يمكن لإطار عمل BCD-DRL المقترح حل مشكلة تحسين نظام ISAC متعدد الأهداف المدعوم بـ FAS بفعالية
- نجحت خوارزمية DDPG في تحقيق التحسين المشترك لتشكيل الحزم وموضع الهوائي
- تثبت نتائج المحاكاة قابلية التوسع والفعالية للطريقة في سيناريوهات الأهداف المتعددة
- بيئة المحاكاة: يعتمد البحث على بيئة محاكاة، لم يتم النظر الكافي في القيود الهندسية والتعقيد في نماذج القنوات في النشر الفعلي
- التعقيد الحسابي: على الرغم من اقتراح حل قابل للتوسع، لا تزال متطلبات الحساب في الوقت الفعلي للأنظمة الكبيرة تتطلب مزيد من التحقق
- المتانة: تحليل محدود لمتانة الطريقة تجاه أخطاء تقدير القناة والتغييرات البيئية
- التطبيق الهندسي: تصميم نظام يأخذ في الاعتبار القيود الهندسية لأجهزة FAS الفعلية
- تحسين المتانة: تحسين القدرة على التكيف مع عدم اليقين في القناة والتغييرات البيئية
- النشر على نطاق واسع: دراسة استراتيجيات التحسين لمصفوفات هوائيات أكبر وأعداد مستخدمين أكبر
- أهمية المشكلة: حل التحديات التقنية الرئيسية في نظام FAS-ISAC، ذات قيمة نظرية وعملية مهمة
- ابتكار الطريقة: تصميم إطار عمل BCD-DRL الهجين ذكي، يجمع بشكل عضوي بين التحسين المحدب والتعلم بالتعزيز
- العمق التقني: نمذجة MDP معقولة، تصميم فضاء الحالة ودالة المكافأة شامل
- التحقق التجريبي: التحقق من خلال المحاكاة في تكوينات متعددة يثبت فعالية الطريقة وقابليتها للتوسع
- التحليل النظري: نقص في تحليل التقارب والتعقيد
- المقارنة المحدودة: المقارنة الأساسية مع خط أساس FPA، نقص في المقارنة مع طرق متقدمة أخرى
- القيود العملية: لم يتم النظر الكافي في القيود الهندسية والحدود في النشر الفعلي
- تحليل حساسية المعاملات: تحليل غير كافٍ لحساسية اختيار المعاملات الفائقة
- المساهمة الأكاديمية: توفير اتجاه بحثي جديد ومسار تقني لتحسين نظام FAS-ISAC
- القيمة العملية: توفير مرجع لتصميم أنظمة الهوائيات الذكية في شبكات الجيل السادس
- قابلية إعادة الإنتاج: وصف الطريقة مفصل، لكن الكود والإعدادات المفصلة لم تُنشر
- أنظمة اتصالات الجيل السادس: مناسبة بشكل خاص للسيناريوهات التي تتطلب الاتصالات والاستشعار متعدد الأهداف في نفس الوقت
- النقل الذكي: الكشف متعدد الأهداف والاتصالات في شبكات المركبات
- إنترنت الأشياء الصناعي: مراقبة الأجهزة ونقل البيانات في التصنيع الذكي
- المدن الذكية: نشر محطات قاعدة متعددة الوظائف في البيئات الحضرية
تستشهد الورقة بـ 11 مرجعاً ذا صلة، تغطي الأعمال المهمة في المجالات الرئيسية لـ FAS والتعلم العميق بالتعزيز و ISAC، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الشامل: هذه ورقة ذات جودة تقنية عالية، تقترح حلاً مبتكراً لمشكلة تحسين نظام FAS-ISAC. على الرغم من وجود مجال للتحسين في التحليل النظري والنظر في النشر الفعلي، فإن المساهمات التقنية والتحقق التجريبي كافية، وتساهم بشكل إيجابي في تطور المجالات ذات الصلة.