2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.
Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.
academic

IoV SPS में AoI न्यूनीकरण के लिए वेग और घनत्व-जागरूक RRI विश्लेषण और अनुकूलन

मूल जानकारी

सारांश

यह पेपर वाहन संचार नेटवर्क (IoV) में अर्ध-स्थायी अनुसूचन (SPS) में डेटा पैकेट टकराव और वाहन गति से संबंधित चैनल अनिश्चितता के कारण सूचना आयु (AoI) में गिरावट की समस्या को संबोधित करता है। बड़े भाषा मॉडल (LLM) और गहन नियतात्मक नीति ढाल (DDPG) आधारित अनुकूलन विधि प्रस्तावित की गई है। सबसे पहले, वाहन गति, वाहन घनत्व और संसाधन आरक्षण अंतराल (RRI) से प्रभावित AoI गणना मॉडल स्थापित किया गया है। इसके बाद, एक द्वि-पथ अनुकूलन योजना डिज़ाइन की गई है। DDPG को स्थिति स्थान और पुरस्कार फ़ंक्शन द्वारा निर्देशित किया जाता है, जबकि LLM संदर्भ शिक्षण का उपयोग करके इष्टतम पैरामीटर कॉन्फ़िगरेशन उत्पन्न करता है। प्रायोगिक परिणाम दर्शाते हैं कि LLM कुछ नमूने जमा करने के बाद AoI को काफी कम कर सकता है और मॉडल प्रशिक्षण की आवश्यकता नहीं है, जबकि DDPG विधि प्रशिक्षण के बाद अधिक स्थिर प्रदर्शन प्राप्त कर सकती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

वाहन संचार नेटवर्क (IoV) बुद्धिमान परिवहन प्रणाली की मुख्य तकनीक है, जिसमें वाहन-से-वाहन (V2V) संचार महत्वपूर्ण मूल सुरक्षा संदेश (BSM) प्रसारित करने की आवश्यकता है। 5G NR V2X मानक में, V2V संचार आमतौर पर Mode 2 का उपयोग करके स्वायत्त संसाधन चयन के लिए अर्ध-स्थायी अनुसूचन (SPS) का उपयोग करता है।

मुख्य समस्याएं

  1. पारंपरिक SPS की सीमाएं: मौजूदा SPS अनुभवजन्य निश्चित पैरामीटर (जैसे RRI) पर निर्भर करता है, जो विभिन्न वाहन घनत्व में उप-इष्टतम प्रदर्शन का कारण बन सकता है
  2. AoI प्रदर्शन में गिरावट: डेटा पैकेट टकराव और निरंतर संचरण विफलता AoI प्रदर्शन को काफी कम कर सकती है
  3. बहु-कारक युग्मन: वाहन गति, घनत्व और RRI के बीच जटिल गैर-रैखिक युग्मन संबंध मौजूद हैं

अनुसंधान प्रेरणा

  • उच्च गति वाहन (विशेष रूप से विपरीत दिशा में यात्रा करते समय) महत्वपूर्ण डॉपलर आवृत्ति बदलाव उत्पन्न करते हैं, जो अतिरिक्त संचरण विफलता का कारण बन सकते हैं
  • भौतिक साइड लिंक प्रतिक्रिया चैनल (PSFCH) कॉन्फ़िगरेशन के बिना, BSM जैसे प्रसारण संदेश आमतौर पर अंधे पुनः संचरण का उपयोग करते हैं
  • RRI चयन को अनुकूलित करने के लिए वाहन गति और घनत्व दोनों को एक साथ विचार करने की आवश्यकता है, ताकि संचार प्रदर्शन में सुधार हो सके

मुख्य योगदान

  1. व्यापक AoI मॉडल स्थापित करना: वाहन गति, वाहन घनत्व और RRI के प्रभाव को एक साथ विचार करने वाला AoI गणना मॉडल प्रस्तावित किया गया है, जो भौतिक चैनल स्थितियों की अनिश्चितता और संसाधन पैकेट टकराव की संभावना को एकीकृत करता है
  2. द्वि-पथ अनुकूलन ढांचा: LLM और DDPG आधारित दोहरी अनुकूलन रणनीति डिज़ाइन की गई है, जहां LLM संदर्भ शिक्षण का उपयोग करके तेजी से अभिसरण करता है, और DDPG निरंतर स्थान अन्वेषण प्रदान करता है
  3. गति-जागरूक चैनल मॉडलिंग: वाहन गति के कारण डॉपलर प्रभाव को मार्कोव चैनल मॉडल में शामिल किया गया है, जो उच्च गति परिदृश्य में संचरण विफलता की संभावना को सटीक रूप से दर्शाता है
  4. प्रायोगिक सत्यापन: अनुकरण प्रयोगों के माध्यम से सत्यापित किया गया है कि वाहन घनत्व, RRI और वाहन गति का संयुक्त अनुकूलन IoV प्रणाली के AoI को काफी कम कर सकता है

विधि विवरण

कार्य परिभाषा

इनपुट: वाहन गति v, वाहन घनत्व ρ, संसाधन आरक्षण अंतराल RRI
आउटपुट: प्रणाली AoI को न्यूनतम करने के लिए इष्टतम पैरामीटर कॉन्फ़िगरेशन
बाधाएं: निश्चित यातायात प्रवाह Q के तहत गति-घनत्व संबंध: ρ = Q/v

प्रणाली मॉडल

1. नेटवर्क टोपोलॉजी

लंबाई 2L के सीमित राजमार्ग खंड पर विचार किया गया है, जिसमें दो विपरीत लेन शामिल हैं। वाहनों की कुल संख्या है:

mtotal = 2ρlL

2. टकराव संभावना मॉडल

वाहन n के डेटा पैकेट के टकराव की संभावना है:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

जहां Nr चयन विंडो में चयन योग्य अधिकतम RBG संख्या है, Ns संवेदन श्रेणी में वाहनों की संख्या है।

3. चैनल स्थिति मॉडलिंग

मार्कोव प्रक्रिया के आधार पर चैनल स्थिति को मॉडल किया गया है, डॉपलर आवृत्ति बदलाव fd = fcv/c के प्रभाव को विचार करते हुए:

  • स्थिति संक्रमण संभावना pp (खराब स्थिति बनाए रखना) और pi (आदर्श स्थिति बनाए रखना)
  • कुल डेटा पैकेट हानि संभावना pd की पुनरावर्ती गणना

4. AoI गणना मॉडल

प्रणाली AoI को कतार में प्रतीक्षा समय और संचरण समय के योग के रूप में व्यक्त किया जाता है:

A = Tq + Tt

कतार में प्रतीक्षा समय Tq टकराव पुनः संचरण और चैनल विफलता के संयुक्त प्रभाव को विचार करता है:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

अनुकूलन रणनीति

1. DDPG विधि

समस्या को मार्कोव निर्णय प्रक्रिया (MDP) के रूप में मॉडल किया गया है:

  • स्थिति स्थान: st = vt, ρt, RRIt, pd,t, Pcoll,t
  • कार्य स्थान: at = RRIt+1, vt+1
  • पुरस्कार फ़ंक्शन: विभिन्न AoI अंतराल के लिए विभिन्न ढलान के साथ खंडित पुरस्कार फ़ंक्शन डिज़ाइन किया गया है

Actor-Critic आर्किटेक्चर का उपयोग किया गया है:

  • Actor नेटवर्क: μ(st|θμ) नियतात्मक कार्य आउटपुट करता है
  • Critic नेटवर्क: Q(st,at|θQ) स्थिति-कार्य मूल्य का मूल्यांकन करता है
  • लक्ष्य नेटवर्क और अनुभव पुनरावृत्ति प्रशिक्षण स्थिरता में सुधार करते हैं

2. LLM विधि

पांच भाग वाली प्रॉम्प्ट संरचना डिज़ाइन की गई है:

  1. कार्य पृष्ठभूमि: AoI घटकों और प्रभावशाली कारकों की व्याख्या
  2. कार्य उद्देश्य: प्रणाली AoI को न्यूनतम करने का उद्देश्य स्पष्ट करना
  3. मुख्य कार्य: अनुकूलन एल्गोरिथम के रूप में LLM की भूमिका परिभाषित करना
  4. आउटपुट प्रारूप: परिणाम प्रस्तुति को मानकीकृत करना
  5. उदाहरण सेट: प्रतिनिधि पैरामीटर चयन और संबंधित AoI मान प्रदान करना

LLM एल्गोरिथम ढांचा:

  • बहु-चरणीय तर्क कई आउटपुट परिणाम उत्पन्न करता है
  • पर्यावरण सिम्युलेटर वर्तमान इष्टतम समाधान प्राप्त करने के लिए AoI की गणना करता है
  • डुप्लिकेट अनुभव को बाहर करता है, प्रभावी अनुभव को ऐतिहासिक निर्णय सेट में जोड़ता है
  • जब कई पुनरावृत्तियां महत्वपूर्ण सुधार नहीं दिखाती हैं तो अभिसरण का निर्धारण करता है

प्रायोगिक सेटअप

अनुकरण पैरामीटर

  • परिदृश्य: राजमार्ग द्विदिशात्मक लेन
  • यातायात प्रवाह: 6000 वाहन/घंटा (निश्चित)
  • RRI श्रेणी: 10-100 ms
  • वाहन घनत्व श्रेणी: 50-200 वाहन/किमी
  • गति श्रेणी: 30-120 km/h
  • राजमार्ग लंबाई: 2L (L आधी लंबाई है)

मूल्यांकन संकेतक

  • मुख्य संकेतक: प्रणाली औसत AoI
  • अभिसरण: 50 प्रशिक्षण चक्रों में AoI परिवर्तन प्रवृत्ति

तुलना विधियां

  1. LLM विधि: तीन विभिन्न बड़े भाषा मॉडल
  2. DDPG एल्गोरिथम: गहन नियतात्मक नीति ढाल
  3. आनुवंशिक एल्गोरिथम: पारंपरिक अनुकूलन विधि
  4. इष्टतम समाधान: व्यापक खोज के माध्यम से प्राप्त सैद्धांतिक इष्टतम मान

प्रायोगिक परिणाम

मुख्य परिणाम

1. वाहन गति का AoI पर प्रभाव (चित्र 3a)

  • कम गति (उच्च घनत्व): AoI में वृद्धि मुख्य रूप से SPS संसाधन चयन में उच्च डेटा पैकेट टकराव संभावना के कारण होती है
  • उच्च गति (कम घनत्व): हालांकि टकराव कम है, लेकिन गंभीर डॉपलर चैनल गिरावट भौतिक परत विफलता दर को बढ़ाती है
  • RRI प्रभाव:
    • बड़े RRI समय में, टकराव संभावना नगण्य है, AoI गति के साथ धीरे-धीरे बढ़ता है
    • छोटे RRI समय में, टकराव प्रमुख है, AoI कम गति पर शिखर तक पहुंचता है फिर गति के साथ घटता है

2. RRI का AoI पर प्रभाव (चित्र 3b)

  • कम गति (उच्च घनत्व): कम RRI मान पर उच्च टकराव संभावना के कारण AoI बड़ा है, RRI के साथ बढ़ने पर संबंध रैखिक हो जाता है
  • उच्च गति (कम घनत्व): चैनल पैकेट हानि संभावना बढ़ता है, AoI RRI के साथ तेजी से बढ़ता है

3. विभिन्न विधियों का प्रदर्शन तुलना (चित्र 3c)

  • LLM विधि:
    • प्रारंभिक चरण में विभिन्न पैरामीटर संयोजनों की खोज के कारण AoI में उतार-चढ़ाव
    • प्रॉम्प्ट में प्रतिनिधि उदाहरण होने के कारण अच्छा प्रारंभिक समाधान
    • केवल कुछ पुनरावृत्तियों में तेजी से अभिसरण
  • DDPG एल्गोरिथम:
    • अन्वेषण और नेटवर्क पैरामीटर समायोजन के अधिक चरणों की आवश्यकता
    • प्रशिक्षण के बाद अधिक स्थिर प्रदर्शन
  • आनुवंशिक एल्गोरिथम: अभिसरण गति LLM और DDPG के बीच है

मुख्य निष्कर्ष

  1. गति-घनत्व-RRI तीन कारकों का युग्मन: संयुक्त अनुकूलन एकल कारक अनुकूलन से काफी बेहतर है
  2. LLM तेजी से अभिसरण: उदाहरण-आधारित संदर्भ शिक्षण ऑनलाइन प्रशिक्षण के बिना तेजी से अभिसरण कर सकती है
  3. DDPG स्थिरता: हालांकि अभिसरण धीमा है, लेकिन निरंतर स्थान अन्वेषण में अधिक स्थिर प्रदर्शन
  4. डॉपलर प्रभाव महत्व: उच्च गति परिदृश्य में चैनल स्थिति का AoI पर प्रभाव अनदेखा नहीं किया जा सकता

संबंधित कार्य

SPS अनुकूलन अनुसंधान

  • पारंपरिक विधियां: मुख्य रूप से RRI चयन पर वाहन घनत्व के प्रभाव पर ध्यान केंद्रित करती हैं
  • अनुकूली योजनाएं: चैनल उपलब्धता के आधार पर संसाधन पुनः चयन काउंटर (RC) और RRI को गतिशील रूप से समायोजित करती हैं
  • AoI विश्लेषण: SPS में निरंतर संसाधन कब्जे का प्रणाली AoI पर प्रभाव का अध्ययन करती हैं

इस पेपर की नवीनता

  1. बहु-कारक मॉडलिंग: पहली बार गति, घनत्व और RRI के युग्मन प्रभाव को एक साथ विचार करना
  2. AI अनुकूलन: LLM और DDPG की द्वि-पथ अनुकूलन रणनीति का परिचय
  3. चैनल मॉडलिंग: डॉपलर प्रभाव को मार्कोव चैनल मॉडल में शामिल करना

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. मॉडल प्रभावशीलता: स्थापित AoI मॉडल वाहन गति, घनत्व और RRI के संयुक्त प्रभाव को सटीक रूप से दर्शा सकता है
  2. अनुकूलन प्रभाव: संयुक्त अनुकूलन IoV प्रणाली के AoI को काफी कम कर सकता है
  3. विधि तुलना: LLM विधि तेजी से अभिसरण करती है लेकिन अच्छे उदाहरणों की आवश्यकता है, DDPG विधि स्थिर है लेकिन प्रशिक्षण की आवश्यकता है

सीमाएं

  1. परिदृश्य प्रतिबंध: केवल राजमार्ग द्विदिशात्मक लेन परिदृश्य पर विचार किया गया है
  2. धारणा शर्तें: वाहनों का समान वितरण और निश्चित यातायात प्रवाह मान लिया गया है
  3. चैनल मॉडल: सरलीकृत मार्कोव चैनल मॉडल वास्तविक जटिल चैनल वातावरण को पूरी तरह से प्रतिबिंबित नहीं कर सकता है
  4. LLM निर्भरता: LLM विधि उच्च गुणवत्ता वाले उदाहरणों और प्रॉम्प्ट डिज़ाइन पर निर्भर है

भविष्य की दिशाएं

  1. हल्के-फुल्के सूक्ष्म-ट्यूनिंग: उदाहरणों पर निर्भरता को कम करने के लिए LLM हल्के-फुल्के सूक्ष्म-ट्यूनिंग योजना डिज़ाइन करना
  2. वास्तविक समय तैनाती: अनुकूलन इंजन को C-V2X रोडसाइड यूनिट में एकीकृत करके गतिशील RRI कॉन्फ़िगरेशन प्राप्त करना
  3. बहु-आधार स्टेशन परिदृश्य: संकेत स्विचिंग के कारण AoI शिखर को हल करने के लिए बहु-आधार स्टेशन परिदृश्य पर विचार करना
  4. अधिक जटिल परिदृश्य: शहरी सड़कों, चौराहों आदि अधिक जटिल यातायात परिदृश्यों तक विस्तार करना

गहन मूल्यांकन

शक्तियां

  1. समस्या महत्व: IoV में AoI अनुकूलन की महत्वपूर्ण समस्या को संबोधित करता है, व्यावहारिक अनुप्रयोग मूल्य है
  2. व्यापक मॉडलिंग: टकराव, चैनल विफलता, अंधे पुनः संचरण आदि कई कारकों के युग्मन प्रभाव को व्यापक रूप से विचार करता है
  3. विधि नवीनता: पहली बार IoV पैरामीटर अनुकूलन में LLM का परिचय, नए समाधान विचार प्रदान करता है
  4. पर्याप्त प्रयोग: बहु-कोण अनुकरण के माध्यम से विधि की प्रभावशीलता सत्यापित करता है

कमियां

  1. परिदृश्य सीमा: केवल राजमार्ग परिदृश्य पर विचार किया गया है, शहरी जटिल सड़क वातावरण में प्रयोज्यता सत्यापन की आवश्यकता है
  2. मॉडल धारणाएं: वाहनों का समान वितरण आदि धारणाएं बहुत आदर्शवादी हैं
  3. LLM व्याख्यात्मकता: LLM निर्णय प्रक्रिया में व्याख्यात्मकता की कमी है, इसकी अनुकूलन तंत्र को समझना कठिन है
  4. वास्तविक समय विचार: वास्तविक तैनाती में कम्प्यूटेशनल जटिलता और वास्तविक समय आवश्यकताओं पर पर्याप्त चर्चा नहीं की गई है

प्रभाव

  1. शैक्षणिक योगदान: IoV में AoI अनुकूलन के लिए नया सैद्धांतिक मॉडल और अनुकूलन विधि प्रदान करता है
  2. व्यावहारिक मूल्य: 5G/6G वाहन संचार मानक निर्धारण और प्रणाली डिज़ाइन के लिए संदर्भ प्रदान कर सकता है
  3. विधि प्रेरणा: नेटवर्क अनुकूलन में LLM का अनुप्रयोग अधिक संबंधित अनुसंधान को प्रेरित कर सकता है

प्रयोज्य परिदृश्य

  • राजमार्ग वाहन संचार प्रणाली पैरामीटर अनुकूलन
  • 5G NR V2X Mode 2 का SPS पैरामीटर कॉन्फ़िगरेशन
  • बहु-कारक युग्मन विचार की आवश्यकता वाली नेटवर्क अनुकूलन समस्याएं
  • AoI संवेदनशील वास्तविक समय संचार प्रणाली

संदर्भ

यह पेपर 20 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से निम्नलिखित को कवर करते हुए:

  • IoV और V2X संचार मूल अनुसंधान
  • SPS तंत्र और पैरामीटर अनुकूलन
  • AoI सिद्धांत और अनुप्रयोग
  • गहन सुदृढ़ीकरण शिक्षण विधियां
  • बड़े भाषा मॉडल अनुप्रयोग

समग्र मूल्यांकन: यह पेपर वाहन संचार नेटवर्क में महत्वपूर्ण समस्या के लिए नवीन समाधान प्रस्तावित करता है, सैद्धांतिक मॉडलिंग और विधि डिज़ाइन दोनों में कुछ योगदान है। नेटवर्क अनुकूलन में LLM का अनुप्रयोग कुछ नवीनता रखता है, लेकिन अधिक जटिल परिदृश्यों में इसकी प्रभावशीलता और व्यावहारिकता को आगे सत्यापित करने की आवश्यकता है।