Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS
Ji, Wang, Wu et al.
Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.
academic
Analyse et Optimisation de l'Intervalle de Réservation de Ressources Consciente de la Vélocité et de la Densité pour la Minimisation de l'AoI dans l'IoV SPS
Cet article aborde le problème de la dégradation de l'Âge de l'Information (AoI) dans la planification semi-persistante (SPS) des réseaux véhiculaires (IoV), causée par les collisions de paquets et l'incertitude des canaux liée à la vélocité des véhicules. Les auteurs proposent une méthode d'optimisation basée sur les Grands Modèles de Langage (LLM) et le Gradient de Politique Déterministe Profond (DDPG). Un modèle de calcul de l'AoI est d'abord établi, tenant compte de la vélocité des véhicules, de la densité des véhicules et de l'Intervalle de Réservation de Ressources (RRI). Une stratégie d'optimisation à double voie est ensuite conçue, où le DDPG est guidé par l'espace d'état et la fonction de récompense, tandis que le LLM utilise l'apprentissage contextuel pour générer des configurations de paramètres optimales. Les résultats expérimentaux montrent que le LLM peut réduire significativement l'AoI après l'accumulation d'un petit nombre d'échantillons sans nécessiter d'entraînement du modèle, tandis que la méthode DDPG réalise des performances plus stables après l'entraînement.
L'Internet des Véhicules (IoV) constitue une technologie centrale des systèmes de transport intelligents. Dans ce contexte, la communication véhicule-à-véhicule (V2V) doit transmettre des messages de sécurité de base critiques (BSM). Dans la norme 5G NR V2X, la communication V2V utilise généralement le Mode 2 pour la sélection autonome des ressources, en employant la planification semi-persistante (SPS) pour concourir et occuper les ressources.
Limitations de la SPS traditionnelle: La SPS existante dépend de paramètres fixes basés sur l'expérience (tels que le RRI), ce qui peut entraîner des performances sous-optimales sous différentes densités de véhicules
Dégradation des performances d'AoI: Les collisions de paquets et les défaillances de transmission continues réduisent significativement les performances d'AoI
Couplage multi-factoriel: Il existe des relations de couplage non-linéaires complexes entre la vélocité des véhicules, la densité et le RRI
Les véhicules à haute vélocité (particulièrement en circulation opposée) produisent un décalage Doppler significatif, pouvant entraîner des défaillances de transmission supplémentaires
En l'absence de configuration d'un canal de rétroaction physique de sélection (PSFCH), les messages de diffusion tels que les BSM utilisent généralement la retransmission aveugle
Il est nécessaire de considérer simultanément la vélocité et la densité des véhicules pour optimiser la sélection du RRI et améliorer les performances de communication
Établissement d'un modèle AoI compréhensif: Proposition d'un modèle de calcul de l'AoI tenant compte simultanément de la vélocité des véhicules, de la densité des véhicules et de l'influence du RRI, intégrant l'incertitude des conditions de canal physique et la probabilité de collision des ressources
Cadre d'optimisation à double voie: Conception d'une stratégie d'optimisation double basée sur le LLM et le DDPG, où le LLM utilise l'apprentissage contextuel pour une convergence rapide, tandis que le DDPG fournit une exploration stable de l'espace continu
Modélisation de canal consciente de la vélocité: Intégration de l'effet Doppler causé par la vélocité des véhicules dans le modèle de canal de Markov, caractérisant avec précision la probabilité de défaillance de transmission dans les scénarios à haute vélocité
Validation expérimentale: Vérification par simulation que l'optimisation conjointe de la densité des véhicules, du RRI et de la vélocité des véhicules réduit significativement l'AoI du système IoV
Entrées: Vélocité des véhicules v, densité des véhicules ρ, Intervalle de Réservation de Ressources RRI Sorties: Configuration de paramètres optimale minimisant l'AoI du système Contraintes: Relation vélocité-densité sous flux de trafic fixe Q: ρ = Q/v
Modélisation du problème comme un Processus de Décision Markovien (MDP):
Espace d'état: st = vt, ρt, RRIt, pd,t, Pcoll,t
Espace d'action: at = RRIt+1, vt+1
Fonction de récompense: Conception d'une fonction de récompense par segments, accordant des pentes de récompense différentes pour différents intervalles d'AoI
Utilisation d'une architecture Actor-Critic:
Réseau Actor: μ(st|θμ) produisant une action déterministe
Réseau Critic: Q(st,at|θQ) évaluant la valeur état-action
Réseaux cibles et relecture d'expérience améliorant la stabilité de l'entraînement
Basse vélocité (haute densité): L'augmentation de l'AoI est principalement causée par la probabilité élevée de collision de paquets lors de la sélection des ressources SPS
Haute vélocité (basse densité): Bien que les collisions soient moins fréquentes, la dégradation sévère du canal Doppler augmente le taux de défaillance de la couche physique
Influence du RRI:
Avec un RRI élevé, la probabilité de collision est négligeable, et l'AoI augmente progressivement avec la vélocité
Avec un RRI faible, les collisions dominent, et l'AoI atteint un pic à basse vélocité avant de diminuer avec l'augmentation de la vélocité
Basse vélocité (haute densité): À faible valeur de RRI, la probabilité de collision élevée entraîne un AoI plus important, la relation devenant linéaire avec l'augmentation du RRI
Haute vélocité (basse densité): L'augmentation de la probabilité de perte de paquets du canal entraîne une augmentation plus rapide de l'AoI avec le RRI
Validité du modèle: Le modèle d'AoI établi reflète avec précision l'effet combiné de la vélocité des véhicules, de la densité et du RRI
Efficacité de l'optimisation: L'optimisation conjointe réduit significativement l'AoI du système IoV
Comparaison des méthodes: La méthode LLM converge rapidement mais nécessite de bons exemples, tandis que la méthode DDPG est stable mais nécessite un entraînement
Importance du problème: Aborde un problème important d'optimisation de l'AoI dans l'IoV, avec une valeur d'application pratique
Modélisation complète: Considération globale de l'effet de couplage de multiples facteurs tels que les collisions, les défaillances de canal et les retransmissions aveugles
Innovation méthodologique: Première introduction du LLM dans l'optimisation des paramètres IoV, offrant une nouvelle perspective de résolution
Expérimentation suffisante: Vérification de l'efficacité de la méthode par simulation multi-angle
Limitation du scénario: Considération limitée aux scénarios d'autoroute, l'applicabilité aux environnements routiers urbains complexes reste à vérifier
Hypothèses du modèle: Les hypothèses telles que la distribution uniforme des véhicules sont trop idéalisées
Interprétabilité du LLM: Le processus de décision du LLM manque d'interprétabilité, rendant difficile la compréhension de son mécanisme d'optimisation
Considération du temps réel: Discussion insuffisante de la complexité computationnelle et des exigences de temps réel dans le déploiement pratique
Cet article cite 20 références connexes, couvrant principalement:
Recherche fondamentale sur l'IoV et la communication V2X
Mécanisme SPS et optimisation des paramètres
Théorie et applications de l'AoI
Méthodes d'apprentissage par renforcement profond
Applications des grands modèles de langage
Évaluation Globale: Cet article propose une solution innovante à un problème important dans les réseaux véhiculaires, avec certaines contributions tant dans la modélisation théorique que dans la conception méthodologique. L'application du LLM à l'optimisation des réseaux présente une certaine nouveauté, mais son efficacité et son applicabilité pratique nécessitent une vérification supplémentaire dans des scénarios plus complexes.