2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.
Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.
academic

Analyse et Optimisation de l'Intervalle de Réservation de Ressources Consciente de la Vélocité et de la Densité pour la Minimisation de l'AoI dans l'IoV SPS

Informations Fondamentales

Résumé

Cet article aborde le problème de la dégradation de l'Âge de l'Information (AoI) dans la planification semi-persistante (SPS) des réseaux véhiculaires (IoV), causée par les collisions de paquets et l'incertitude des canaux liée à la vélocité des véhicules. Les auteurs proposent une méthode d'optimisation basée sur les Grands Modèles de Langage (LLM) et le Gradient de Politique Déterministe Profond (DDPG). Un modèle de calcul de l'AoI est d'abord établi, tenant compte de la vélocité des véhicules, de la densité des véhicules et de l'Intervalle de Réservation de Ressources (RRI). Une stratégie d'optimisation à double voie est ensuite conçue, où le DDPG est guidé par l'espace d'état et la fonction de récompense, tandis que le LLM utilise l'apprentissage contextuel pour générer des configurations de paramètres optimales. Les résultats expérimentaux montrent que le LLM peut réduire significativement l'AoI après l'accumulation d'un petit nombre d'échantillons sans nécessiter d'entraînement du modèle, tandis que la méthode DDPG réalise des performances plus stables après l'entraînement.

Contexte et Motivation de la Recherche

Définition du Problème

L'Internet des Véhicules (IoV) constitue une technologie centrale des systèmes de transport intelligents. Dans ce contexte, la communication véhicule-à-véhicule (V2V) doit transmettre des messages de sécurité de base critiques (BSM). Dans la norme 5G NR V2X, la communication V2V utilise généralement le Mode 2 pour la sélection autonome des ressources, en employant la planification semi-persistante (SPS) pour concourir et occuper les ressources.

Problèmes Fondamentaux

  1. Limitations de la SPS traditionnelle: La SPS existante dépend de paramètres fixes basés sur l'expérience (tels que le RRI), ce qui peut entraîner des performances sous-optimales sous différentes densités de véhicules
  2. Dégradation des performances d'AoI: Les collisions de paquets et les défaillances de transmission continues réduisent significativement les performances d'AoI
  3. Couplage multi-factoriel: Il existe des relations de couplage non-linéaires complexes entre la vélocité des véhicules, la densité et le RRI

Motivation de la Recherche

  • Les véhicules à haute vélocité (particulièrement en circulation opposée) produisent un décalage Doppler significatif, pouvant entraîner des défaillances de transmission supplémentaires
  • En l'absence de configuration d'un canal de rétroaction physique de sélection (PSFCH), les messages de diffusion tels que les BSM utilisent généralement la retransmission aveugle
  • Il est nécessaire de considérer simultanément la vélocité et la densité des véhicules pour optimiser la sélection du RRI et améliorer les performances de communication

Contributions Principales

  1. Établissement d'un modèle AoI compréhensif: Proposition d'un modèle de calcul de l'AoI tenant compte simultanément de la vélocité des véhicules, de la densité des véhicules et de l'influence du RRI, intégrant l'incertitude des conditions de canal physique et la probabilité de collision des ressources
  2. Cadre d'optimisation à double voie: Conception d'une stratégie d'optimisation double basée sur le LLM et le DDPG, où le LLM utilise l'apprentissage contextuel pour une convergence rapide, tandis que le DDPG fournit une exploration stable de l'espace continu
  3. Modélisation de canal consciente de la vélocité: Intégration de l'effet Doppler causé par la vélocité des véhicules dans le modèle de canal de Markov, caractérisant avec précision la probabilité de défaillance de transmission dans les scénarios à haute vélocité
  4. Validation expérimentale: Vérification par simulation que l'optimisation conjointe de la densité des véhicules, du RRI et de la vélocité des véhicules réduit significativement l'AoI du système IoV

Détails de la Méthode

Définition de la Tâche

Entrées: Vélocité des véhicules v, densité des véhicules ρ, Intervalle de Réservation de Ressources RRI
Sorties: Configuration de paramètres optimale minimisant l'AoI du système
Contraintes: Relation vélocité-densité sous flux de trafic fixe Q: ρ = Q/v

Modèle du Système

1. Topologie du Réseau

Considération d'un segment d'autoroute fini de longueur 2L, comprenant deux voies en sens opposé. Le nombre total de véhicules est:

mtotal = 2ρlL

2. Modèle de Probabilité de Collision

La probabilité de collision de paquets du véhicule n est:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

où Nr est le nombre maximal de RBG sélectionnables dans la fenêtre de sélection, et Ns est le nombre de véhicules dans la plage de détection.

3. Modélisation de l'État du Canal

Modélisation de l'état du canal basée sur un processus de Markov, tenant compte de l'influence du décalage Doppler fd = fcv/c:

  • Probabilités de transition d'état pp (maintien d'un état dégradé) et pi (maintien d'un état idéal)
  • Calcul récursif de la probabilité globale de perte de paquets pd

4. Modèle de Calcul de l'AoI

L'AoI du système est exprimé comme la somme du délai d'attente et du délai de transmission:

A = Tq + Tt

Le délai d'attente Tq tient compte de l'effet combiné des retransmissions dues aux collisions et des défaillances de canal:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

Stratégies d'Optimisation

1. Méthode DDPG

Modélisation du problème comme un Processus de Décision Markovien (MDP):

  • Espace d'état: st = vt, ρt, RRIt, pd,t, Pcoll,t
  • Espace d'action: at = RRIt+1, vt+1
  • Fonction de récompense: Conception d'une fonction de récompense par segments, accordant des pentes de récompense différentes pour différents intervalles d'AoI

Utilisation d'une architecture Actor-Critic:

  • Réseau Actor: μ(st|θμ) produisant une action déterministe
  • Réseau Critic: Q(st,at|θQ) évaluant la valeur état-action
  • Réseaux cibles et relecture d'expérience améliorant la stabilité de l'entraînement

2. Méthode LLM

Conception d'une structure d'invite en cinq parties:

  1. Contexte de la tâche: Explication de la composition de l'AoI et des facteurs d'influence
  2. Objectif de la tâche: Clarification de l'objectif de minimisation de l'AoI du système
  3. Tâche principale: Définition du rôle du LLM en tant qu'algorithme d'optimisation
  4. Format de sortie: Présentation standardisée des résultats
  5. Ensemble d'exemples: Fourniture de sélections de paramètres représentatifs et des valeurs d'AoI correspondantes

Cadre algorithmique du LLM:

  • Raisonnement multi-étapes générant plusieurs résultats de sortie
  • Simulateur d'environnement calculant l'AoI pour obtenir la solution optimale actuelle
  • Élimination des expériences dupliquées, ajout des expériences valides à l'ensemble des décisions historiques
  • Détermination de la convergence lorsque plusieurs raisonnements ne montrent pas d'amélioration significative

Configuration Expérimentale

Paramètres de Simulation

  • Scénario: Voies bidirectionnelles d'autoroute
  • Flux de trafic: 6000 véhicules/heure (fixe)
  • Plage de RRI: 10-100 ms
  • Plage de densité de véhicules: 50-200 véhicules/km
  • Plage de vélocité: 30-120 km/h
  • Longueur d'autoroute: 2L (L étant la demi-longueur)

Indicateurs d'Évaluation

  • Indicateur principal: AoI moyen du système
  • Convergence: Tendance de variation de l'AoI au cours de 50 cycles d'entraînement

Méthodes de Comparaison

  1. Méthode LLM: Trois différents grands modèles de langage
  2. Algorithme DDPG: Gradient de Politique Déterministe Profond
  3. Algorithme Génétique: Méthode d'optimisation traditionnelle
  4. Solution Optimale: Valeur théorique optimale obtenue par recherche exhaustive

Résultats Expérimentaux

Résultats Principaux

1. Influence de la Vélocité des Véhicules sur l'AoI (Figure 3a)

  • Basse vélocité (haute densité): L'augmentation de l'AoI est principalement causée par la probabilité élevée de collision de paquets lors de la sélection des ressources SPS
  • Haute vélocité (basse densité): Bien que les collisions soient moins fréquentes, la dégradation sévère du canal Doppler augmente le taux de défaillance de la couche physique
  • Influence du RRI:
    • Avec un RRI élevé, la probabilité de collision est négligeable, et l'AoI augmente progressivement avec la vélocité
    • Avec un RRI faible, les collisions dominent, et l'AoI atteint un pic à basse vélocité avant de diminuer avec l'augmentation de la vélocité

2. Influence du RRI sur l'AoI (Figure 3b)

  • Basse vélocité (haute densité): À faible valeur de RRI, la probabilité de collision élevée entraîne un AoI plus important, la relation devenant linéaire avec l'augmentation du RRI
  • Haute vélocité (basse densité): L'augmentation de la probabilité de perte de paquets du canal entraîne une augmentation plus rapide de l'AoI avec le RRI

3. Comparaison des Performances des Différentes Méthodes (Figure 3c)

  • Méthode LLM:
    • Au stade initial, l'AoI fluctue considérablement en raison de l'exploration de différentes combinaisons de paramètres
    • Grâce aux exemples représentatifs inclus dans l'invite, elle possède une bonne solution initiale
    • Converge rapidement avec seulement quelques itérations
  • Algorithme DDPG:
    • Nécessite plus d'étapes d'exploration et d'ajustement des paramètres du réseau
    • Offre des performances plus stables après l'entraînement
  • Algorithme Génétique: La vitesse de convergence se situe entre le LLM et le DDPG

Découvertes Clés

  1. Couplage des trois facteurs vélocité-densité-RRI: L'optimisation conjointe surpasse significativement l'optimisation mono-factorielle
  2. Convergence rapide du LLM: L'apprentissage contextuel basé sur des exemples converge rapidement sans nécessiter d'entraînement en ligne
  3. Stabilité du DDPG: Bien que la convergence soit plus lente, il montre des performances plus stables dans l'exploration de l'espace continu
  4. Importance de l'effet Doppler: L'influence des conditions de canal sur l'AoI est inévitable dans les scénarios à haute vélocité

Travaux Connexes

Recherche sur l'Optimisation de la SPS

  • Méthodes traditionnelles: Principalement axées sur l'influence de la densité des véhicules sur la sélection du RRI
  • Schémas adaptatifs: Ajustement dynamique du compteur de resélection des ressources (RC) et du RRI basé sur la disponibilité du canal
  • Analyse de l'AoI: Étude de l'influence de l'occupation continue des ressources en SPS sur l'AoI du système

Points d'Innovation de cet Article

  1. Modélisation multi-factorielle: Première considération simultanée de l'effet de couplage de la vélocité, de la densité et du RRI
  2. Optimisation par IA: Introduction d'une stratégie d'optimisation à double voie utilisant le LLM et le DDPG
  3. Modélisation du canal: Intégration de l'effet Doppler dans le modèle de canal de Markov

Conclusions et Discussion

Conclusions Principales

  1. Validité du modèle: Le modèle d'AoI établi reflète avec précision l'effet combiné de la vélocité des véhicules, de la densité et du RRI
  2. Efficacité de l'optimisation: L'optimisation conjointe réduit significativement l'AoI du système IoV
  3. Comparaison des méthodes: La méthode LLM converge rapidement mais nécessite de bons exemples, tandis que la méthode DDPG est stable mais nécessite un entraînement

Limitations

  1. Restriction du scénario: Considération limitée aux scénarios d'autoroutes bidirectionnelles
  2. Hypothèses: Hypothèses d'une distribution uniforme des véhicules et d'un flux de trafic fixe
  3. Modèle de canal: Le modèle de canal de Markov simplifié peut ne pas refléter complètement l'environnement de canal complexe réel
  4. Dépendance au LLM: La méthode LLM dépend de la qualité des exemples et de la conception des invites

Directions Futures

  1. Ajustement fin léger: Conception de schémas d'ajustement fin léger du LLM pour réduire la dépendance aux exemples
  2. Déploiement en temps réel: Intégration du moteur d'optimisation dans les unités routières C-V2X pour la configuration dynamique du RRI
  3. Scénarios multi-stations de base: Considération de scénarios multi-stations de base pour résoudre les pics d'AoI causés par les changements de signal
  4. Scénarios plus complexes: Extension aux routes urbaines, carrefours et autres environnements de trafic plus complexes

Évaluation Approfondie

Points Forts

  1. Importance du problème: Aborde un problème important d'optimisation de l'AoI dans l'IoV, avec une valeur d'application pratique
  2. Modélisation complète: Considération globale de l'effet de couplage de multiples facteurs tels que les collisions, les défaillances de canal et les retransmissions aveugles
  3. Innovation méthodologique: Première introduction du LLM dans l'optimisation des paramètres IoV, offrant une nouvelle perspective de résolution
  4. Expérimentation suffisante: Vérification de l'efficacité de la méthode par simulation multi-angle

Insuffisances

  1. Limitation du scénario: Considération limitée aux scénarios d'autoroute, l'applicabilité aux environnements routiers urbains complexes reste à vérifier
  2. Hypothèses du modèle: Les hypothèses telles que la distribution uniforme des véhicules sont trop idéalisées
  3. Interprétabilité du LLM: Le processus de décision du LLM manque d'interprétabilité, rendant difficile la compréhension de son mécanisme d'optimisation
  4. Considération du temps réel: Discussion insuffisante de la complexité computationnelle et des exigences de temps réel dans le déploiement pratique

Impact

  1. Contribution académique: Fournit un nouveau modèle théorique et une nouvelle méthode d'optimisation pour l'optimisation de l'AoI dans l'IoV
  2. Valeur pratique: Peut servir de référence pour l'élaboration de normes 5G/6G pour les réseaux véhiculaires et la conception de systèmes
  3. Inspiration méthodologique: L'application du LLM à l'optimisation des réseaux peut inspirer davantage de recherches connexes

Scénarios Applicables

  • Optimisation des paramètres des systèmes IoV sur autoroute
  • Configuration des paramètres SPS du Mode 2 5G NR V2X
  • Problèmes d'optimisation de réseau nécessitant la considération du couplage multi-factoriel
  • Systèmes de communication en temps réel sensibles à l'AoI

Références Bibliographiques

Cet article cite 20 références connexes, couvrant principalement:

  • Recherche fondamentale sur l'IoV et la communication V2X
  • Mécanisme SPS et optimisation des paramètres
  • Théorie et applications de l'AoI
  • Méthodes d'apprentissage par renforcement profond
  • Applications des grands modèles de langage

Évaluation Globale: Cet article propose une solution innovante à un problème important dans les réseaux véhiculaires, avec certaines contributions tant dans la modélisation théorique que dans la conception méthodologique. L'application du LLM à l'optimisation des réseaux présente une certaine nouveauté, mais son efficacité et son applicabilité pratique nécessitent une vérification supplémentaire dans des scénarios plus complexes.