2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.

Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.

academic

Analyse et Optimisation de l'Intervalle de Réservation de Ressources Consciente de la Vélocité et de la Densité pour la Minimisation de l'AoI dans l'IoV SPS

Informations Fondamentales

ID de l'article: 2510.08911
Titre: Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS
Auteurs: Maoxin Ji, Tong Wang, Qiong Wu, Pingyi Fan, Nan Cheng, Wen Chen
Classification: cs.LG cs.NI
Journal de Publication: IEEE Communications Letters, VOL. XX, NO. XX, MAY 2025
Lien de l'article: https://arxiv.org/abs/2510.08911
Code source: https://github.com/qiongwu86/AI-Based-IoV-Resource-Scheduling-SPS-Parameter-Optimization-for-AoI-Minimization

Résumé

Cet article aborde le problème de la dégradation de l'Âge de l'Information (AoI) dans la planification semi-persistante (SPS) des réseaux véhiculaires (IoV), causée par les collisions de paquets et l'incertitude des canaux liée à la vélocité des véhicules. Les auteurs proposent une méthode d'optimisation basée sur les Grands Modèles de Langage (LLM) et le Gradient de Politique Déterministe Profond (DDPG). Un modèle de calcul de l'AoI est d'abord établi, tenant compte de la vélocité des véhicules, de la densité des véhicules et de l'Intervalle de Réservation de Ressources (RRI). Une stratégie d'optimisation à double voie est ensuite conçue, où le DDPG est guidé par l'espace d'état et la fonction de récompense, tandis que le LLM utilise l'apprentissage contextuel pour générer des configurations de paramètres optimales. Les résultats expérimentaux montrent que le LLM peut réduire significativement l'AoI après l'accumulation d'un petit nombre d'échantillons sans nécessiter d'entraînement du modèle, tandis que la méthode DDPG réalise des performances plus stables après l'entraînement.

Contexte et Motivation de la Recherche

Définition du Problème

L'Internet des Véhicules (IoV) constitue une technologie centrale des systèmes de transport intelligents. Dans ce contexte, la communication véhicule-à-véhicule (V2V) doit transmettre des messages de sécurité de base critiques (BSM). Dans la norme 5G NR V2X, la communication V2V utilise généralement le Mode 2 pour la sélection autonome des ressources, en employant la planification semi-persistante (SPS) pour concourir et occuper les ressources.

Problèmes Fondamentaux

Limitations de la SPS traditionnelle: La SPS existante dépend de paramètres fixes basés sur l'expérience (tels que le RRI), ce qui peut entraîner des performances sous-optimales sous différentes densités de véhicules
Dégradation des performances d'AoI: Les collisions de paquets et les défaillances de transmission continues réduisent significativement les performances d'AoI
Couplage multi-factoriel: Il existe des relations de couplage non-linéaires complexes entre la vélocité des véhicules, la densité et le RRI

Motivation de la Recherche

Les véhicules à haute vélocité (particulièrement en circulation opposée) produisent un décalage Doppler significatif, pouvant entraîner des défaillances de transmission supplémentaires
En l'absence de configuration d'un canal de rétroaction physique de sélection (PSFCH), les messages de diffusion tels que les BSM utilisent généralement la retransmission aveugle
Il est nécessaire de considérer simultanément la vélocité et la densité des véhicules pour optimiser la sélection du RRI et améliorer les performances de communication

Contributions Principales

Établissement d'un modèle AoI compréhensif: Proposition d'un modèle de calcul de l'AoI tenant compte simultanément de la vélocité des véhicules, de la densité des véhicules et de l'influence du RRI, intégrant l'incertitude des conditions de canal physique et la probabilité de collision des ressources
Cadre d'optimisation à double voie: Conception d'une stratégie d'optimisation double basée sur le LLM et le DDPG, où le LLM utilise l'apprentissage contextuel pour une convergence rapide, tandis que le DDPG fournit une exploration stable de l'espace continu
Modélisation de canal consciente de la vélocité: Intégration de l'effet Doppler causé par la vélocité des véhicules dans le modèle de canal de Markov, caractérisant avec précision la probabilité de défaillance de transmission dans les scénarios à haute vélocité
Validation expérimentale: Vérification par simulation que l'optimisation conjointe de la densité des véhicules, du RRI et de la vélocité des véhicules réduit significativement l'AoI du système IoV

Détails de la Méthode

Définition de la Tâche

Entrées: Vélocité des véhicules v, densité des véhicules ρ, Intervalle de Réservation de Ressources RRI
Sorties: Configuration de paramètres optimale minimisant l'AoI du système
Contraintes: Relation vélocité-densité sous flux de trafic fixe Q: ρ = Q/v

Modèle du Système

1. Topologie du Réseau

Considération d'un segment d'autoroute fini de longueur 2L, comprenant deux voies en sens opposé. Le nombre total de véhicules est:

mtotal = 2ρlL

2. Modèle de Probabilité de Collision

La probabilité de collision de paquets du véhicule n est:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

où Nr est le nombre maximal de RBG sélectionnables dans la fenêtre de sélection, et Ns est le nombre de véhicules dans la plage de détection.

3. Modélisation de l'État du Canal

Modélisation de l'état du canal basée sur un processus de Markov, tenant compte de l'influence du décalage Doppler fd = fcv/c:

Probabilités de transition d'état pp (maintien d'un état dégradé) et pi (maintien d'un état idéal)
Calcul récursif de la probabilité globale de perte de paquets pd

4. Modèle de Calcul de l'AoI

L'AoI du système est exprimé comme la somme du délai d'attente et du délai de transmission:

A = Tq + Tt

Le délai d'attente Tq tient compte de l'effet combiné des retransmissions dues aux collisions et des défaillances de canal:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

Stratégies d'Optimisation

1. Méthode DDPG

Modélisation du problème comme un Processus de Décision Markovien (MDP):

Espace d'état: st = vt, ρt, RRIt, pd,t, Pcoll,t
Espace d'action: at = RRIt+1, vt+1
Fonction de récompense: Conception d'une fonction de récompense par segments, accordant des pentes de récompense différentes pour différents intervalles d'AoI

Utilisation d'une architecture Actor-Critic:

Réseau Actor: μ(st|θμ) produisant une action déterministe
Réseau Critic: Q(st,at|θQ) évaluant la valeur état-action
Réseaux cibles et relecture d'expérience améliorant la stabilité de l'entraînement

2. Méthode LLM

Conception d'une structure d'invite en cinq parties:

Contexte de la tâche: Explication de la composition de l'AoI et des facteurs d'influence
Objectif de la tâche: Clarification de l'objectif de minimisation de l'AoI du système
Tâche principale: Définition du rôle du LLM en tant qu'algorithme d'optimisation
Format de sortie: Présentation standardisée des résultats
Ensemble d'exemples: Fourniture de sélections de paramètres représentatifs et des valeurs d'AoI correspondantes

Cadre algorithmique du LLM:

Raisonnement multi-étapes générant plusieurs résultats de sortie
Simulateur d'environnement calculant l'AoI pour obtenir la solution optimale actuelle
Élimination des expériences dupliquées, ajout des expériences valides à l'ensemble des décisions historiques
Détermination de la convergence lorsque plusieurs raisonnements ne montrent pas d'amélioration significative

Configuration Expérimentale

Paramètres de Simulation

Scénario: Voies bidirectionnelles d'autoroute
Flux de trafic: 6000 véhicules/heure (fixe)
Plage de RRI: 10-100 ms
Plage de densité de véhicules: 50-200 véhicules/km
Plage de vélocité: 30-120 km/h
Longueur d'autoroute: 2L (L étant la demi-longueur)

Indicateurs d'Évaluation

Indicateur principal: AoI moyen du système
Convergence: Tendance de variation de l'AoI au cours de 50 cycles d'entraînement

Méthodes de Comparaison

Méthode LLM: Trois différents grands modèles de langage
Algorithme DDPG: Gradient de Politique Déterministe Profond
Algorithme Génétique: Méthode d'optimisation traditionnelle
Solution Optimale: Valeur théorique optimale obtenue par recherche exhaustive

Résultats Expérimentaux

Résultats Principaux

1. Influence de la Vélocité des Véhicules sur l'AoI (Figure 3a)

Basse vélocité (haute densité): L'augmentation de l'AoI est principalement causée par la probabilité élevée de collision de paquets lors de la sélection des ressources SPS
Haute vélocité (basse densité): Bien que les collisions soient moins fréquentes, la dégradation sévère du canal Doppler augmente le taux de défaillance de la couche physique
Influence du RRI:
- Avec un RRI élevé, la probabilité de collision est négligeable, et l'AoI augmente progressivement avec la vélocité
- Avec un RRI faible, les collisions dominent, et l'AoI atteint un pic à basse vélocité avant de diminuer avec l'augmentation de la vélocité

2. Influence du RRI sur l'AoI (Figure 3b)

Basse vélocité (haute densité): À faible valeur de RRI, la probabilité de collision élevée entraîne un AoI plus important, la relation devenant linéaire avec l'augmentation du RRI
Haute vélocité (basse densité): L'augmentation de la probabilité de perte de paquets du canal entraîne une augmentation plus rapide de l'AoI avec le RRI

3. Comparaison des Performances des Différentes Méthodes (Figure 3c)

Méthode LLM:
- Au stade initial, l'AoI fluctue considérablement en raison de l'exploration de différentes combinaisons de paramètres
- Grâce aux exemples représentatifs inclus dans l'invite, elle possède une bonne solution initiale
- Converge rapidement avec seulement quelques itérations
Algorithme DDPG:
- Nécessite plus d'étapes d'exploration et d'ajustement des paramètres du réseau
- Offre des performances plus stables après l'entraînement
Algorithme Génétique: La vitesse de convergence se situe entre le LLM et le DDPG

Découvertes Clés

Couplage des trois facteurs vélocité-densité-RRI: L'optimisation conjointe surpasse significativement l'optimisation mono-factorielle
Convergence rapide du LLM: L'apprentissage contextuel basé sur des exemples converge rapidement sans nécessiter d'entraînement en ligne
Stabilité du DDPG: Bien que la convergence soit plus lente, il montre des performances plus stables dans l'exploration de l'espace continu
Importance de l'effet Doppler: L'influence des conditions de canal sur l'AoI est inévitable dans les scénarios à haute vélocité

Travaux Connexes

Recherche sur l'Optimisation de la SPS

Méthodes traditionnelles: Principalement axées sur l'influence de la densité des véhicules sur la sélection du RRI
Schémas adaptatifs: Ajustement dynamique du compteur de resélection des ressources (RC) et du RRI basé sur la disponibilité du canal
Analyse de l'AoI: Étude de l'influence de l'occupation continue des ressources en SPS sur l'AoI du système

Points d'Innovation de cet Article

Modélisation multi-factorielle: Première considération simultanée de l'effet de couplage de la vélocité, de la densité et du RRI
Optimisation par IA: Introduction d'une stratégie d'optimisation à double voie utilisant le LLM et le DDPG
Modélisation du canal: Intégration de l'effet Doppler dans le modèle de canal de Markov

Conclusions et Discussion

Conclusions Principales

Validité du modèle: Le modèle d'AoI établi reflète avec précision l'effet combiné de la vélocité des véhicules, de la densité et du RRI
Efficacité de l'optimisation: L'optimisation conjointe réduit significativement l'AoI du système IoV
Comparaison des méthodes: La méthode LLM converge rapidement mais nécessite de bons exemples, tandis que la méthode DDPG est stable mais nécessite un entraînement

Limitations

Restriction du scénario: Considération limitée aux scénarios d'autoroutes bidirectionnelles
Hypothèses: Hypothèses d'une distribution uniforme des véhicules et d'un flux de trafic fixe
Modèle de canal: Le modèle de canal de Markov simplifié peut ne pas refléter complètement l'environnement de canal complexe réel
Dépendance au LLM: La méthode LLM dépend de la qualité des exemples et de la conception des invites

Directions Futures

Ajustement fin léger: Conception de schémas d'ajustement fin léger du LLM pour réduire la dépendance aux exemples
Déploiement en temps réel: Intégration du moteur d'optimisation dans les unités routières C-V2X pour la configuration dynamique du RRI
Scénarios multi-stations de base: Considération de scénarios multi-stations de base pour résoudre les pics d'AoI causés par les changements de signal
Scénarios plus complexes: Extension aux routes urbaines, carrefours et autres environnements de trafic plus complexes

Évaluation Approfondie

Points Forts

Importance du problème: Aborde un problème important d'optimisation de l'AoI dans l'IoV, avec une valeur d'application pratique
Modélisation complète: Considération globale de l'effet de couplage de multiples facteurs tels que les collisions, les défaillances de canal et les retransmissions aveugles
Innovation méthodologique: Première introduction du LLM dans l'optimisation des paramètres IoV, offrant une nouvelle perspective de résolution
Expérimentation suffisante: Vérification de l'efficacité de la méthode par simulation multi-angle

Insuffisances

Limitation du scénario: Considération limitée aux scénarios d'autoroute, l'applicabilité aux environnements routiers urbains complexes reste à vérifier
Hypothèses du modèle: Les hypothèses telles que la distribution uniforme des véhicules sont trop idéalisées
Interprétabilité du LLM: Le processus de décision du LLM manque d'interprétabilité, rendant difficile la compréhension de son mécanisme d'optimisation
Considération du temps réel: Discussion insuffisante de la complexité computationnelle et des exigences de temps réel dans le déploiement pratique

Impact

Contribution académique: Fournit un nouveau modèle théorique et une nouvelle méthode d'optimisation pour l'optimisation de l'AoI dans l'IoV
Valeur pratique: Peut servir de référence pour l'élaboration de normes 5G/6G pour les réseaux véhiculaires et la conception de systèmes
Inspiration méthodologique: L'application du LLM à l'optimisation des réseaux peut inspirer davantage de recherches connexes

Scénarios Applicables

Optimisation des paramètres des systèmes IoV sur autoroute
Configuration des paramètres SPS du Mode 2 5G NR V2X
Problèmes d'optimisation de réseau nécessitant la considération du couplage multi-factoriel
Systèmes de communication en temps réel sensibles à l'AoI

Références Bibliographiques

Cet article cite 20 références connexes, couvrant principalement:

Recherche fondamentale sur l'IoV et la communication V2X
Mécanisme SPS et optimisation des paramètres
Théorie et applications de l'AoI
Méthodes d'apprentissage par renforcement profond
Applications des grands modèles de langage

Évaluation Globale: Cet article propose une solution innovante à un problème important dans les réseaux véhiculaires, avec certaines contributions tant dans la modélisation théorique que dans la conception méthodologique. L'application du LLM à l'optimisation des réseaux présente une certaine nouveauté, mais son efficacité et son applicabilité pratique nécessitent une vérification supplémentaire dans des scénarios plus complexes.