2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.
Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.
academic

Análisis de RRI Consciente de Velocidad y Densidad y Optimización para Minimización de AoI en IoV SPS

Información Básica

Resumen

Este artículo aborda el problema de la degradación de la Edad de la Información (AoI) en la Programación Semipersistente (SPS) de redes vehiculares (IoV) causada por colisiones de paquetes e incertidumbre de canal relacionada con la velocidad del vehículo. Se propone un método de optimización basado en Modelos de Lenguaje Grande (LLM) y Gradiente de Política Determinista Profunda (DDPG). Primero, se establece un modelo de cálculo de AoI influenciado por la velocidad del vehículo, la densidad vehicular y el Intervalo de Reserva de Recursos (RRI). Posteriormente, se diseña un esquema de optimización de doble vía. DDPG se guía mediante el espacio de estados y la función de recompensa, mientras que LLM utiliza aprendizaje en contexto para generar configuraciones de parámetros óptimos. Los resultados experimentales demuestran que LLM puede reducir significativamente el AoI después de acumular pocas muestras sin necesidad de entrenamiento del modelo, mientras que el método DDPG logra un desempeño más estable después del entrenamiento.

Antecedentes de Investigación y Motivación

Definición del Problema

La red vehicular (IoV) como tecnología central de los sistemas de transporte inteligente requiere que la comunicación vehículo-a-vehículo (V2V) transmita mensajes de seguridad básicos críticos (BSM). En el estándar 5G NR V2X, la comunicación V2V generalmente utiliza el Modo 2 para selección autónoma de recursos, empleando Programación Semipersistente (SPS) para competir y ocupar recursos.

Problemas Centrales

  1. Limitaciones del SPS Tradicional: El SPS existente depende de parámetros fijos basados en experiencia (como RRI), lo que puede conducir a un desempeño subóptimo bajo diferentes densidades vehiculares
  2. Degradación del Desempeño de AoI: Las colisiones de paquetes y los fallos de transmisión continua reducen significativamente el desempeño de AoI
  3. Acoplamiento Multifactorial: Existe una relación no lineal compleja entre la velocidad del vehículo, la densidad y el RRI

Motivación de la Investigación

  • Los vehículos de alta velocidad (especialmente en dirección opuesta) producen desplazamientos Doppler significativos, que pueden causar fallos de transmisión adicionales
  • Sin la configuración del canal de retroalimentación de enlace físico lateral (PSFCH), los mensajes de difusión como BSM generalmente utilizan retransmisión ciega
  • Es necesario considerar simultáneamente la velocidad y densidad vehicular para optimizar la selección de RRI y mejorar el desempeño de comunicación

Contribuciones Principales

  1. Establecimiento de Modelo AoI Integral: Se propone un modelo de cálculo de AoI que considera simultáneamente los efectos de la velocidad vehicular, densidad vehicular e intervalo RRI, integrando la incertidumbre de las condiciones del canal físico y la probabilidad de colisión de recursos
  2. Marco de Optimización de Doble Vía: Se diseña una estrategia de optimización dual basada en LLM y DDPG, donde LLM utiliza aprendizaje en contexto para convergencia rápida y DDPG proporciona exploración estable en espacio continuo
  3. Modelado de Canal Consciente de Velocidad: Se incorpora el efecto Doppler causado por la velocidad vehicular en el modelo de canal de Markov, caracterizando con precisión la probabilidad de fallo de transmisión en escenarios de alta velocidad
  4. Verificación Experimental: Se verifica mediante simulación que la optimización conjunta de densidad vehicular, RRI y velocidad vehicular reduce significativamente el AoI del sistema IoV

Explicación Detallada de Métodos

Definición de Tareas

Entrada: Velocidad vehicular v, densidad vehicular ρ, Intervalo de Reserva de Recursos RRI
Salida: Configuración de parámetros óptima que minimiza el AoI del sistema
Restricciones: Relación velocidad-densidad bajo flujo de tráfico fijo Q: ρ = Q/v

Modelo del Sistema

1. Topología de Red

Se considera un segmento de autopista finita de longitud 2L con dos carriles en dirección opuesta. El número total de vehículos es:

mtotal = 2ρlL

2. Modelo de Probabilidad de Colisión

La probabilidad de colisión de paquetes del vehículo n es:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

donde Nr es el número máximo de RBG seleccionables dentro de la ventana de selección y Ns es el número de vehículos dentro del rango de detección.

3. Modelado del Estado del Canal

Se modela el estado del canal basado en procesos de Markov, considerando el efecto del desplazamiento Doppler fd = fcv/c:

  • Probabilidades de transición de estado pp (mantener estado degradado) y pi (mantener estado ideal)
  • Cálculo recursivo de la probabilidad general de pérdida de paquetes pd

4. Modelo de Cálculo de AoI

El AoI del sistema se expresa como la suma del retardo de cola y retardo de transmisión:

A = Tq + Tt

El retardo de cola Tq considera el efecto combinado de retransmisión por colisión y fallo de canal:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

Estrategias de Optimización

1. Método DDPG

Se modela el problema como un Proceso de Decisión de Markov (MDP):

  • Espacio de Estados: st = vt, ρt, RRIt, pd,t, Pcoll,t
  • Espacio de Acciones: at = RRIt+1, vt+1
  • Función de Recompensa: Se diseña una función de recompensa por segmentos que proporciona diferentes pendientes de recompensa para diferentes intervalos de AoI

Se adopta arquitectura Actor-Crítico:

  • Red Actor: μ(st|θμ) genera acciones deterministas
  • Red Crítico: Q(st,at|θQ) evalúa el valor estado-acción
  • Redes objetivo y reproducción de experiencia mejoran la estabilidad del entrenamiento

2. Método LLM

Se diseña una estructura de indicación de cinco partes:

  1. Contexto de Tarea: Explicar la composición de AoI y factores influyentes
  2. Objetivo de Tarea: Aclarar el objetivo de minimizar el AoI del sistema
  3. Tarea Principal: Definir el rol de LLM como algoritmo de optimización
  4. Formato de Salida: Presentación de resultados estandarizada
  5. Conjunto de Ejemplos: Proporcionar selecciones de parámetros representativos y valores de AoI correspondientes

Marco del algoritmo LLM:

  • Razonamiento multietapa para generar múltiples resultados de salida
  • El simulador ambiental calcula AoI para obtener la solución óptima actual
  • Se excluyen experiencias duplicadas y se agregan experiencias válidas al conjunto de decisiones históricas
  • Se determina convergencia cuando múltiples razonamientos no muestran mejora significativa

Configuración Experimental

Parámetros de Simulación

  • Escenario: Autopista con carriles bidireccionales
  • Flujo de Tráfico: 6000 vehículos/hora (fijo)
  • Rango de RRI: 10-100 ms
  • Rango de Densidad Vehicular: 50-200 vehículos/kilómetro
  • Rango de Velocidad: 30-120 km/h
  • Longitud de Autopista: 2L (L es la media longitud)

Indicadores de Evaluación

  • Indicador Principal: AoI promedio del sistema
  • Convergencia: Tendencia de cambio de AoI dentro de 50 rondas de entrenamiento

Métodos de Comparación

  1. Método LLM: Tres modelos de lenguaje grandes diferentes
  2. Algoritmo DDPG: Gradiente de Política Determinista Profunda
  3. Algoritmo Genético: Método de optimización tradicional
  4. Solución Óptima: Valor teórico óptimo obtenido mediante búsqueda exhaustiva

Resultados Experimentales

Resultados Principales

1. Impacto de la Velocidad Vehicular en AoI (Figura 3a)

  • Baja Velocidad (Alta Densidad): El aumento de AoI se debe principalmente a la alta probabilidad de colisión de paquetes en la selección de recursos SPS
  • Alta Velocidad (Baja Densidad): Aunque hay menos colisiones, la degradación severa del canal Doppler aumenta la tasa de fallo de capa física
  • Impacto de RRI:
    • Con RRI grande, la probabilidad de colisión es despreciable y el AoI aumenta gradualmente con la velocidad
    • Con RRI pequeño, la colisión es dominante y el AoI alcanza su pico a baja velocidad, luego disminuye con el aumento de velocidad

2. Impacto de RRI en AoI (Figura 3b)

  • Baja Velocidad (Alta Densidad): Con valores de RRI bajos, la alta probabilidad de colisión resulta en AoI mayor, con relación tendiendo a lineal conforme aumenta RRI
  • Alta Velocidad (Baja Densidad): La probabilidad de pérdida de paquetes del canal aumenta, con AoI creciendo más rápidamente con RRI

3. Comparación de Desempeño de Diferentes Métodos (Figura 3c)

  • Método LLM:
    • Inicialmente, el AoI fluctúa significativamente debido a la exploración de diferentes combinaciones de parámetros
    • Debido a ejemplos representativos incluidos en la indicación, tiene una solución inicial relativamente buena
    • Converge rápidamente con solo pocas iteraciones
  • Algoritmo DDPG:
    • Requiere más pasos de exploración y ajuste de parámetros de red
    • El desempeño es más estable después del entrenamiento
  • Algoritmo Genético: La velocidad de convergencia se sitúa entre LLM y DDPG

Hallazgos Clave

  1. Acoplamiento de Tres Factores Velocidad-Densidad-RRI: La optimización conjunta es significativamente superior a la optimización de factor único
  2. Convergencia Rápida de LLM: El aprendizaje en contexto basado en ejemplos converge rápidamente sin necesidad de entrenamiento en línea
  3. Estabilidad de DDPG: Aunque converge más lentamente, muestra mejor desempeño en exploración de espacio continuo
  4. Importancia del Efecto Doppler: El impacto de las condiciones del canal en AoI en escenarios de alta velocidad no puede ignorarse

Trabajo Relacionado

Investigación de Optimización de SPS

  • Métodos Tradicionales: Se enfoca principalmente en la influencia de la densidad vehicular en la selección de RRI
  • Esquemas Adaptativos: Ajuste dinámico del contador de reselección de recursos (RC) y RRI basado en disponibilidad de canal
  • Análisis de AoI: Investigación del impacto de la ocupación continua de recursos en SPS en el AoI del sistema

Puntos de Innovación de Este Artículo

  1. Modelado Multifactorial: Primera consideración simultánea del acoplamiento de velocidad, densidad e RRI
  2. Optimización con IA: Introducción de estrategia de optimización de doble vía con LLM y DDPG
  3. Modelado de Canal: Incorporación del efecto Doppler en el modelo de canal de Markov

Conclusiones y Discusión

Conclusiones Principales

  1. Validez del Modelo: El modelo de AoI establecido refleja con precisión el impacto combinado de velocidad vehicular, densidad e RRI
  2. Efecto de Optimización: La optimización conjunta puede reducir significativamente el AoI del sistema IoV
  3. Comparación de Métodos: El método LLM converge rápidamente pero requiere buenos ejemplos; el método DDPG es estable pero requiere entrenamiento

Limitaciones

  1. Restricción de Escenario: Solo considera escenarios de autopista con carriles bidireccionales
  2. Condiciones de Supuesto: Supone distribución uniforme de vehículos y flujo de tráfico fijo
  3. Modelo de Canal: El modelo de canal de Markov simplificado puede no reflejar completamente el entorno de canal complejo real
  4. Dependencia de LLM: El método LLM depende de ejemplos de alta calidad y diseño de indicaciones

Direcciones Futuras

  1. Ajuste Fino Ligero: Diseñar esquema de ajuste fino ligero de LLM para reducir la dependencia de ejemplos
  2. Despliegue en Tiempo Real: Integrar el motor de optimización en unidades de carretera C-V2X para configuración dinámica de RRI
  3. Escenario Multibase: Considerar escenarios de múltiples estaciones base para resolver picos de AoI causados por cambio de señal
  4. Escenarios Más Complejos: Extender a carreteras urbanas, intersecciones y otros escenarios de tráfico más complejos

Evaluación Profunda

Ventajas

  1. Importancia del Problema: Aborda el importante problema de optimización de AoI en IoV con valor de aplicación práctica
  2. Modelado Integral: Considera comprehensivamente el acoplamiento de múltiples factores incluyendo colisión, fallo de canal y retransmisión ciega
  3. Innovación de Método: Primera introducción de LLM en optimización de parámetros de IoV, proporcionando nuevas perspectivas de solución
  4. Experimentación Suficiente: Verifica la efectividad del método mediante simulación desde múltiples ángulos

Insuficiencias

  1. Limitación de Escenario: Solo considera escenarios de autopista; la aplicabilidad a entornos complejos de carreteras urbanas requiere verificación
  2. Supuestos del Modelo: Supuestos como distribución uniforme de vehículos son demasiado idealizados
  3. Interpretabilidad de LLM: El proceso de decisión de LLM carece de interpretabilidad, dificultando la comprensión de su mecanismo de optimización
  4. Consideración de Tiempo Real: No se discute suficientemente la complejidad computacional y requisitos de tiempo real en despliegue real

Impacto

  1. Contribución Académica: Proporciona nuevo modelo teórico y método de optimización para optimización de AoI en IoV
  2. Valor Práctico: Puede proporcionar referencia para formulación de estándares de red vehicular 5G/6G y diseño de sistemas
  3. Inspiración de Método: La aplicación de LLM en optimización de red puede inspirar más investigación relacionada

Escenarios Aplicables

  • Optimización de parámetros de sistemas de red vehicular en autopistas
  • Configuración de parámetros SPS en 5G NR V2X Modo 2
  • Problemas de optimización de red que requieren consideración de acoplamiento multifactorial
  • Sistemas de comunicación en tiempo real sensibles a AoI

Referencias

Este artículo cita 20 referencias relacionadas, cubriendo principalmente:

  • Investigación fundamental de IoV y comunicación V2X
  • Mecanismo SPS y optimización de parámetros
  • Teoría y aplicación de AoI
  • Métodos de aprendizaje por refuerzo profundo
  • Aplicaciones de modelos de lenguaje grande

Evaluación General: Este artículo propone soluciones innovadoras para problemas importantes en redes vehiculares, con contribuciones tanto en modelado teórico como en diseño de métodos. La aplicación de LLM en optimización de red tiene cierta novedad, pero aún requiere verificación adicional de su efectividad y practicidad en escenarios más complejos.