2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.

Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.

academic

Análisis de RRI Consciente de Velocidad y Densidad y Optimización para Minimización de AoI en IoV SPS

Información Básica

ID del Artículo: 2510.08911
Título: Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS
Autores: Maoxin Ji, Tong Wang, Qiong Wu, Pingyi Fan, Nan Cheng, Wen Chen
Clasificación: cs.LG cs.NI
Revista Publicada: IEEE Communications Letters, VOL. XX, NO. XX, MAY 2025
Enlace del Artículo: https://arxiv.org/abs/2510.08911
Código Fuente: https://github.com/qiongwu86/AI-Based-IoV-Resource-Scheduling-SPS-Parameter-Optimization-for-AoI-Minimization

Resumen

Este artículo aborda el problema de la degradación de la Edad de la Información (AoI) en la Programación Semipersistente (SPS) de redes vehiculares (IoV) causada por colisiones de paquetes e incertidumbre de canal relacionada con la velocidad del vehículo. Se propone un método de optimización basado en Modelos de Lenguaje Grande (LLM) y Gradiente de Política Determinista Profunda (DDPG). Primero, se establece un modelo de cálculo de AoI influenciado por la velocidad del vehículo, la densidad vehicular y el Intervalo de Reserva de Recursos (RRI). Posteriormente, se diseña un esquema de optimización de doble vía. DDPG se guía mediante el espacio de estados y la función de recompensa, mientras que LLM utiliza aprendizaje en contexto para generar configuraciones de parámetros óptimos. Los resultados experimentales demuestran que LLM puede reducir significativamente el AoI después de acumular pocas muestras sin necesidad de entrenamiento del modelo, mientras que el método DDPG logra un desempeño más estable después del entrenamiento.

Antecedentes de Investigación y Motivación

Definición del Problema

La red vehicular (IoV) como tecnología central de los sistemas de transporte inteligente requiere que la comunicación vehículo-a-vehículo (V2V) transmita mensajes de seguridad básicos críticos (BSM). En el estándar 5G NR V2X, la comunicación V2V generalmente utiliza el Modo 2 para selección autónoma de recursos, empleando Programación Semipersistente (SPS) para competir y ocupar recursos.

Problemas Centrales

Limitaciones del SPS Tradicional: El SPS existente depende de parámetros fijos basados en experiencia (como RRI), lo que puede conducir a un desempeño subóptimo bajo diferentes densidades vehiculares
Degradación del Desempeño de AoI: Las colisiones de paquetes y los fallos de transmisión continua reducen significativamente el desempeño de AoI
Acoplamiento Multifactorial: Existe una relación no lineal compleja entre la velocidad del vehículo, la densidad y el RRI

Motivación de la Investigación

Los vehículos de alta velocidad (especialmente en dirección opuesta) producen desplazamientos Doppler significativos, que pueden causar fallos de transmisión adicionales
Sin la configuración del canal de retroalimentación de enlace físico lateral (PSFCH), los mensajes de difusión como BSM generalmente utilizan retransmisión ciega
Es necesario considerar simultáneamente la velocidad y densidad vehicular para optimizar la selección de RRI y mejorar el desempeño de comunicación

Contribuciones Principales

Establecimiento de Modelo AoI Integral: Se propone un modelo de cálculo de AoI que considera simultáneamente los efectos de la velocidad vehicular, densidad vehicular e intervalo RRI, integrando la incertidumbre de las condiciones del canal físico y la probabilidad de colisión de recursos
Marco de Optimización de Doble Vía: Se diseña una estrategia de optimización dual basada en LLM y DDPG, donde LLM utiliza aprendizaje en contexto para convergencia rápida y DDPG proporciona exploración estable en espacio continuo
Modelado de Canal Consciente de Velocidad: Se incorpora el efecto Doppler causado por la velocidad vehicular en el modelo de canal de Markov, caracterizando con precisión la probabilidad de fallo de transmisión en escenarios de alta velocidad
Verificación Experimental: Se verifica mediante simulación que la optimización conjunta de densidad vehicular, RRI y velocidad vehicular reduce significativamente el AoI del sistema IoV

Explicación Detallada de Métodos

Definición de Tareas

Entrada: Velocidad vehicular v, densidad vehicular ρ, Intervalo de Reserva de Recursos RRI
Salida: Configuración de parámetros óptima que minimiza el AoI del sistema
Restricciones: Relación velocidad-densidad bajo flujo de tráfico fijo Q: ρ = Q/v

Modelo del Sistema

1. Topología de Red

Se considera un segmento de autopista finita de longitud 2L con dos carriles en dirección opuesta. El número total de vehículos es:

mtotal = 2ρlL

2. Modelo de Probabilidad de Colisión

La probabilidad de colisión de paquetes del vehículo n es:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

donde Nr es el número máximo de RBG seleccionables dentro de la ventana de selección y Ns es el número de vehículos dentro del rango de detección.

3. Modelado del Estado del Canal

Se modela el estado del canal basado en procesos de Markov, considerando el efecto del desplazamiento Doppler fd = fcv/c:

Probabilidades de transición de estado pp (mantener estado degradado) y pi (mantener estado ideal)
Cálculo recursivo de la probabilidad general de pérdida de paquetes pd

4. Modelo de Cálculo de AoI

El AoI del sistema se expresa como la suma del retardo de cola y retardo de transmisión:

A = Tq + Tt

El retardo de cola Tq considera el efecto combinado de retransmisión por colisión y fallo de canal:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

Estrategias de Optimización

1. Método DDPG

Se modela el problema como un Proceso de Decisión de Markov (MDP):

Espacio de Estados: st = vt, ρt, RRIt, pd,t, Pcoll,t
Espacio de Acciones: at = RRIt+1, vt+1
Función de Recompensa: Se diseña una función de recompensa por segmentos que proporciona diferentes pendientes de recompensa para diferentes intervalos de AoI

Se adopta arquitectura Actor-Crítico:

Red Actor: μ(st|θμ) genera acciones deterministas
Red Crítico: Q(st,at|θQ) evalúa el valor estado-acción
Redes objetivo y reproducción de experiencia mejoran la estabilidad del entrenamiento

2. Método LLM

Se diseña una estructura de indicación de cinco partes:

Contexto de Tarea: Explicar la composición de AoI y factores influyentes
Objetivo de Tarea: Aclarar el objetivo de minimizar el AoI del sistema
Tarea Principal: Definir el rol de LLM como algoritmo de optimización
Formato de Salida: Presentación de resultados estandarizada
Conjunto de Ejemplos: Proporcionar selecciones de parámetros representativos y valores de AoI correspondientes

Marco del algoritmo LLM:

Razonamiento multietapa para generar múltiples resultados de salida
El simulador ambiental calcula AoI para obtener la solución óptima actual
Se excluyen experiencias duplicadas y se agregan experiencias válidas al conjunto de decisiones históricas
Se determina convergencia cuando múltiples razonamientos no muestran mejora significativa

Configuración Experimental

Parámetros de Simulación

Escenario: Autopista con carriles bidireccionales
Flujo de Tráfico: 6000 vehículos/hora (fijo)
Rango de RRI: 10-100 ms
Rango de Densidad Vehicular: 50-200 vehículos/kilómetro
Rango de Velocidad: 30-120 km/h
Longitud de Autopista: 2L (L es la media longitud)

Indicadores de Evaluación

Indicador Principal: AoI promedio del sistema
Convergencia: Tendencia de cambio de AoI dentro de 50 rondas de entrenamiento

Métodos de Comparación

Método LLM: Tres modelos de lenguaje grandes diferentes
Algoritmo DDPG: Gradiente de Política Determinista Profunda
Algoritmo Genético: Método de optimización tradicional
Solución Óptima: Valor teórico óptimo obtenido mediante búsqueda exhaustiva

Resultados Experimentales

Resultados Principales

1. Impacto de la Velocidad Vehicular en AoI (Figura 3a)

Baja Velocidad (Alta Densidad): El aumento de AoI se debe principalmente a la alta probabilidad de colisión de paquetes en la selección de recursos SPS
Alta Velocidad (Baja Densidad): Aunque hay menos colisiones, la degradación severa del canal Doppler aumenta la tasa de fallo de capa física
Impacto de RRI:
- Con RRI grande, la probabilidad de colisión es despreciable y el AoI aumenta gradualmente con la velocidad
- Con RRI pequeño, la colisión es dominante y el AoI alcanza su pico a baja velocidad, luego disminuye con el aumento de velocidad

2. Impacto de RRI en AoI (Figura 3b)

Baja Velocidad (Alta Densidad): Con valores de RRI bajos, la alta probabilidad de colisión resulta en AoI mayor, con relación tendiendo a lineal conforme aumenta RRI
Alta Velocidad (Baja Densidad): La probabilidad de pérdida de paquetes del canal aumenta, con AoI creciendo más rápidamente con RRI

3. Comparación de Desempeño de Diferentes Métodos (Figura 3c)

Método LLM:
- Inicialmente, el AoI fluctúa significativamente debido a la exploración de diferentes combinaciones de parámetros
- Debido a ejemplos representativos incluidos en la indicación, tiene una solución inicial relativamente buena
- Converge rápidamente con solo pocas iteraciones
Algoritmo DDPG:
- Requiere más pasos de exploración y ajuste de parámetros de red
- El desempeño es más estable después del entrenamiento
Algoritmo Genético: La velocidad de convergencia se sitúa entre LLM y DDPG

Hallazgos Clave

Acoplamiento de Tres Factores Velocidad-Densidad-RRI: La optimización conjunta es significativamente superior a la optimización de factor único
Convergencia Rápida de LLM: El aprendizaje en contexto basado en ejemplos converge rápidamente sin necesidad de entrenamiento en línea
Estabilidad de DDPG: Aunque converge más lentamente, muestra mejor desempeño en exploración de espacio continuo
Importancia del Efecto Doppler: El impacto de las condiciones del canal en AoI en escenarios de alta velocidad no puede ignorarse

Trabajo Relacionado

Investigación de Optimización de SPS

Métodos Tradicionales: Se enfoca principalmente en la influencia de la densidad vehicular en la selección de RRI
Esquemas Adaptativos: Ajuste dinámico del contador de reselección de recursos (RC) y RRI basado en disponibilidad de canal
Análisis de AoI: Investigación del impacto de la ocupación continua de recursos en SPS en el AoI del sistema

Puntos de Innovación de Este Artículo

Modelado Multifactorial: Primera consideración simultánea del acoplamiento de velocidad, densidad e RRI
Optimización con IA: Introducción de estrategia de optimización de doble vía con LLM y DDPG
Modelado de Canal: Incorporación del efecto Doppler en el modelo de canal de Markov

Conclusiones y Discusión

Conclusiones Principales

Validez del Modelo: El modelo de AoI establecido refleja con precisión el impacto combinado de velocidad vehicular, densidad e RRI
Efecto de Optimización: La optimización conjunta puede reducir significativamente el AoI del sistema IoV
Comparación de Métodos: El método LLM converge rápidamente pero requiere buenos ejemplos; el método DDPG es estable pero requiere entrenamiento

Limitaciones

Restricción de Escenario: Solo considera escenarios de autopista con carriles bidireccionales
Condiciones de Supuesto: Supone distribución uniforme de vehículos y flujo de tráfico fijo
Modelo de Canal: El modelo de canal de Markov simplificado puede no reflejar completamente el entorno de canal complejo real
Dependencia de LLM: El método LLM depende de ejemplos de alta calidad y diseño de indicaciones

Direcciones Futuras

Ajuste Fino Ligero: Diseñar esquema de ajuste fino ligero de LLM para reducir la dependencia de ejemplos
Despliegue en Tiempo Real: Integrar el motor de optimización en unidades de carretera C-V2X para configuración dinámica de RRI
Escenario Multibase: Considerar escenarios de múltiples estaciones base para resolver picos de AoI causados por cambio de señal
Escenarios Más Complejos: Extender a carreteras urbanas, intersecciones y otros escenarios de tráfico más complejos

Evaluación Profunda

Ventajas

Importancia del Problema: Aborda el importante problema de optimización de AoI en IoV con valor de aplicación práctica
Modelado Integral: Considera comprehensivamente el acoplamiento de múltiples factores incluyendo colisión, fallo de canal y retransmisión ciega
Innovación de Método: Primera introducción de LLM en optimización de parámetros de IoV, proporcionando nuevas perspectivas de solución
Experimentación Suficiente: Verifica la efectividad del método mediante simulación desde múltiples ángulos

Insuficiencias

Limitación de Escenario: Solo considera escenarios de autopista; la aplicabilidad a entornos complejos de carreteras urbanas requiere verificación
Supuestos del Modelo: Supuestos como distribución uniforme de vehículos son demasiado idealizados
Interpretabilidad de LLM: El proceso de decisión de LLM carece de interpretabilidad, dificultando la comprensión de su mecanismo de optimización
Consideración de Tiempo Real: No se discute suficientemente la complejidad computacional y requisitos de tiempo real en despliegue real

Impacto

Contribución Académica: Proporciona nuevo modelo teórico y método de optimización para optimización de AoI en IoV
Valor Práctico: Puede proporcionar referencia para formulación de estándares de red vehicular 5G/6G y diseño de sistemas
Inspiración de Método: La aplicación de LLM en optimización de red puede inspirar más investigación relacionada

Escenarios Aplicables

Optimización de parámetros de sistemas de red vehicular en autopistas
Configuración de parámetros SPS en 5G NR V2X Modo 2
Problemas de optimización de red que requieren consideración de acoplamiento multifactorial
Sistemas de comunicación en tiempo real sensibles a AoI

Referencias

Este artículo cita 20 referencias relacionadas, cubriendo principalmente:

Investigación fundamental de IoV y comunicación V2X
Mecanismo SPS y optimización de parámetros
Teoría y aplicación de AoI
Métodos de aprendizaje por refuerzo profundo
Aplicaciones de modelos de lenguaje grande

Evaluación General: Este artículo propone soluciones innovadoras para problemas importantes en redes vehiculares, con contribuciones tanto en modelado teórico como en diseño de métodos. La aplicación de LLM en optimización de red tiene cierta novedad, pero aún requiere verificación adicional de su efectividad y practicidad en escenarios más complejos.