2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.
Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.
academic

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

基本信息

摘要

本文针对车联网(IoV)半持久调度(SPS)中由数据包碰撞和车辆速度相关信道不确定性导致的信息年龄(AoI)恶化问题,提出了基于大语言模型(LLM)和深度确定性策略梯度(DDPG)的优化方法。首先建立了受车辆速度、车辆密度和资源预留间隔(RRI)影响的AoI计算模型,随后设计了双路径优化方案。DDPG通过状态空间和奖励函数进行指导,而LLM利用上下文学习生成最优参数配置。实验结果表明,LLM在积累少量样本后即可显著降低AoI且无需模型训练,而DDPG方法在训练后能实现更稳定的性能。

研究背景与动机

问题定义

车联网(IoV)作为智能交通系统的核心技术,其中车对车(V2V)通信需要传输关键的基本安全消息(BSM)。在5G NR V2X标准中,V2V通信通常采用Mode 2进行自主资源选择,使用半持久调度(SPS)来竞争和占用资源。

核心问题

  1. 传统SPS的局限性: 现有SPS依赖经验固定参数(如RRI),在不同车辆密度下可能导致次优性能
  2. AoI性能恶化: 数据包碰撞和连续传输失败会显著降低AoI性能
  3. 多因素耦合: 车辆速度、密度和RRI之间存在复杂的非线性耦合关系

研究动机

  • 高速车辆(特别是相向行驶)会产生显著的多普勒频移,可能导致额外的传输失败
  • 在没有配置物理侧链反馈信道(PSFCH)的情况下,BSM等广播消息通常使用盲重传
  • 需要同时考虑车辆速度和密度来优化RRI选择,以提升通信性能

核心贡献

  1. 建立综合AoI模型: 提出了同时考虑车辆速度、车辆密度和RRI影响的AoI计算模型,整合了物理信道条件的不确定性和资源包碰撞概率
  2. 双路径优化框架: 设计了基于LLM和DDPG的双重优化策略,LLM利用上下文学习快速收敛,DDPG提供稳定的连续空间探索
  3. 速度感知的信道建模: 将车辆速度引起的多普勒效应纳入马尔可夫信道模型,准确刻画高速场景下的传输失败概率
  4. 实验验证: 通过仿真实验验证了联合优化车辆密度、RRI和车辆速度能显著降低IoV系统的AoI

方法详解

任务定义

输入: 车辆速度v、车辆密度ρ、资源预留间隔RRI
输出: 最小化系统AoI的最优参数配置
约束: 固定交通流量Q下的速度-密度关系: ρ = Q/v

系统模型

1. 网络拓扑

考虑长度为2L的有限高速公路段,包含两条相向车道。车辆总数为:

mtotal = 2ρlL

2. 碰撞概率模型

车辆n的数据包碰撞概率为:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

其中Nr为选择窗口内可选择的最大RBG数量,Ns为感知范围内的车辆数。

3. 信道状态建模

基于马尔可夫过程建模信道状态,考虑多普勒频移fd = fcv/c的影响:

  • 状态转移概率pp(保持恶劣状态)和pi(保持理想状态)
  • 整体数据包丢失概率pd的递推计算

4. AoI计算模型

系统AoI表示为排队时延和传输时延之和:

A = Tq + Tt

排队时延Tq考虑了碰撞重传和信道失败的综合影响:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

优化策略

1. DDPG方法

将问题建模为马尔可夫决策过程(MDP):

  • 状态空间: st = vt, ρt, RRIt, pd,t, Pcoll,t
  • 动作空间: at = RRIt+1, vt+1
  • 奖励函数: 设计分段奖励函数,对不同AoI区间给予不同斜率的奖励

采用Actor-Critic架构:

  • Actor网络: μ(st|θμ)输出确定性动作
  • Critic网络: Q(st,at|θQ)评估状态-动作价值
  • 目标网络和经验回放提升训练稳定性

2. LLM方法

设计五部分提示结构:

  1. 任务背景: 解释AoI组成和影响因素
  2. 任务目标: 明确最小化系统AoI的目标
  3. 主要任务: 定义LLM作为优化算法的角色
  4. 输出格式: 标准化结果呈现
  5. 示例集: 提供代表性参数选择和对应AoI值

LLM算法框架:

  • 多步推理生成多个输出结果
  • 环境仿真器计算AoI获得当前最优解
  • 排除重复经验,将有效经验加入历史决策集
  • 当多次推理无显著改进时判定收敛

实验设置

仿真参数

  • 场景: 高速公路双向车道
  • 交通流量: 6000辆/小时(固定)
  • RRI范围: 10-100 ms
  • 车辆密度范围: 50-200 辆/公里
  • 速度范围: 30-120 km/h
  • 高速公路长度: 2L(L为半长)

评价指标

  • 主要指标: 系统平均AoI
  • 收敛性: 50个训练轮次内的AoI变化趋势

对比方法

  1. LLM方法: 三种不同的大语言模型
  2. DDPG算法: 深度确定性策略梯度
  3. 遗传算法: 传统优化方法
  4. 最优解: 通过穷举搜索获得的理论最优值

实验结果

主要结果

1. 车辆速度对AoI的影响(图3a)

  • 低速(高密度): AoI增加主要由SPS资源选择时的高数据包碰撞概率导致
  • 高速(低密度): 虽然碰撞较少,但严重的多普勒信道退化提高了物理层失败率
  • RRI影响:
    • 大RRI时,碰撞概率可忽略,AoI随速度逐渐增加
    • 小RRI时,碰撞占主导,AoI在低速时达峰值后随速度增加而下降

2. RRI对AoI的影响(图3b)

  • 低速(高密度): 低RRI值时碰撞概率高导致AoI较大,随RRI增加关系趋于线性
  • 高速(低密度): 信道丢包概率增加,AoI随RRI增长速率更快

3. 不同方法性能对比(图3c)

  • LLM方法:
    • 初期由于探索不同参数组合,AoI波动较大
    • 由于提示中包含代表性示例,具有较好的初始解
    • 仅需少量迭代即可快速收敛
  • DDPG算法:
    • 需要更多步骤的探索和网络参数调整
    • 训练后性能更稳定
  • 遗传算法: 收敛速度介于LLM和DDPG之间

关键发现

  1. 速度-密度-RRI三因素耦合: 联合优化显著优于单因素优化
  2. LLM快速收敛: 基于示例的上下文学习无需在线训练即可快速收敛
  3. DDPG稳定性: 虽然收敛较慢,但在连续空间探索中表现更稳定
  4. 多普勒效应重要性: 高速场景下信道条件对AoI的影响不可忽视

相关工作

SPS优化研究

  • 传统方法: 主要关注车辆密度对RRI选择的影响
  • 自适应方案: 基于信道可用性动态调整资源重选计数器(RC)和RRI
  • AoI分析: 研究SPS中连续资源占用对系统AoI的影响

本文创新点

  1. 多因素建模: 首次同时考虑速度、密度和RRI的耦合影响
  2. AI优化: 引入LLM和DDPG的双路径优化策略
  3. 信道建模: 将多普勒效应纳入马尔可夫信道模型

结论与讨论

主要结论

  1. 模型有效性: 建立的AoI模型能准确反映车辆速度、密度和RRI的综合影响
  2. 优化效果: 联合优化能显著降低IoV系统的AoI
  3. 方法对比: LLM方法收敛快但需要好的示例,DDPG方法稳定但需要训练

局限性

  1. 场景限制: 仅考虑高速公路双向车道场景
  2. 假设条件: 假设车辆均匀分布和固定交通流量
  3. 信道模型: 简化的马尔可夫信道模型可能无法完全反映实际复杂信道环境
  4. LLM依赖: LLM方法依赖高质量示例和提示设计

未来方向

  1. 轻量化微调: 设计LLM轻量化微调方案以减少对示例的依赖
  2. 实时部署: 将优化引擎集成到C-V2X路侧单元实现动态RRI配置
  3. 多基站场景: 考虑多基站场景以解决信号切换导致的AoI峰值
  4. 更复杂场景: 扩展到城市道路、交叉路口等更复杂的交通场景

深度评价

优点

  1. 问题重要性: 针对IoV中AoI优化这一重要问题,具有实际应用价值
  2. 建模全面: 综合考虑了碰撞、信道失败、盲重传等多种因素的耦合影响
  3. 方法创新: 首次将LLM引入IoV参数优化,提供了新的解决思路
  4. 实验充分: 通过多角度仿真验证了方法的有效性

不足

  1. 场景局限: 仅考虑高速公路场景,对城市复杂道路环境的适用性有待验证
  2. 模型假设: 车辆均匀分布等假设过于理想化
  3. LLM可解释性: LLM决策过程缺乏可解释性,难以理解其优化机制
  4. 实时性考虑: 未充分讨论实际部署中的计算复杂度和实时性要求

影响力

  1. 学术贡献: 为IoV中的AoI优化提供了新的理论模型和优化方法
  2. 实用价值: 可为5G/6G车联网标准制定和系统设计提供参考
  3. 方法启发: LLM在网络优化中的应用可启发更多相关研究

适用场景

  • 高速公路车联网系统的参数优化
  • 5G NR V2X Mode 2的SPS参数配置
  • 需要考虑多因素耦合的网络优化问题
  • AoI敏感的实时通信系统

参考文献

本文引用了20篇相关文献,主要涵盖:

  • IoV和V2X通信基础研究
  • SPS机制和参数优化
  • AoI理论和应用
  • 深度强化学习方法
  • 大语言模型应用

总体评价: 本文针对车联网中的重要问题提出了创新的解决方案,在理论建模和方法设计方面都有一定贡献。LLM在网络优化中的应用具有一定的新颖性,但仍需要在更复杂场景下进一步验证其有效性和实用性。