Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.
Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS 论文ID : 2510.08911标题 : Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS作者 : Maoxin Ji, Tong Wang, Qiong Wu, Pingyi Fan, Nan Cheng, Wen Chen分类 : cs.LG cs.NI发表期刊 : IEEE Communications Letters, VOL. XX, NO. XX, MAY 2025论文链接 : https://arxiv.org/abs/2510.08911 源代码 : https://github.com/qiongwu86/AI-Based-IoV-Resource-Scheduling-SPS-Parameter-Optimization-for-AoI-Minimization 本文针对车联网(IoV)半持久调度(SPS)中由数据包碰撞和车辆速度相关信道不确定性导致的信息年龄(AoI)恶化问题,提出了基于大语言模型(LLM)和深度确定性策略梯度(DDPG)的优化方法。首先建立了受车辆速度、车辆密度和资源预留间隔(RRI)影响的AoI计算模型,随后设计了双路径优化方案。DDPG通过状态空间和奖励函数进行指导,而LLM利用上下文学习生成最优参数配置。实验结果表明,LLM在积累少量样本后即可显著降低AoI且无需模型训练,而DDPG方法在训练后能实现更稳定的性能。
车联网(IoV)作为智能交通系统的核心技术,其中车对车(V2V)通信需要传输关键的基本安全消息(BSM)。在5G NR V2X标准中,V2V通信通常采用Mode 2进行自主资源选择,使用半持久调度(SPS)来竞争和占用资源。
传统SPS的局限性 : 现有SPS依赖经验固定参数(如RRI),在不同车辆密度下可能导致次优性能AoI性能恶化 : 数据包碰撞和连续传输失败会显著降低AoI性能多因素耦合 : 车辆速度、密度和RRI之间存在复杂的非线性耦合关系高速车辆(特别是相向行驶)会产生显著的多普勒频移,可能导致额外的传输失败 在没有配置物理侧链反馈信道(PSFCH)的情况下,BSM等广播消息通常使用盲重传 需要同时考虑车辆速度和密度来优化RRI选择,以提升通信性能 建立综合AoI模型 : 提出了同时考虑车辆速度、车辆密度和RRI影响的AoI计算模型,整合了物理信道条件的不确定性和资源包碰撞概率双路径优化框架 : 设计了基于LLM和DDPG的双重优化策略,LLM利用上下文学习快速收敛,DDPG提供稳定的连续空间探索速度感知的信道建模 : 将车辆速度引起的多普勒效应纳入马尔可夫信道模型,准确刻画高速场景下的传输失败概率实验验证 : 通过仿真实验验证了联合优化车辆密度、RRI和车辆速度能显著降低IoV系统的AoI输入 : 车辆速度v、车辆密度ρ、资源预留间隔RRI输出 : 最小化系统AoI的最优参数配置约束 : 固定交通流量Q下的速度-密度关系: ρ = Q/v
考虑长度为2L的有限高速公路段,包含两条相向车道。车辆总数为:
车辆n的数据包碰撞概率为:
Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m
其中Nr为选择窗口内可选择的最大RBG数量,Ns为感知范围内的车辆数。
基于马尔可夫过程建模信道状态,考虑多普勒频移fd = fcv/c的影响:
状态转移概率pp(保持恶劣状态)和pi(保持理想状态) 整体数据包丢失概率pd的递推计算 系统AoI表示为排队时延和传输时延之和:
排队时延Tq考虑了碰撞重传和信道失败的综合影响:
Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]
将问题建模为马尔可夫决策过程(MDP):
状态空间 : st = vt, ρt, RRIt, pd,t, Pcoll,t 动作空间 : at = RRIt+1, vt+1 奖励函数 : 设计分段奖励函数,对不同AoI区间给予不同斜率的奖励采用Actor-Critic架构:
Actor网络: μ(st|θμ)输出确定性动作 Critic网络: Q(st,at|θQ)评估状态-动作价值 目标网络和经验回放提升训练稳定性 设计五部分提示结构:
任务背景 : 解释AoI组成和影响因素任务目标 : 明确最小化系统AoI的目标主要任务 : 定义LLM作为优化算法的角色输出格式 : 标准化结果呈现示例集 : 提供代表性参数选择和对应AoI值LLM算法框架:
多步推理生成多个输出结果 环境仿真器计算AoI获得当前最优解 排除重复经验,将有效经验加入历史决策集 当多次推理无显著改进时判定收敛 场景 : 高速公路双向车道交通流量 : 6000辆/小时(固定)RRI范围 : 10-100 ms车辆密度范围 : 50-200 辆/公里速度范围 : 30-120 km/h高速公路长度 : 2L(L为半长)主要指标 : 系统平均AoI收敛性 : 50个训练轮次内的AoI变化趋势LLM方法 : 三种不同的大语言模型DDPG算法 : 深度确定性策略梯度遗传算法 : 传统优化方法最优解 : 通过穷举搜索获得的理论最优值低速(高密度) : AoI增加主要由SPS资源选择时的高数据包碰撞概率导致高速(低密度) : 虽然碰撞较少,但严重的多普勒信道退化提高了物理层失败率RRI影响 :
大RRI时,碰撞概率可忽略,AoI随速度逐渐增加 小RRI时,碰撞占主导,AoI在低速时达峰值后随速度增加而下降 低速(高密度) : 低RRI值时碰撞概率高导致AoI较大,随RRI增加关系趋于线性高速(低密度) : 信道丢包概率增加,AoI随RRI增长速率更快LLM方法 :
初期由于探索不同参数组合,AoI波动较大 由于提示中包含代表性示例,具有较好的初始解 仅需少量迭代即可快速收敛 DDPG算法 :
遗传算法 : 收敛速度介于LLM和DDPG之间速度-密度-RRI三因素耦合 : 联合优化显著优于单因素优化LLM快速收敛 : 基于示例的上下文学习无需在线训练即可快速收敛DDPG稳定性 : 虽然收敛较慢,但在连续空间探索中表现更稳定多普勒效应重要性 : 高速场景下信道条件对AoI的影响不可忽视传统方法 : 主要关注车辆密度对RRI选择的影响自适应方案 : 基于信道可用性动态调整资源重选计数器(RC)和RRIAoI分析 : 研究SPS中连续资源占用对系统AoI的影响多因素建模 : 首次同时考虑速度、密度和RRI的耦合影响AI优化 : 引入LLM和DDPG的双路径优化策略信道建模 : 将多普勒效应纳入马尔可夫信道模型模型有效性 : 建立的AoI模型能准确反映车辆速度、密度和RRI的综合影响优化效果 : 联合优化能显著降低IoV系统的AoI方法对比 : LLM方法收敛快但需要好的示例,DDPG方法稳定但需要训练场景限制 : 仅考虑高速公路双向车道场景假设条件 : 假设车辆均匀分布和固定交通流量信道模型 : 简化的马尔可夫信道模型可能无法完全反映实际复杂信道环境LLM依赖 : LLM方法依赖高质量示例和提示设计轻量化微调 : 设计LLM轻量化微调方案以减少对示例的依赖实时部署 : 将优化引擎集成到C-V2X路侧单元实现动态RRI配置多基站场景 : 考虑多基站场景以解决信号切换导致的AoI峰值更复杂场景 : 扩展到城市道路、交叉路口等更复杂的交通场景问题重要性 : 针对IoV中AoI优化这一重要问题,具有实际应用价值建模全面 : 综合考虑了碰撞、信道失败、盲重传等多种因素的耦合影响方法创新 : 首次将LLM引入IoV参数优化,提供了新的解决思路实验充分 : 通过多角度仿真验证了方法的有效性场景局限 : 仅考虑高速公路场景,对城市复杂道路环境的适用性有待验证模型假设 : 车辆均匀分布等假设过于理想化LLM可解释性 : LLM决策过程缺乏可解释性,难以理解其优化机制实时性考虑 : 未充分讨论实际部署中的计算复杂度和实时性要求学术贡献 : 为IoV中的AoI优化提供了新的理论模型和优化方法实用价值 : 可为5G/6G车联网标准制定和系统设计提供参考方法启发 : LLM在网络优化中的应用可启发更多相关研究高速公路车联网系统的参数优化 5G NR V2X Mode 2的SPS参数配置 需要考虑多因素耦合的网络优化问题 AoI敏感的实时通信系统 本文引用了20篇相关文献,主要涵盖:
IoV和V2X通信基础研究 SPS机制和参数优化 AoI理论和应用 深度强化学习方法 大语言模型应用 总体评价 : 本文针对车联网中的重要问题提出了创新的解决方案,在理论建模和方法设计方面都有一定贡献。LLM在网络优化中的应用具有一定的新颖性,但仍需要在更复杂场景下进一步验证其有效性和实用性。