2025-11-24T05:55:18.047439

Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS

Ji, Wang, Wu et al.

Addressing the problem of Age of Information (AoI) deterioration caused by packet collisions and vehicle speed-related channel uncertainties in Semi-Persistent Scheduling (SPS) for the Internet of Vehicles (IoV), this letter proposes an optimization approach based on Large Language Models (LLM) and Deep Deterministic Policy Gradient (DDPG). First, an AoI calculation model influenced by vehicle speed, vehicle density, and Resource Reservation Interval (RRI) is established, followed by the design of a dual-path optimization scheme. The DDPG is guided by the state space and reward function, while the LLM leverages contextual learning to generate optimal parameter configurations. Experimental results demonstrate that LLM can significantly reduce AoI after accumulating a small number of exemplars without requiring model training, whereas the DDPG method achieves more stable performance after training.

academic

Анализ скорости и плотности RRI и оптимизация для минимизации AoI в IoV SPS

Основная информация

ID статьи: 2510.08911
Название: Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS
Авторы: Maoxin Ji, Tong Wang, Qiong Wu, Pingyi Fan, Nan Cheng, Wen Chen
Классификация: cs.LG cs.NI
Журнал публикации: IEEE Communications Letters, VOL. XX, NO. XX, MAY 2025
Ссылка на статью: https://arxiv.org/abs/2510.08911
Исходный код: https://github.com/qiongwu86/AI-Based-IoV-Resource-Scheduling-SPS-Parameter-Optimization-for-AoI-Minimization

Аннотация

В данной статье предлагается метод оптимизации на основе больших языковых моделей (LLM) и глубокого детерминированного градиента политики (DDPG) для решения проблемы деградации информационного возраста (AoI) в полупостоянном планировании (SPS) сетей связи между транспортными средствами (IoV), вызванной столкновениями пакетов и неопределённостью канала, связанной со скоростью транспортного средства. Сначала разработана модель расчёта AoI, учитывающая скорость транспортного средства, плотность транспортного средства и интервал резервирования ресурсов (RRI), а затем предложена двухпутевая схема оптимизации. DDPG направляется через пространство состояний и функцию вознаграждения, а LLM использует контекстное обучение для генерации оптимальных конфигураций параметров. Экспериментальные результаты показывают, что LLM может значительно снизить AoI после накопления небольшого количества образцов без необходимости обучения модели, тогда как метод DDPG обеспечивает более стабильную производительность после обучения.

Предпосылки исследования и мотивация

Определение проблемы

Сеть связи между транспортными средствами (IoV) как ключевая технология интеллектуальных транспортных систем требует передачи критических базовых сообщений безопасности (BSM) при коммуникации между транспортными средствами (V2V). В стандарте 5G NR V2X коммуникация V2V обычно использует режим 2 для автономного выбора ресурсов с применением полупостоянного планирования (SPS) для конкуренции и занятия ресурсов.

Основные проблемы

Ограничения традиционного SPS: Существующее SPS зависит от эмпирически фиксированных параметров (например, RRI), которые могут привести к субоптимальной производительности при различных плотностях транспортных средств
Деградация производительности AoI: Столкновения пакетов и непрерывные отказы передачи значительно снижают производительность AoI
Связь множественных факторов: Существует сложная нелинейная связь между скоростью транспортного средства, плотностью и RRI

Мотивация исследования

Высокоскоростные транспортные средства (особенно при встречном движении) создают значительный доплеровский сдвиг, который может привести к дополнительным отказам передачи
В отсутствие канала обратной связи физического совместного использования (PSFCH) широковещательные сообщения, такие как BSM, обычно используют слепую переотправку
Необходимо одновременно учитывать скорость и плотность транспортного средства при оптимизации выбора RRI для повышения производительности коммуникации

Основные вклады

Разработка комплексной модели AoI: Предложена модель расчёта AoI, одновременно учитывающая влияние скорости транспортного средства, плотности транспортного средства и RRI, интегрирующая неопределённость физических условий канала и вероятность столкновения ресурсных пакетов
Двухпутевая структура оптимизации: Разработана двойная стратегия оптимизации на основе LLM и DDPG, где LLM использует контекстное обучение для быстрой сходимости, а DDPG обеспечивает стабильное исследование непрерывного пространства
Моделирование канала с учётом скорости: Эффект Доплера, вызванный скоростью транспортного средства, включён в марковскую модель канала для точного описания вероятности отказа передачи в высокоскоростных сценариях
Экспериментальная проверка: Результаты моделирования подтверждают, что совместная оптимизация плотности транспортного средства, RRI и скорости транспортного средства значительно снижает AoI системы IoV

Подробное описание методов

Определение задачи

Входные данные: скорость транспортного средства v, плотность транспортного средства ρ, интервал резервирования ресурсов RRI
Выходные данные: оптимальная конфигурация параметров для минимизации системного AoI
Ограничения: соотношение скорость-плотность при фиксированном потоке трафика Q: ρ = Q/v

Системная модель

1. Топология сети

Рассматривается конечный участок автомагистрали длиной 2L с двумя встречными полосами. Общее количество транспортных средств:

mtotal = 2ρlL

2. Модель вероятности столкновения

Вероятность столкновения пакета транспортного средства n:

Pcoll = 1 - (1 - 1/(Nr - Ns/2))^m

где Nr — максимальное количество доступных RBG в окне выбора, Ns — количество транспортных средств в диапазоне восприятия.

3. Моделирование состояния канала

Состояние канала моделируется на основе марковского процесса с учётом влияния доплеровского сдвига fd = fcv/c:

Вероятности переходов состояния pp (сохранение плохого состояния) и pi (сохранение идеального состояния)
Рекурсивный расчёт общей вероятности потери пакета pd

4. Модель расчёта AoI

Системный AoI представляется как сумма задержки очереди и задержки передачи:

A = Tq + Tt

Задержка очереди Tq учитывает комбинированное влияние переотправки при столкновении и отказа канала:

Tq = (2/Ns) * Σ[RRI + E[Ta]/(1-pd²) + max(tGAP, RRI/2)pd/(1-pd)]

Стратегии оптимизации

1. Метод DDPG

Задача моделируется как марковский процесс принятия решений (MDP):

Пространство состояний: st = vt, ρt, RRIt, pd,t, Pcoll,t
Пространство действий: at = RRIt+1, vt+1
Функция вознаграждения: разработана кусочная функция вознаграждения, обеспечивающая различные наклоны вознаграждения для различных интервалов AoI

Используется архитектура Actor-Critic:

Сеть Actor: μ(st|θμ) выводит детерминированное действие
Сеть Critic: Q(st,at|θQ) оценивает стоимость состояния-действия
Целевые сети и воспроизведение опыта повышают стабильность обучения

2. Метод LLM

Разработана пятичастная структура подсказки:

Контекст задачи: объяснение компонентов AoI и влияющих факторов
Цель задачи: уточнение цели минимизации системного AoI
Основная задача: определение роли LLM как алгоритма оптимизации
Формат вывода: стандартизированное представление результатов
Набор примеров: предоставление репрезентативных выборов параметров и соответствующих значений AoI

Структура алгоритма LLM:

Многошаговое рассуждение для генерации нескольких выходных результатов
Симулятор окружения вычисляет AoI для получения текущего оптимального решения
Исключение повторяющегося опыта, добавление эффективного опыта в набор исторических решений
Определение сходимости при отсутствии значительного улучшения при многократном рассуждении

Экспериментальная установка

Параметры моделирования

Сценарий: двусторонние полосы автомагистрали
Поток трафика: 6000 транспортных средств/час (фиксированный)
Диапазон RRI: 10-100 мс
Диапазон плотности транспортных средств: 50-200 транспортных средств/км
Диапазон скоростей: 30-120 км/ч
Длина автомагистрали: 2L (L — полудлина)

Показатели оценки

Основной показатель: средний системный AoI
Сходимость: тенденция изменения AoI в течение 50 циклов обучения

Методы сравнения

Метод LLM: три различные большие языковые модели
Алгоритм DDPG: глубокий детерминированный градиент политики
Генетический алгоритм: традиционный метод оптимизации
Оптимальное решение: теоретически оптимальное значение, полученное путём исчерпывающего поиска

Результаты экспериментов

Основные результаты

1. Влияние скорости транспортного средства на AoI (рис. 3a)

Низкая скорость (высокая плотность): увеличение AoI в основном вызвано высокой вероятностью столкновения пакетов при выборе ресурсов SPS
Высокая скорость (низкая плотность): хотя столкновения редки, серьёзная деградация канала из-за эффекта Доплера повышает вероятность отказа физического уровня
Влияние RRI:
- При большом RRI вероятность столкновения пренебрежима, AoI постепенно увеличивается со скоростью
- При малом RRI столкновения доминируют, AoI достигает пика при низкой скорости, затем снижается с увеличением скорости

2. Влияние RRI на AoI (рис. 3b)

Низкая скорость (высокая плотность): при низких значениях RRI высокая вероятность столкновения приводит к большому AoI, соотношение становится линейным с увеличением RRI
Высокая скорость (низкая плотность): увеличение вероятности потери пакета в канале, AoI растёт быстрее с увеличением RRI

3. Сравнение производительности различных методов (рис. 3c)

Метод LLM:
- На начальном этапе AoI колеблется из-за исследования различных комбинаций параметров
- Благодаря репрезентативным примерам в подсказке имеет хорошее начальное решение
- Быстро сходится за несколько итераций
Алгоритм DDPG:
- Требует больше шагов для исследования и настройки параметров сети
- После обучения показывает более стабильную производительность
Генетический алгоритм: скорость сходимости находится между LLM и DDPG

Ключевые выводы

Связь трёх факторов скорость-плотность-RRI: совместная оптимизация значительно превосходит однофакторную оптимизацию
Быстрая сходимость LLM: контекстное обучение на основе примеров быстро сходится без необходимости онлайн-обучения
Стабильность DDPG: хотя сходимость медленнее, показывает более стабильную производительность при исследовании непрерывного пространства
Значимость эффекта Доплера: влияние условий канала на AoI в высокоскоростных сценариях нельзя игнорировать

Связанные работы

Исследования оптимизации SPS

Традиционные методы: в основном сосредоточены на влиянии плотности транспортных средств на выбор RRI
Адаптивные схемы: динамическая регулировка счётчика переселения ресурсов (RC) и RRI на основе доступности канала
Анализ AoI: исследование влияния непрерывного занятия ресурсов в SPS на системный AoI

Инновационные аспекты данной работы

Многофакторное моделирование: впервые одновременно учитывается связанное влияние скорости, плотности и RRI
AI-оптимизация: введение двухпутевой стратегии оптимизации LLM и DDPG
Моделирование канала: включение эффекта Доплера в марковскую модель канала

Заключение и обсуждение

Основные выводы

Эффективность модели: разработанная модель AoI точно отражает комбинированное влияние скорости транспортного средства, плотности и RRI
Эффект оптимизации: совместная оптимизация значительно снижает AoI системы IoV
Сравнение методов: метод LLM сходится быстро, но требует хороших примеров; метод DDPG стабилен, но требует обучения

Ограничения

Ограничение сценария: рассматривается только сценарий двусторонних полос автомагистрали
Предположения: предположения о равномерном распределении транспортных средств и фиксированном потоке трафика чрезмерно идеализированы
Модель канала: упрощённая марковская модель канала может не полностью отражать реальную сложную среду канала
Зависимость от LLM: метод LLM зависит от высокого качества примеров и проектирования подсказок

Направления будущих исследований

Облегчённая тонкая настройка: разработка схемы облегчённой тонкой настройки LLM для снижения зависимости от примеров
Развёртывание в реальном времени: интеграция механизма оптимизации в придорожные блоки C-V2X для динамической конфигурации RRI
Многобазовые сценарии: рассмотрение многобазовых сценариев для решения проблемы пиков AoI, вызванных переключением сигнала
Более сложные сценарии: расширение на городские дороги, перекрёстки и другие сложные сценарии движения

Глубокая оценка

Преимущества

Важность проблемы: решение важной проблемы оптимизации AoI в IoV с практической ценностью применения
Комплексное моделирование: комплексный учёт связанного влияния столкновений, отказов канала, слепой переотправки и других факторов
Инновационность метода: впервые введено применение LLM в оптимизацию параметров IoV, предоставляющее новый подход к решению
Достаточные эксперименты: многоугольная проверка эффективности метода через моделирование

Недостатки

Ограничение сценария: рассмотрение только автомагистралей требует проверки применимости к сложным городским дорогам
Предположения модели: предположения о равномерном распределении транспортных средств чрезмерно идеализированы
Интерпретируемость LLM: процесс принятия решений LLM лишён интерпретируемости, затрудняя понимание механизма оптимизации
Рассмотрение реального времени: недостаточное обсуждение требований к вычислительной сложности и реальному времени при практическом развёртывании

Влияние

Академический вклад: предоставление новой теоретической модели и методов оптимизации для AoI в IoV
Практическая ценность: может служить справочником для разработки стандартов 5G/6G и проектирования систем связи между транспортными средствами
Методологическое вдохновение: применение LLM в оптимизации сетей может вдохновить дополнительные исследования в этой области

Применимые сценарии

Оптимизация параметров систем связи между транспортными средствами на автомагистралях
Конфигурация параметров SPS в 5G NR V2X режиме 2
Оптимизация сетей, требующая учёта связанного влияния множественных факторов
Системы реального времени, чувствительные к AoI

Библиография

Статья ссылается на 20 связанных источников, охватывающих в основном:

Фундаментальные исследования IoV и V2X коммуникации
Механизм SPS и оптимизация параметров
Теория и приложения AoI
Методы глубокого обучения с подкреплением
Приложения больших языковых моделей

Общая оценка: Статья предлагает инновационное решение важной проблемы в сетях связи между транспортными средствами с определёнными вкладами в теоретическое моделирование и проектирование методов. Применение LLM в оптимизации сетей обладает определённой новизной, однако требует дальнейшей проверки эффективности и практичности в более сложных сценариях.