2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic

Адаптивное децентрализованное раскрытие информации об очередях для нетерпеливых арендаторов в граничных и внеземных системах

Основная информация

  • ID статьи: 2508.04241
  • Название: Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
  • Авторы: Anthony Kiggundu, Bin Han, Hans D. Schotten
  • Классификация: eess.SY (Системы и управление), cs.SY (Системы и управление)
  • Дата публикации: 13 октября 2025 г. (arXiv v2)
  • Учреждение: Немецкий исследовательский центр искусственного интеллекта (DFKI), Университет RPTU Кайзерслаутерна-Ландау
  • Ссылка на статью: https://arxiv.org/abs/2508.04241

Аннотация

В данной работе исследуется влияние раскрытия информации о состоянии очередей на нетерпеливых арендаторов в многоарендаторных граничных системах. Авторы предлагают стратегию информационного объявления, при которой каждая очередь периодически транслирует две марковские модели: одну для поведения стационарной скорости обслуживания и другую для модели времени изменения длины очереди. Арендаторы самостоятельно принимают решения о покидании или переводе очереди на основе этой информации. Очередь наблюдает ответные действия арендаторов и адаптирует скорость обслуживания посредством стратегии предсказания на основе правил, разработанной для децентрализованной, частично наблюдаемой и нестационарной среды. Численные эксперименты количественно оценивают компромиссы между средней задержкой, степенью нетерпеливости и устойчивостью к устаревшей информации.

Исследовательский контекст и мотивация

Определение проблемы

В гетерогенных развертываниях 5G/6G совместное использование ресурсов в многоарендаторных системах определяется не только статической конфигурацией, но все чаще автономными решениями арендаторов (например, разгружать ли задачи на удаленную очередь или обрабатывать локально). Раскрытие информации о состоянии очередей (такой как длина очереди, оценки времени ожидания или статистика обслуживания) может значительно изменить поведение арендаторов и вызвать конкуренцию за ресурсы посредством переключения между очередями (jockeying) и отказа (reneging).

Значимость исследования

Современные среды многопользовательского граничного вычисления (MEC) и внеземных сетей (NTN) характеризуются децентрализацией, наличием частичных и устаревших трансляций состояния, а также проявляют нестационарные каналы и мобильность. В такой среде предположение о едином центральном контроллере с мгновенным глобальным состоянием нереалистично. Однако существующие правила раскрытия и эвристические подходы обычно разработаны для статических или слабо мобильных сценариев и не могут ответить на три фундаментальных вопроса децентрализованного управления:

  1. Какую информацию о состоянии следует передавать
  2. Как следует представлять информацию
  3. Как часто следует распространять обновления

Ограничения существующих подходов

Традиционные методы централизованной оптимизации (такие как стратегия точки защиты) предполагают полную, мгновенную информацию о состоянии и условия стационарности, которые часто не выполняются в типичных условиях граничных облаков и внеземных развертываний. Производительность существующих методов значительно снижается, когда информация становится частичной или устаревшей.

Основные вклады

  1. Концепция информационного объявления: Введена концепция информационного объявления для многоарендаторных очередей и формализованы два марковских дескриптора (распределение скорости обслуживания и время изменения) как настраиваемые резюме состояния, подходящие для каналов управления с ограниченной полосой пропускания.
  2. Теоретический анализ: Выведены замкнутые выражения для вероятностей переключения между очередями и отказа при этих дескрипторах, сформулирована задача совместной минимизации нетерпеливости, балансирующая задержку, переключение и отказ. Доказано, что задача оптимизации аналитически неразрешима.
  3. Практическая стратегия: Предложена практическая стратегия предсказания на основе правил, которая обучается на ответах арендаторов и адаптирует вектор скорости обслуживания в режиме реального времени.
  4. Комплексная оценка: Посредством обширной численной оценки количественно определена ценность различных моделей объявлений и интервалов распространения, продемонстрирована устойчивость стратегии обучения при гетерогенных рабочих нагрузках.

Детальное описание методологии

Определение задачи

Рассматривается система массового обслуживания M/M/2 с двумя очередями i и j. Новые поступления следуют распределению Пуассона с общей интенсивностью λ = λᵢ + λⱼ. Каждая очередь распространяет информацию о своем состоянии арендаторам с интервалом r секунд, вводя определенную степень устаревания. Цель состоит в минимизации составной метрики производительности, включающей среднюю задержку, события переключения и отказы (нетерпеливость арендаторов).

Архитектура модели

1. Марковская модель скорости обслуживания

Распределение скорости обслуживания очереди i или j в установившемся состоянии следует K-состояниям непрерывной марковской цепи (CTMC) со скоростями обслуживания {μᵢ}ᵢ₌₁ᴷ и {μⱼ}ⱼ₌₁ᴷ. Эффективная скорость обслуживания определяется как:

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

где πₓᵢ и πᵧⱼ — стационарные вероятности.

2. Модель динамики длины очереди — распределение времени изменения (ICD)

Эта модель количественно определяет частоту переходов в системе очередей. Для очереди в состоянии n только события прибытия изменяют состояние при n=0, а при n≥1 состояние могут изменить события прибытия или обслуживания. Марковская модель определяется как:

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

Ожидаемое время между изменениями:

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

3. Стохастическое доминирование первого порядка (FSD)

Определение более предпочтительной очереди путем сравнения кумулятивных функций распределения FX(μₖ) и FY(μₖ). Если PX > x ≥ PY > x ∀x ∈ ℝ, то X стохастически доминирует Y первого порядка.

Моделирование поведения

Поведение отказа

Вероятность отказа на основе FSD определяется как:

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

где Δ = Tₗₒcₐₗ - ηr, η ∈ 0,1 представляет степень устаревания информации.

Поведение переключения

Вероятность переключения на основе ICD моделируется с использованием сигмоидной функции:

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

Задача оптимизации

Задача совместной оптимизации формализуется как:

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

При ограничениях: μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

Технические инновации

  1. Абстракция информации: Сложное состояние очереди абстрагируется в две компактные марковские модели, подходящие для каналов управления с ограниченной полосой пропускания.
  2. Адаптивное обучение: Стратегия предсказания на основе правил способна обучаться на ответах арендаторов и адаптировать скорость обслуживания в режиме реального времени.
  3. Проектирование устойчивости: Учитывается устаревание информации и частичная наблюдаемость, что лучше соответствует реальным граничным вычислительным средам.

Экспериментальная установка

Параметры экспериментов

  • Интервалы распространения: r ∈ {3, 5, 7, 9} секунд
  • Диапазон интенсивности поступлений: 3 ≤ λ ≤ 17
  • 300 прогонов моделирования для каждой конфигурации
  • Установка системы M/M/2

Метрики оценки

  • Средняя задержка
  • Коэффициент отказа
  • Коэффициент переключения
  • Значение составной целевой функции (комбинирующей задержку и меры нетерпеливости)

Методы сравнения

  • Базовый вариант без стратегии
  • Классическая централизованная стратегия точки защиты MDP
  • Предложенная стратегия предсказания на основе правил

Результаты экспериментов

Основные результаты

  1. Сравнение информационных моделей: Марковская модель скорости обслуживания приводит к меньшему нетерпеливому поведению по сравнению с моделью времени изменения длины очереди, так как обеспечивает прямое отображение скорости обработки.
  2. Оптимизация частоты распространения: Оптимальность достигается при интервалах 5-7 секунд, при которых нетерпеливость минимизируется и система стабильна, особенно когда запросы получают информацию о скорости обслуживания.
  3. Сравнение стратегий:
    • Стратегия точки защиты: более стабильна, но с более высокими коэффициентами отказа и переключения
    • Стратегия на основе правил: более изменчива, но может регистрировать более низкие коэффициенты при меньших интервалах
  4. Эффект оптимизации: Оптимизированная стратегия статистически устойчива, производя более низкие и последовательные значения целевой функции (среднее=0,53 против 1,78 без оптимизации).

Ключевые находки

Согласно количественному резюме в таблице I:

  • Меньшая вариативность оптимизированных результатов (стандартное отклонение=0,15 против 0,97)
  • Среднее улучшение составляет 1,26
  • Лучшие решения находятся при всех интервалах распространения

Анализ времени ожидания

При внедрении стратегии время ожидания запросов с отказом и переключением значительно снижается, особенно при трансляции марковской модели скорости обслуживания наблюдается большая оптимальность.

Связанные работы

Основные направления исследований в этой области включают:

  1. Стратегии раскрытия информации в системах массового обслуживания
  2. Децентрализованное управление многосерверными системами
  3. Распределение ресурсов в граничных вычислениях
  4. Моделирование поведения нетерпеливых клиентов

Преимущества данной работы по сравнению с связанными исследованиями:

  • Учитывается влияние устаревания информации
  • Предоставляются решения, подходящие для децентрализованных сред
  • Интегрируются механизмы обучения и адаптации

Заключение и обсуждение

Основные выводы

  1. Информация о состоянии системы играет ключевую роль в формировании решений нетерпеливых арендаторов
  2. Стратегия предсказания на основе правил демонстрирует большую устойчивость к устареванию информации
  3. Надлежащая частота раскрытия информации критична для производительности системы
  4. Марковская модель скорости обслуживания более эффективна, чем модель динамики очереди

Ограничения

  1. Ограничено установкой M/M/2 Пуассона
  2. Требуется количественная оценка вычислительных и коммуникационных затрат механизма объявления
  3. Не учитываются пакетные, тяжелохвостые процессы поступлений и неэкспоненциальное время обслуживания

Направления будущих исследований

  1. Включение информационных моделей с явными затратами на подписку
  2. Замена эвристики на основе правил методами глубокого обучения с подкреплением
  3. Расширение на многоочередные гетерогенные серверы
  4. Валидация методологии на прототипных платформах тестирования MEC

Глубокая оценка

Преимущества

  1. Инновационность: Предложена новая концепция информационного объявления, открывающая новые подходы к децентрализованному управлению очередями
  2. Практичность: Учитывается устаревание информации и частичная наблюдаемость в реальных граничных вычислительных средах
  3. Теоретическая строгость: Предоставлена полная математическая модель и аналитический каркас
  4. Достаточная экспериментальная валидация: Методология проверена посредством обширных численных экспериментов

Недостатки

  1. Ограничения модели: Рассматривается только система M/M/2, реальные системы более сложны
  2. Чувствительность параметров: Выбор некоторых параметров (таких как δλ, η) недостаточно обоснован теоретически
  3. Анализ вычислительной сложности: Недостаточно детальный анализ сложности решения условий KKT
  4. Валидация на реальных системах: Отсутствуют экспериментальные проверки на реальных системах

Влияние

  1. Академический вклад: Открывает новые направления исследований в теории очередей и граничных вычислениях
  2. Практическая ценность: Имеет руководящее значение для распределения ресурсов в сетях 6G
  3. Масштабируемость: Методологический каркас обладает хорошей масштабируемостью

Применимые сценарии

Метод особенно применим к:

  1. Многоарендаторным системам граничных вычислений
  2. Средам внеземных сетей
  3. Децентрализованным системам с ограниченной передачей информации
  4. Сервисным системам, требующим учета нетерпеливого поведения пользователей

Библиография

Статья цитирует важные работы в областях теории очередей, моделирования поведения и граничных вычислений, включая:

  • Исследования Y. Ouyang и D. Teneketzis по децентрализованной сигнализации маршрутизации
  • Работы B. Lin и др. по оптимальным стратегиям для двусерверных систем массового обслуживания
  • Технические спецификации 3GPP по управлению и оркестрации сетевых срезов

Общая оценка: Это высококачественная исследовательская работа на пересечении теории очередей и граничных вычислений, предлагающая инновационную стратегию раскрытия информации для решения проблемы нетерпеливости арендаторов в децентрализованных средах. Несмотря на некоторые ограничения, её теоретический вклад и практическая ценность делают её важным прогрессом в данной области.