2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten

We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.

academic

Адаптивное децентрализованное раскрытие информации об очередях для нетерпеливых арендаторов в граничных и внеземных системах

Основная информация

ID статьи: 2508.04241
Название: Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Авторы: Anthony Kiggundu, Bin Han, Hans D. Schotten
Классификация: eess.SY (Системы и управление), cs.SY (Системы и управление)
Дата публикации: 13 октября 2025 г. (arXiv v2)
Учреждение: Немецкий исследовательский центр искусственного интеллекта (DFKI), Университет RPTU Кайзерслаутерна-Ландау
Ссылка на статью: https://arxiv.org/abs/2508.04241

Аннотация

В данной работе исследуется влияние раскрытия информации о состоянии очередей на нетерпеливых арендаторов в многоарендаторных граничных системах. Авторы предлагают стратегию информационного объявления, при которой каждая очередь периодически транслирует две марковские модели: одну для поведения стационарной скорости обслуживания и другую для модели времени изменения длины очереди. Арендаторы самостоятельно принимают решения о покидании или переводе очереди на основе этой информации. Очередь наблюдает ответные действия арендаторов и адаптирует скорость обслуживания посредством стратегии предсказания на основе правил, разработанной для децентрализованной, частично наблюдаемой и нестационарной среды. Численные эксперименты количественно оценивают компромиссы между средней задержкой, степенью нетерпеливости и устойчивостью к устаревшей информации.

Исследовательский контекст и мотивация

Определение проблемы

В гетерогенных развертываниях 5G/6G совместное использование ресурсов в многоарендаторных системах определяется не только статической конфигурацией, но все чаще автономными решениями арендаторов (например, разгружать ли задачи на удаленную очередь или обрабатывать локально). Раскрытие информации о состоянии очередей (такой как длина очереди, оценки времени ожидания или статистика обслуживания) может значительно изменить поведение арендаторов и вызвать конкуренцию за ресурсы посредством переключения между очередями (jockeying) и отказа (reneging).

Значимость исследования

Современные среды многопользовательского граничного вычисления (MEC) и внеземных сетей (NTN) характеризуются децентрализацией, наличием частичных и устаревших трансляций состояния, а также проявляют нестационарные каналы и мобильность. В такой среде предположение о едином центральном контроллере с мгновенным глобальным состоянием нереалистично. Однако существующие правила раскрытия и эвристические подходы обычно разработаны для статических или слабо мобильных сценариев и не могут ответить на три фундаментальных вопроса децентрализованного управления:

Какую информацию о состоянии следует передавать
Как следует представлять информацию
Как часто следует распространять обновления

Ограничения существующих подходов

Традиционные методы централизованной оптимизации (такие как стратегия точки защиты) предполагают полную, мгновенную информацию о состоянии и условия стационарности, которые часто не выполняются в типичных условиях граничных облаков и внеземных развертываний. Производительность существующих методов значительно снижается, когда информация становится частичной или устаревшей.

Основные вклады

Концепция информационного объявления: Введена концепция информационного объявления для многоарендаторных очередей и формализованы два марковских дескриптора (распределение скорости обслуживания и время изменения) как настраиваемые резюме состояния, подходящие для каналов управления с ограниченной полосой пропускания.
Теоретический анализ: Выведены замкнутые выражения для вероятностей переключения между очередями и отказа при этих дескрипторах, сформулирована задача совместной минимизации нетерпеливости, балансирующая задержку, переключение и отказ. Доказано, что задача оптимизации аналитически неразрешима.
Практическая стратегия: Предложена практическая стратегия предсказания на основе правил, которая обучается на ответах арендаторов и адаптирует вектор скорости обслуживания в режиме реального времени.
Комплексная оценка: Посредством обширной численной оценки количественно определена ценность различных моделей объявлений и интервалов распространения, продемонстрирована устойчивость стратегии обучения при гетерогенных рабочих нагрузках.

Детальное описание методологии

Определение задачи

Рассматривается система массового обслуживания M/M/2 с двумя очередями i и j. Новые поступления следуют распределению Пуассона с общей интенсивностью λ = λᵢ + λⱼ. Каждая очередь распространяет информацию о своем состоянии арендаторам с интервалом r секунд, вводя определенную степень устаревания. Цель состоит в минимизации составной метрики производительности, включающей среднюю задержку, события переключения и отказы (нетерпеливость арендаторов).

Архитектура модели

1. Марковская модель скорости обслуживания

Распределение скорости обслуживания очереди i или j в установившемся состоянии следует K-состояниям непрерывной марковской цепи (CTMC) со скоростями обслуживания {μᵢ}ᵢ₌₁ᴷ и {μⱼ}ⱼ₌₁ᴷ. Эффективная скорость обслуживания определяется как:

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

где πₓᵢ и πᵧⱼ — стационарные вероятности.

2. Модель динамики длины очереди — распределение времени изменения (ICD)

Эта модель количественно определяет частоту переходов в системе очередей. Для очереди в состоянии n только события прибытия изменяют состояние при n=0, а при n≥1 состояние могут изменить события прибытия или обслуживания. Марковская модель определяется как:

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

Ожидаемое время между изменениями:

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

3. Стохастическое доминирование первого порядка (FSD)

Определение более предпочтительной очереди путем сравнения кумулятивных функций распределения FX(μₖ) и FY(μₖ). Если PX > x ≥ PY > x ∀x ∈ ℝ, то X стохастически доминирует Y первого порядка.

Моделирование поведения

Поведение отказа

Вероятность отказа на основе FSD определяется как:

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

где Δ = Tₗₒcₐₗ - ηr, η ∈ 0,1 представляет степень устаревания информации.

Поведение переключения

Вероятность переключения на основе ICD моделируется с использованием сигмоидной функции:

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

Задача оптимизации

Задача совместной оптимизации формализуется как:

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

При ограничениях: μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

Технические инновации

Абстракция информации: Сложное состояние очереди абстрагируется в две компактные марковские модели, подходящие для каналов управления с ограниченной полосой пропускания.
Адаптивное обучение: Стратегия предсказания на основе правил способна обучаться на ответах арендаторов и адаптировать скорость обслуживания в режиме реального времени.
Проектирование устойчивости: Учитывается устаревание информации и частичная наблюдаемость, что лучше соответствует реальным граничным вычислительным средам.

Экспериментальная установка

Параметры экспериментов

Интервалы распространения: r ∈ {3, 5, 7, 9} секунд
Диапазон интенсивности поступлений: 3 ≤ λ ≤ 17
300 прогонов моделирования для каждой конфигурации
Установка системы M/M/2

Метрики оценки

Средняя задержка
Коэффициент отказа
Коэффициент переключения
Значение составной целевой функции (комбинирующей задержку и меры нетерпеливости)

Методы сравнения

Базовый вариант без стратегии
Классическая централизованная стратегия точки защиты MDP
Предложенная стратегия предсказания на основе правил

Результаты экспериментов

Основные результаты

Сравнение информационных моделей: Марковская модель скорости обслуживания приводит к меньшему нетерпеливому поведению по сравнению с моделью времени изменения длины очереди, так как обеспечивает прямое отображение скорости обработки.
Оптимизация частоты распространения: Оптимальность достигается при интервалах 5-7 секунд, при которых нетерпеливость минимизируется и система стабильна, особенно когда запросы получают информацию о скорости обслуживания.
Сравнение стратегий:
- Стратегия точки защиты: более стабильна, но с более высокими коэффициентами отказа и переключения
- Стратегия на основе правил: более изменчива, но может регистрировать более низкие коэффициенты при меньших интервалах
Эффект оптимизации: Оптимизированная стратегия статистически устойчива, производя более низкие и последовательные значения целевой функции (среднее=0,53 против 1,78 без оптимизации).

Ключевые находки

Согласно количественному резюме в таблице I:

Меньшая вариативность оптимизированных результатов (стандартное отклонение=0,15 против 0,97)
Среднее улучшение составляет 1,26
Лучшие решения находятся при всех интервалах распространения

Анализ времени ожидания

При внедрении стратегии время ожидания запросов с отказом и переключением значительно снижается, особенно при трансляции марковской модели скорости обслуживания наблюдается большая оптимальность.

Связанные работы

Основные направления исследований в этой области включают:

Стратегии раскрытия информации в системах массового обслуживания
Децентрализованное управление многосерверными системами
Распределение ресурсов в граничных вычислениях
Моделирование поведения нетерпеливых клиентов

Преимущества данной работы по сравнению с связанными исследованиями:

Учитывается влияние устаревания информации
Предоставляются решения, подходящие для децентрализованных сред
Интегрируются механизмы обучения и адаптации

Заключение и обсуждение

Основные выводы

Информация о состоянии системы играет ключевую роль в формировании решений нетерпеливых арендаторов
Стратегия предсказания на основе правил демонстрирует большую устойчивость к устареванию информации
Надлежащая частота раскрытия информации критична для производительности системы
Марковская модель скорости обслуживания более эффективна, чем модель динамики очереди

Ограничения

Ограничено установкой M/M/2 Пуассона
Требуется количественная оценка вычислительных и коммуникационных затрат механизма объявления
Не учитываются пакетные, тяжелохвостые процессы поступлений и неэкспоненциальное время обслуживания

Направления будущих исследований

Включение информационных моделей с явными затратами на подписку
Замена эвристики на основе правил методами глубокого обучения с подкреплением
Расширение на многоочередные гетерогенные серверы
Валидация методологии на прототипных платформах тестирования MEC

Глубокая оценка

Преимущества

Инновационность: Предложена новая концепция информационного объявления, открывающая новые подходы к децентрализованному управлению очередями
Практичность: Учитывается устаревание информации и частичная наблюдаемость в реальных граничных вычислительных средах
Теоретическая строгость: Предоставлена полная математическая модель и аналитический каркас
Достаточная экспериментальная валидация: Методология проверена посредством обширных численных экспериментов

Недостатки

Ограничения модели: Рассматривается только система M/M/2, реальные системы более сложны
Чувствительность параметров: Выбор некоторых параметров (таких как δλ, η) недостаточно обоснован теоретически
Анализ вычислительной сложности: Недостаточно детальный анализ сложности решения условий KKT
Валидация на реальных системах: Отсутствуют экспериментальные проверки на реальных системах

Влияние

Академический вклад: Открывает новые направления исследований в теории очередей и граничных вычислениях
Практическая ценность: Имеет руководящее значение для распределения ресурсов в сетях 6G
Масштабируемость: Методологический каркас обладает хорошей масштабируемостью

Применимые сценарии

Метод особенно применим к:

Многоарендаторным системам граничных вычислений
Средам внеземных сетей
Децентрализованным системам с ограниченной передачей информации
Сервисным системам, требующим учета нетерпеливого поведения пользователей

Библиография

Статья цитирует важные работы в областях теории очередей, моделирования поведения и граничных вычислений, включая:

Исследования Y. Ouyang и D. Teneketzis по децентрализованной сигнализации маршрутизации
Работы B. Lin и др. по оптимальным стратегиям для двусерверных систем массового обслуживания
Технические спецификации 3GPP по управлению и оркестрации сетевых срезов

Общая оценка: Это высококачественная исследовательская работа на пересечении теории очередей и граничных вычислений, предлагающая инновационную стратегию раскрытия информации для решения проблемы нетерпеливости арендаторов в децентрализованных средах. Несмотря на некоторые ограничения, её теоретический вклад и практическая ценность делают её важным прогрессом в данной области.