Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic
Адаптивное децентрализованное раскрытие информации об очередях для нетерпеливых арендаторов в граничных и внеземных системах
В данной работе исследуется влияние раскрытия информации о состоянии очередей на нетерпеливых арендаторов в многоарендаторных граничных системах. Авторы предлагают стратегию информационного объявления, при которой каждая очередь периодически транслирует две марковские модели: одну для поведения стационарной скорости обслуживания и другую для модели времени изменения длины очереди. Арендаторы самостоятельно принимают решения о покидании или переводе очереди на основе этой информации. Очередь наблюдает ответные действия арендаторов и адаптирует скорость обслуживания посредством стратегии предсказания на основе правил, разработанной для децентрализованной, частично наблюдаемой и нестационарной среды. Численные эксперименты количественно оценивают компромиссы между средней задержкой, степенью нетерпеливости и устойчивостью к устаревшей информации.
В гетерогенных развертываниях 5G/6G совместное использование ресурсов в многоарендаторных системах определяется не только статической конфигурацией, но все чаще автономными решениями арендаторов (например, разгружать ли задачи на удаленную очередь или обрабатывать локально). Раскрытие информации о состоянии очередей (такой как длина очереди, оценки времени ожидания или статистика обслуживания) может значительно изменить поведение арендаторов и вызвать конкуренцию за ресурсы посредством переключения между очередями (jockeying) и отказа (reneging).
Современные среды многопользовательского граничного вычисления (MEC) и внеземных сетей (NTN) характеризуются децентрализацией, наличием частичных и устаревших трансляций состояния, а также проявляют нестационарные каналы и мобильность. В такой среде предположение о едином центральном контроллере с мгновенным глобальным состоянием нереалистично. Однако существующие правила раскрытия и эвристические подходы обычно разработаны для статических или слабо мобильных сценариев и не могут ответить на три фундаментальных вопроса децентрализованного управления:
Традиционные методы централизованной оптимизации (такие как стратегия точки защиты) предполагают полную, мгновенную информацию о состоянии и условия стационарности, которые часто не выполняются в типичных условиях граничных облаков и внеземных развертываний. Производительность существующих методов значительно снижается, когда информация становится частичной или устаревшей.
Концепция информационного объявления: Введена концепция информационного объявления для многоарендаторных очередей и формализованы два марковских дескриптора (распределение скорости обслуживания и время изменения) как настраиваемые резюме состояния, подходящие для каналов управления с ограниченной полосой пропускания.
Теоретический анализ: Выведены замкнутые выражения для вероятностей переключения между очередями и отказа при этих дескрипторах, сформулирована задача совместной минимизации нетерпеливости, балансирующая задержку, переключение и отказ. Доказано, что задача оптимизации аналитически неразрешима.
Практическая стратегия: Предложена практическая стратегия предсказания на основе правил, которая обучается на ответах арендаторов и адаптирует вектор скорости обслуживания в режиме реального времени.
Комплексная оценка: Посредством обширной численной оценки количественно определена ценность различных моделей объявлений и интервалов распространения, продемонстрирована устойчивость стратегии обучения при гетерогенных рабочих нагрузках.
Рассматривается система массового обслуживания M/M/2 с двумя очередями i и j. Новые поступления следуют распределению Пуассона с общей интенсивностью λ = λᵢ + λⱼ. Каждая очередь распространяет информацию о своем состоянии арендаторам с интервалом r секунд, вводя определенную степень устаревания. Цель состоит в минимизации составной метрики производительности, включающей среднюю задержку, события переключения и отказы (нетерпеливость арендаторов).
Распределение скорости обслуживания очереди i или j в установившемся состоянии следует K-состояниям непрерывной марковской цепи (CTMC) со скоростями обслуживания {μᵢ}ᵢ₌₁ᴷ и {μⱼ}ⱼ₌₁ᴷ. Эффективная скорость обслуживания определяется как:
Эта модель количественно определяет частоту переходов в системе очередей. Для очереди в состоянии n только события прибытия изменяют состояние при n=0, а при n≥1 состояние могут изменить события прибытия или обслуживания. Марковская модель определяется как:
Определение более предпочтительной очереди путем сравнения кумулятивных функций распределения FX(μₖ) и FY(μₖ). Если PX > x ≥ PY > x ∀x ∈ ℝ, то X стохастически доминирует Y первого порядка.
Абстракция информации: Сложное состояние очереди абстрагируется в две компактные марковские модели, подходящие для каналов управления с ограниченной полосой пропускания.
Адаптивное обучение: Стратегия предсказания на основе правил способна обучаться на ответах арендаторов и адаптировать скорость обслуживания в режиме реального времени.
Проектирование устойчивости: Учитывается устаревание информации и частичная наблюдаемость, что лучше соответствует реальным граничным вычислительным средам.
Сравнение информационных моделей: Марковская модель скорости обслуживания приводит к меньшему нетерпеливому поведению по сравнению с моделью времени изменения длины очереди, так как обеспечивает прямое отображение скорости обработки.
Оптимизация частоты распространения: Оптимальность достигается при интервалах 5-7 секунд, при которых нетерпеливость минимизируется и система стабильна, особенно когда запросы получают информацию о скорости обслуживания.
Сравнение стратегий:
Стратегия точки защиты: более стабильна, но с более высокими коэффициентами отказа и переключения
Стратегия на основе правил: более изменчива, но может регистрировать более низкие коэффициенты при меньших интервалах
Эффект оптимизации: Оптимизированная стратегия статистически устойчива, производя более низкие и последовательные значения целевой функции (среднее=0,53 против 1,78 без оптимизации).
При внедрении стратегии время ожидания запросов с отказом и переключением значительно снижается, особенно при трансляции марковской модели скорости обслуживания наблюдается большая оптимальность.
Статья цитирует важные работы в областях теории очередей, моделирования поведения и граничных вычислений, включая:
Исследования Y. Ouyang и D. Teneketzis по децентрализованной сигнализации маршрутизации
Работы B. Lin и др. по оптимальным стратегиям для двусерверных систем массового обслуживания
Технические спецификации 3GPP по управлению и оркестрации сетевых срезов
Общая оценка: Это высококачественная исследовательская работа на пересечении теории очередей и граничных вычислений, предлагающая инновационную стратегию раскрытия информации для решения проблемы нетерпеливости арендаторов в децентрализованных средах. Несмотря на некоторые ограничения, её теоретический вклад и практическая ценность делают её важным прогрессом в данной области.