Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
본 논문은 다중 테넌트 엣지 시스템에서 큐 상태 정보 공개가 성급한 테넌트에 미치는 영향을 연구한다. 저자들은 각 큐가 주기적으로 두 개의 마르코프 모델을 브로드캐스트하는 정보 공시 전략을 제안한다: 하나는 정상 상태 서비스율 행동 모델이고, 다른 하나는 큐 길이 변화 시간 모델이다. 테넌트는 이 정보를 기반으로 큐를 포기하거나 이동할지 자율적으로 결정한다. 큐는 테넌트 응답을 관찰하고 분산, 부분 관찰 및 시변 환경을 위해 설계된 학습 기반 규칙 예측 전략을 통해 서비스율에 적응한다. 수치 실험은 평균 지연, 성급함 정도 및 오래된 정보에 대한 견고성 간의 트레이드오프를 정량화한다.
이질적인 5G/6G 배포에서 다중 테넌트 리소스 공유는 정적 구성뿐만 아니라 테넌트의 자율적 결정(예: 작업을 원격 큐로 오프로드할지 또는 로컬에서 처리할지)에 의해 점점 더 많이 주도된다. 큐 상태 공개(예: 큐 길이, 대기 시간 추정 또는 서비스 통계)는 테넌트 행동을 크게 변경할 수 있으며 큐 점핑(jockeying)과 포기(reneging)를 통해 리소스 경쟁을 유발한다.
현대의 다중 접속 엣지 컴퓨팅(MEC) 및 비지상 네트워크(NTN) 환경은 분산적이며, 부분적이고 오래된 상태 브로드캐스트가 존재하고 시변 채널 및 이동성을 나타낸다. 이러한 환경에서 순간적인 전역 상태를 가진 단일 중앙 제어기를 가정하는 것은 비현실적이다. 그러나 기존의 공개 규칙 및 휴리스틱은 일반적으로 정적 또는 경미한 이동 설정을 위해 개발되었으며 분산 제어의 세 가지 기본 질문에 답할 수 없다:
전통적인 중앙 집중식 최적화 방법(예: 대피점 정책)은 완전하고 순간적인 상태 정보 및 정상 상태 조건을 가정하지만, 엣지 클라우드 및 비지상 배포의 일반적인 조건에서 이러한 가정은 종종 성립하지 않는다. 기존 방법은 정보가 부분적이거나 오래될 때 성능이 크게 저하된다.
두 개의 큐 i와 j를 포함하는 M/M/2 대기열 시스템을 고려한다. 새로운 도착은 포아송 분포를 따르며 총 도착률은 λ = λᵢ + λⱼ이다. 각 큐는 r초 간격으로 테넌트에게 상태 정보를 배포하여 일정한 정도의 오래됨을 도입한다. 목표는 평균 지연, 점핑 이벤트 및 포기(테넌트 성급함)의 복합 성능 측정을 최소화하는 것이다.