2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic

적응형 분산 큐 공개 공시: 엣지 및 비지상 시스템의 성급한 테넌트를 위한

기본 정보

  • 논문 ID: 2508.04241
  • 제목: Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
  • 저자: Anthony Kiggundu, Bin Han, Hans D. Schotten
  • 분류: eess.SY (시스템 및 제어), cs.SY (시스템 및 제어)
  • 발표 시간: 2025년 10월 13일 (arXiv v2)
  • 기관: 독일 인공지능 연구센터 (DFKI), RPTU 카이저슬라우테른-란다우 대학
  • 논문 링크: https://arxiv.org/abs/2508.04241

초록

본 논문은 다중 테넌트 엣지 시스템에서 큐 상태 정보 공개가 성급한 테넌트에 미치는 영향을 연구한다. 저자들은 각 큐가 주기적으로 두 개의 마르코프 모델을 브로드캐스트하는 정보 공시 전략을 제안한다: 하나는 정상 상태 서비스율 행동 모델이고, 다른 하나는 큐 길이 변화 시간 모델이다. 테넌트는 이 정보를 기반으로 큐를 포기하거나 이동할지 자율적으로 결정한다. 큐는 테넌트 응답을 관찰하고 분산, 부분 관찰 및 시변 환경을 위해 설계된 학습 기반 규칙 예측 전략을 통해 서비스율에 적응한다. 수치 실험은 평균 지연, 성급함 정도 및 오래된 정보에 대한 견고성 간의 트레이드오프를 정량화한다.

연구 배경 및 동기

문제 정의

이질적인 5G/6G 배포에서 다중 테넌트 리소스 공유는 정적 구성뿐만 아니라 테넌트의 자율적 결정(예: 작업을 원격 큐로 오프로드할지 또는 로컬에서 처리할지)에 의해 점점 더 많이 주도된다. 큐 상태 공개(예: 큐 길이, 대기 시간 추정 또는 서비스 통계)는 테넌트 행동을 크게 변경할 수 있으며 큐 점핑(jockeying)과 포기(reneging)를 통해 리소스 경쟁을 유발한다.

연구의 중요성

현대의 다중 접속 엣지 컴퓨팅(MEC) 및 비지상 네트워크(NTN) 환경은 분산적이며, 부분적이고 오래된 상태 브로드캐스트가 존재하고 시변 채널 및 이동성을 나타낸다. 이러한 환경에서 순간적인 전역 상태를 가진 단일 중앙 제어기를 가정하는 것은 비현실적이다. 그러나 기존의 공개 규칙 및 휴리스틱은 일반적으로 정적 또는 경미한 이동 설정을 위해 개발되었으며 분산 제어의 세 가지 기본 질문에 답할 수 없다:

  1. 어떤 상태 정보를 공유해야 하는가
  2. 정보를 어떻게 표현해야 하는가
  3. 업데이트를 얼마나 자주 배포해야 하는가

기존 방법의 한계

전통적인 중앙 집중식 최적화 방법(예: 대피점 정책)은 완전하고 순간적인 상태 정보 및 정상 상태 조건을 가정하지만, 엣지 클라우드 및 비지상 배포의 일반적인 조건에서 이러한 가정은 종종 성립하지 않는다. 기존 방법은 정보가 부분적이거나 오래될 때 성능이 크게 저하된다.

핵심 기여

  1. 정보 공시 개념: 다중 테넌트 큐에 대한 정보 공시 개념을 도입하고 두 개의 마르코프 설명자(서비스율 분포 및 변화 시간)를 리소스 제한 제어 채널에 적합한 조정 가능한 상태 요약으로 형식화했다.
  2. 이론적 분석: 이러한 설명자 하에서 큐 점핑 및 포기 확률의 폐쇄형 표현식을 도출하고 지연, 점핑 및 포기를 최소화하는 결합 불내성 최소화 문제를 공식화했다. 이 최적화 문제가 분석적으로 다루기 어렵다는 것을 증명했다.
  3. 실용적 전략: 테넌트 응답에서 서비스율 벡터를 학습하고 온라인으로 서비스율에 적응하는 실용적인 규칙 기반 예측 전략을 제안했다.
  4. 포괄적 평가: 광범위한 수치 평가를 통해 다양한 공시 모델 및 배포 간격의 가치를 정량화하고 이질적 워크로드 하에서 학습 전략의 견고성을 입증했다.

방법론 상세

작업 정의

두 개의 큐 i와 j를 포함하는 M/M/2 대기열 시스템을 고려한다. 새로운 도착은 포아송 분포를 따르며 총 도착률은 λ = λᵢ + λⱼ이다. 각 큐는 r초 간격으로 테넌트에게 상태 정보를 배포하여 일정한 정도의 오래됨을 도입한다. 목표는 평균 지연, 점핑 이벤트 및 포기(테넌트 성급함)의 복합 성능 측정을 최소화하는 것이다.

모델 아키텍처

1. 마르코프 서비스율 모델

큐 i 또는 j의 정상 상태에서의 서비스율 분포는 K 상태 연속 시간 마르코프 체인(CTMC)을 따르며 서비스율은 {μᵢ}ᵢ₌₁ᴷ 및 {μⱼ}ⱼ₌₁ᴷ이다. 유효 서비스율은 다음과 같이 정의된다:

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

여기서 πₓᵢ와 πᵧⱼ는 정상 상태 확률이다.

2. 큐 길이 동역학 모델 - 변화 시간 분포(ICD)

이 모델은 큐 시스템에서 전이가 발생하는 빈도를 정량화한다. 상태가 n인 큐의 경우, n=0일 때는 도착 이벤트만 상태를 변경하고 n≥1일 때는 도착 또는 출발 이벤트가 발생할 수 있다. 마르코프 모델은 다음과 같이 정의된다:

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

예상 변화 간격 시간은:

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

3. 1차 확률적 우월성(FSD)

누적 분포 함수 FX(μₖ)와 FY(μₖ)를 비교하여 더 나은 큐를 결정한다. PX > x ≥ PY > x ∀x ∈ ℝ이면 X는 Y에 대해 1차 확률적으로 우월하다.

행동 모델링

포기 행동

FSD 기반 포기 확률은 다음과 같이 정의된다:

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

여기서 Δ = Tₗₒcₐₗ - ηr이고 η ∈ 0,1은 정보 오래됨의 정도를 나타낸다.

점핑 행동

ICD 기반 점핑 확률은 시그모이드 함수를 사용하여 모델링된다:

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

최적화 문제

결합 최적화 문제는 다음과 같이 형식화된다:

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

제약 조건: μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

기술적 혁신점

  1. 정보 추상화: 복잡한 큐 상태를 두 개의 컴팩트한 마르코프 모델로 추상화하여 대역폭 제한 제어 채널에 적합하게 했다.
  2. 적응형 학습: 규칙 기반 예측 전략은 테넌트 응답에서 학습하고 온라인으로 서비스율에 적응할 수 있다.
  3. 견고성 설계: 정보 오래됨 및 부분 관찰을 고려하여 실제 엣지 컴퓨팅 환경에 더 적합하다.

실험 설정

실험 매개변수

  • 배포 간격: r ∈ {3, 5, 7, 9}초
  • 도착률 범위: 3 ≤ λ ≤ 17
  • 각 구성당 300회 시뮬레이션 실행
  • M/M/2 시스템 설정

평가 지표

  • 평균 지연
  • 포기율
  • 점핑율
  • 복합 목적 함수값(지연 및 성급함 측정 결합)

비교 방법

  • 전략 없는 기준선
  • 고전적 중앙 집중식 MDP 대피점 정책
  • 제안된 규칙 기반 예측 전략

실험 결과

주요 결과

  1. 정보 모델 비교: 마르코프 서비스율 모델은 큐 길이 변화 시간 모델보다 더 적은 성급함 행동을 생성한다. 이는 처리 속도의 직접적인 매핑을 제공하기 때문이다.
  2. 배포 빈도 최적화: 5-7초 간격에서 최적성에 도달하며, 이때 성급함이 최소화되고 시스템이 안정적이다. 특히 요청이 서비스율 정보를 획득할 때 그렇다.
  3. 전략 비교:
    • 대피점 정책: 더 안정적이지만 포기 및 점핑율이 높음
    • 규칙 기반 전략: 더 변동적이지만 낮은 간격에서 더 낮은 율을 기록할 수 있음
  4. 최적화 효과: 최적화 전략은 통계적으로 견고하며 더 낮고 일관된 목적값을 생성한다(평균=0.53 vs 최적화 없음 1.78).

주요 발견

표 I의 정량적 요약에 따르면:

  • 최적화 결과의 변동성이 더 작다(표준편차=0.15 vs 0.97)
  • 평균 개선은 1.26
  • 모든 배포 간격에서 더 나은 솔루션을 찾을 수 있다

대기 시간 분석

전략을 내장할 때 포기 및 점핑 요청의 대기 시간이 크게 감소한다. 특히 마르코프 서비스율 모델을 배포할 때 더 많은 최적성이 관찰된다.

관련 연구

이 분야의 주요 연구 방향은 다음을 포함한다:

  1. 대기열 시스템의 정보 공개 정책
  2. 다중 서버 시스템의 분산 제어
  3. 엣지 컴퓨팅의 리소스 할당
  4. 성급한 고객의 행동 모델링

본 논문의 관련 연구 대비 장점:

  • 정보 오래됨의 영향을 고려
  • 분산 환경에 적합한 솔루션 제공
  • 학습 및 적응 메커니즘 결합

결론 및 논의

주요 결론

  1. 시스템 상태 정보는 성급한 테넌트의 결정을 형성하는 데 중요한 역할을 한다
  2. 규칙 기반 예측 전략은 정보 오래됨에 대해 더 강한 견고성을 가진다
  3. 적절한 정보 공개 빈도는 시스템 성능에 필수적이다
  4. 마르코프 서비스율 모델은 큐 동역학 모델보다 더 효과적이다

한계

  1. M/M/2 포아송 설정으로만 제한됨
  2. 공시 메커니즘의 계산 및 통신 오버헤드 정량화 필요
  3. 버스트, 무거운 꼬리 도착 프로세스 및 비지수 서비스 시간 미고려

향후 방향

  1. 더 많은 추상 구독 비용을 포함하는 정보 모델
  2. 규칙 기반 휴리스틱을 강화 학습 기술로 대체
  3. 다중 큐 이질적 서버로 확장
  4. 프로토타입 MEC 테스트 플랫폼에서 방법 검증

심층 평가

장점

  1. 혁신성: 분산 큐 제어를 위한 새로운 정보 공시 개념을 제안하여 새로운 연구 방향 제시
  2. 실용성: 실제 엣지 컴퓨팅 환경의 정보 오래됨 및 부분 관찰 고려
  3. 이론적 엄밀성: 완전한 수학적 모델링 및 분석 프레임워크 제공
  4. 충분한 실험: 광범위한 수치 실험을 통해 방법의 효과성 검증

부족한 점

  1. 모델 제한: M/M/2 시스템만 고려하며 실제 응용의 시스템은 더 복잡함
  2. 매개변수 민감성: 일부 매개변수(예: δλ, η)의 선택에 충분한 이론적 지침 부족
  3. 계산 복잡도: KKT 조건 해결의 계산 복잡도 분석이 충분하지 않음
  4. 실제 검증: 실제 시스템에서의 검증 실험 부족

영향력

  1. 학술 기여: 대기열 이론 및 엣지 컴퓨팅 분야에 새로운 연구 방향 제공
  2. 실용적 가치: 6G 네트워크의 리소스 할당에 지침 제공
  3. 확장성: 방법 프레임워크는 우수한 확장성을 가짐

적용 시나리오

이 방법은 특히 다음에 적합하다:

  1. 다중 테넌트 엣지 컴퓨팅 시스템
  2. 비지상 네트워크 환경
  3. 정보 전송이 제한된 분산 시스템
  4. 사용자 성급함 행동을 고려해야 하는 서비스 시스템

참고문헌

논문은 대기열 이론, 행동 모델링, 엣지 컴퓨팅 등 분야의 중요 문헌을 인용하며, 다음을 포함한다:

  • Y. Ouyang과 D. Teneketzis의 분산 라우팅 신호에 관한 연구
  • B. Lin 등의 이중 서버 대기열 시스템 최적 정책 연구
  • 네트워크 슬라이싱 관리 및 오케스트레이션에 관한 3GPP 기술 규격

전체 평가: 이는 대기열 이론과 엣지 컴퓨팅의 교차 분야에서의 고품질 연구 논문으로, 분산 환경에서 테넌트 성급함 문제를 처리하기 위한 혁신적인 정보 공개 전략을 제안한다. 일부 한계에도 불구하고 이론적 기여와 실용적 가치로 인해 이 분야의 중요한 진전이 된다.