2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten

We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.

academic

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

基本信息

论文ID: 2508.04241
标题: Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
作者: Anthony Kiggundu, Bin Han, Hans D. Schotten
分类: eess.SY (Systems and Control), cs.SY (Systems and Control)
发表时间: 2025年10月13日 (arXiv v2)
机构: German Research Center for Artificial Intelligence (DFKI), RPTU University of Kaiserslautern-Landau
论文链接: https://arxiv.org/abs/2508.04241

摘要

本文研究队列状态信息披露如何影响多租户边缘系统中的不耐烦租户。作者提出了一种信息公告策略，每个队列周期性地广播两个马尔可夫模型：一个是稳态服务率行为模型，另一个是队列长度变化时间模型。租户基于这些信息自主决定是否放弃或转移队列。队列观察租户响应，并通过为分散、部分观察和时变环境设计的学习型基于规则的预测策略来适应服务率。数值实验量化了平均延迟、不耐烦程度和对过时信息鲁棒性之间的权衡。

研究背景与动机

问题定义

在异构5G/6G部署中，多租户资源共享不仅由静态配置驱动，还越来越多地由租户的自主决策驱动（例如，是否将任务卸载到远程队列或本地处理）。队列状态披露（如队列长度、等待时间估计或服务统计）可以显著改变租户行为，并通过队列跳转(jockeying)和放弃(reneging)引发资源竞争。

研究重要性

现代多接入边缘计算(MEC)和非地面网络(NTN)环境具有分散性，存在部分和过时的状态广播，并表现出时变信道和移动性。在这种环境中，假设具有瞬时全局状态的单一中央控制器是不现实的。然而，现有的披露规则和启发式方法通常为静态或轻度移动设置开发，无法回答分散控制的三个基本问题：

应该共享什么状态信息
应该如何表示信息
应该多频繁地分发更新

现有方法局限性

传统的集中式优化方法（如对冲点策略）假设完整、瞬时的状态信息和平稳性条件，但在边缘云和非地面部署的典型条件下，这些假设往往不成立。现有方法在信息变得部分或过时时性能显著下降。

核心贡献

信息公告概念：为多租户队列引入了信息公告概念，并形式化了两个马尔可夫描述符（服务率分布和变化时间）作为适合资源受限控制信道的可调度状态摘要。
理论分析：推导了这些描述符下队列跳转和放弃概率的闭式表达式，并制定了最优权衡延迟、跳转和放弃的联合不耐烦最小化问题。证明了该优化问题在分析上是难处理的。
实用策略：提出了一个实用的基于规则的预测策略，该策略从租户响应中学习服务率向量并在线适应服务率。
全面评估：通过广泛的数值评估量化了不同公告模型和分发间隔的价值，并展示了学习策略在异构工作负载下的鲁棒性。

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

其中πₓᵢ和πᵧⱼ是稳态概率。

2. 队列长度动态模型 - 变化时间分布(ICD)

该模型量化队列系统中转换发生的频率。对于状态为n的队列，当n=0时只有到达事件改变状态，当n≥1时到达或离开事件都可能发生。马尔可夫模型定义为：

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

期望变化间隔时间为：

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

其中Δ = Tₗₒcₐₗ - ηr，η ∈ 0,1表示信息过时程度。

跳转行为

基于ICD的跳转概率使用sigmoid函数建模：

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

优化问题

联合优化问题形式化为：

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

受约束条件：μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

技术创新点

信息抽象：将复杂的队列状态抽象为两个紧凑的马尔可夫模型，适合带宽受限的控制信道。
自适应学习：基于规则的预测策略能够从租户响应中学习并在线适应服务率。
鲁棒性设计：考虑了信息过时性和部分观察性，更适合实际的边缘计算环境。

实验设置

实验参数

分发间隔：r ∈ {3, 5, 7, 9}秒
到达率范围：3 ≤ λ ≤ 17
每个配置运行300次仿真
M/M/2系统设置

评价指标

平均延迟
放弃率
跳转率
复合目标函数值（结合延迟和不耐烦度量）

对比方法

无策略基线
经典集中式MDP对冲点策略
提出的基于规则的预测策略

实验结果

主要结果

信息模型比较：马尔可夫服务率模型比队列长度变化时间模型产生更少的不耐烦行为，因为它提供了处理速度的直接映射。
分发频率优化：在5-7秒间隔之间达到最优性，此时不耐烦程度最小化且系统稳定，特别是当请求获得服务率信息时。
策略比较：
- 对冲点策略：更稳定但放弃和跳转率较高
- 基于规则的策略：更易变但在较低间隔下可能记录更低的率
优化效果：优化策略在统计上是鲁棒的，产生更低且更一致的目标值（均值=0.53 vs 无优化的1.78）。

关键发现

根据表I的定量总结：

优化结果的变异性更小（标准差=0.15 vs 0.97）
平均改进为1.26
在所有分发间隔下都能找到更好的解决方案

系统状态信息在塑造不耐烦租户决策中起关键作用
基于规则的预测策略对信息过时性具有更强的鲁棒性
适当的信息披露频率对系统性能至关重要
马尔可夫服务率模型比队列动态模型更有效

局限性

仅限于M/M/2泊松设置
需要量化公告机制的计算和通信开销
未考虑突发、重尾到达过程和非指数服务时间

未来方向

包含更多抽象订阅成本的信息模型
用强化学习技术替换基于规则的启发式
扩展到多队列异构服务器
在原型MEC测试平台上验证方法

深度评价

优点

创新性：提出了新颖的信息公告概念，为分散队列控制提供了新思路
实用性：考虑了实际边缘计算环境中的信息过时性和部分观察性
理论严谨：提供了完整的数学建模和分析框架
实验充分：通过广泛的数值实验验证了方法的有效性

不足

模型限制：仅考虑M/M/2系统，实际应用中的系统更复杂
参数敏感性：某些参数（如δλ, η）的选择缺乏充分的理论指导
计算复杂度：KKT条件求解的计算复杂度分析不够详细
实际验证：缺乏真实系统上的验证实验

影响力

学术贡献：为排队论和边缘计算领域提供了新的研究方向
实用价值：对6G网络中的资源分配具有指导意义
可扩展性：方法框架具有良好的可扩展性

适用场景

该方法特别适用于：

多租户边缘计算系统
非地面网络环境
信息传输受限的分散系统
需要考虑用户不耐烦行为的服务系统

参考文献

论文引用了排队论、行为建模、边缘计算等领域的重要文献，包括：

Y. Ouyang and D. Teneketzis关于分散路由信令的研究
B. Lin等人关于双服务器排队系统最优策略的工作
3GPP关于网络切片管理和编排的技术规范

总体评价：这是一篇在排队论和边缘计算交叉领域的高质量研究论文，提出了创新的信息披露策略来处理分散环境中的租户不耐烦问题。尽管存在一些局限性，但其理论贡献和实用价值使其成为该领域的重要进展。

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

基本信息

摘要

研究背景与动机

问题定义

研究重要性

现有方法局限性

核心贡献

方法详解

任务定义

模型架构

1. 马尔可夫服务率模型

2. 队列长度动态模型 - 变化时间分布(ICD)

3. 一阶随机占优(FSD)

行为建模

放弃行为

跳转行为

优化问题

技术创新点

实验设置

实验参数

评价指标

对比方法

实验结果

主要结果

关键发现

等待时间分析

相关工作

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献