Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic
Divulgation Adaptative et Décentralisée des Files d'Attente pour les Locataires Impatients dans les Systèmes Terrestres et Non-Terrestres
Cet article étudie comment la divulgation d'informations sur l'état des files d'attente affecte les locataires impatients dans les systèmes multi-locataires de périphérie. Les auteurs proposent une stratégie d'annonce d'informations où chaque file d'attente diffuse périodiquement deux modèles markoviens : un modèle de comportement du taux de service en régime permanent et un modèle de temps de variation de la longueur de file. Les locataires décident de manière autonome d'abandonner ou de changer de file en fonction de ces informations. La file d'attente observe les réponses des locataires et s'adapte au taux de service par le biais d'une stratégie de prédiction basée sur des règles et conçue pour les environnements décentralisés, partiellement observables et variant dans le temps. Les expériences numériques quantifient les compromis entre le délai moyen, le degré d'impatience et la robustesse aux informations obsolètes.
Dans les déploiements hétérogènes 5G/6G, le partage de ressources multi-locataires n'est pas seulement régi par des configurations statiques, mais de plus en plus par les décisions autonomes des locataires (par exemple, décharger les tâches vers une file d'attente distante ou traiter localement). La divulgation de l'état de la file d'attente (telle que la longueur de la file, les estimations de temps d'attente ou les statistiques de service) peut modifier considérablement le comportement des locataires et déclencher une concurrence pour les ressources par le biais du changement de file (jockeying) et de l'abandon (reneging).
Les environnements modernes d'informatique en périphérie multi-accès (MEC) et de réseaux non-terrestres (NTN) sont décentralisés, avec des diffusions d'état partielles et obsolètes, et présentent des canaux variant dans le temps et de la mobilité. Dans ces environnements, supposer un contrôleur central unique disposant d'un état global instantané est irréaliste. Cependant, les règles de divulgation et les heuristiques existantes sont généralement développées pour des configurations statiques ou légèrement mobiles et ne peuvent pas répondre à trois questions fondamentales du contrôle décentralisé :
Quelles informations d'état doivent être partagées
Comment les informations doivent-elles être représentées
À quelle fréquence les mises à jour doivent-elles être distribuées
Les méthodes d'optimisation centralisées traditionnelles (telles que les stratégies de point de couverture) supposent des informations d'état complètes et instantanées ainsi que des conditions de stationnarité, mais ces hypothèses ne sont souvent pas valides dans les conditions typiques des déploiements de cloud périphérique et non-terrestre. Les approches existantes voient leurs performances diminuer considérablement lorsque les informations deviennent partielles ou obsolètes.
Concept de Divulgation d'Informations : Introduction du concept de divulgation d'informations pour les files d'attente multi-locataires et formalisation de deux descripteurs markoviens (distribution du taux de service et temps de variation) comme résumés d'état adaptables convenant aux canaux de contrôle à ressources limitées.
Analyse Théorique : Dérivation d'expressions en forme fermée pour les probabilités de changement de file et d'abandon sous ces descripteurs, et formulation d'un problème d'optimisation conjointe minimisant les compromis entre délai, changement de file et abandon. Preuve que le problème d'optimisation est analytiquement intraitable.
Stratégie Pratique : Proposition d'une stratégie de prédiction pratique basée sur des règles qui apprend le vecteur de taux de service à partir des réponses des locataires et adapte le taux de service en ligne.
Évaluation Complète : Évaluation numérique extensive quantifiant la valeur de différents modèles d'annonce et intervalles de distribution, démontrant la robustesse de la stratégie d'apprentissage sous des charges de travail hétérogènes.
Considération d'un système de files d'attente M/M/2 contenant deux files i et j. Les nouvelles arrivées suivent une distribution de Poisson, avec un taux d'arrivée total λ = λᵢ + λⱼ. Chaque file distribue ses informations d'état aux locataires à intervalles r secondes, introduisant une certaine obsolescence. L'objectif est de minimiser une mesure de performance composite combinant délai moyen, événements de changement de file et abandon (impatience des locataires).
La distribution du taux de service de la file i ou j en régime permanent suit une chaîne de Markov en temps continu (CTMC) à K états, avec taux de service {μᵢ}ᵢ₌₁ᴷ et {μⱼ}ⱼ₌₁ᴷ. Le taux de service effectif est défini comme :
μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ
où πₓᵢ et πᵧⱼ sont les probabilités en régime permanent.
Ce modèle quantifie la fréquence des transitions dans le système de files d'attente. Pour une file à l'état n, seuls les événements d'arrivée modifient l'état lorsque n=0, tandis que les événements d'arrivée ou de départ peuvent se produire lorsque n≥1. Le modèle markovien est défini comme :
Détermination de la meilleure file en comparant les fonctions de distribution cumulative FX(μₖ) et FY(μₖ). Si PX > x ≥ PY > x ∀x ∈ ℝ, alors X domine stochastiquement Y au premier ordre.
Abstraction d'Informations : Abstraction de l'état complexe de la file d'attente en deux modèles markoviens compacts, adaptés aux canaux de contrôle à bande passante limitée.
Apprentissage Adaptatif : La stratégie de prédiction basée sur des règles peut apprendre à partir des réponses des locataires et adapter le taux de service en ligne.
Conception Robuste : Prise en compte de l'obsolescence des informations et de l'observabilité partielle, plus adaptée aux environnements réels d'informatique périphérique.
Comparaison des Modèles d'Information : Le modèle markovien du taux de service produit moins de comportements impatients que le modèle de temps de variation de la longueur de file, car il fournit un mappage direct de la vitesse de traitement.
Optimisation de la Fréquence de Distribution : Optimalité atteinte entre les intervalles de 5-7 secondes, où le degré d'impatience est minimisé et le système stable, particulièrement lorsque les demandes reçoivent des informations sur le taux de service.
Comparaison des Stratégies :
Stratégie de point de couverture : Plus stable mais avec des taux d'abandon et de changement de file plus élevés
Stratégie basée sur des règles : Plus variable mais peut enregistrer des taux plus faibles à intervalles plus courts
Effet d'Optimisation : La stratégie optimisée est statistiquement robuste, produisant des valeurs objectif plus faibles et plus cohérentes (moyenne=0,53 vs 1,78 sans optimisation).
Lors de l'intégration de la stratégie, le temps d'attente des demandes abandonnées et changeant de file diminue considérablement, avec une optimalité plus importante observée lors de la diffusion du modèle markovien du taux de service.
Innovativité : Proposition d'un concept novateur de divulgation d'informations offrant de nouvelles perspectives pour le contrôle décentralisé des files d'attente
Praticité : Prise en compte de l'obsolescence des informations et de l'observabilité partielle dans les environnements réels d'informatique périphérique
Rigueur Théorique : Fourniture d'un cadre complet de modélisation et d'analyse mathématique
Expérimentation Suffisante : Validation de l'efficacité de la méthode par des expériences numériques étendues
Contribution Académique : Fourniture de nouvelles directions de recherche pour les domaines de la théorie des files d'attente et de l'informatique périphérique
Valeur Pratique : Orientation pour l'allocation de ressources dans les réseaux 6G
Extensibilité : Cadre méthodologique présentant une bonne extensibilité
L'article cite des travaux importants dans les domaines de la théorie des files d'attente, de la modélisation comportementale et de l'informatique périphérique, notamment :
Recherches de Y. Ouyang et D. Teneketzis sur la signalisation de routage décentralisée
Travaux de B. Lin et al. sur les stratégies optimales pour les systèmes de files d'attente à deux serveurs
Spécifications techniques 3GPP sur la gestion et l'orchestration du découpage de réseau
Évaluation Globale : Cet article est une recherche de haute qualité dans le domaine interdisciplinaire de la théorie des files d'attente et de l'informatique périphérique, proposant une stratégie innovante de divulgation d'informations pour traiter le problème de l'impatience des locataires dans les environnements décentralisés. Malgré certaines limitations, ses contributions théoriques et sa valeur pratique en font un progrès important dans ce domaine.