2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten

We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.

academic

Divulgation Adaptative et Décentralisée des Files d'Attente pour les Locataires Impatients dans les Systèmes Terrestres et Non-Terrestres

Informations Fondamentales

ID de l'article : 2508.04241
Titre : Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Auteurs : Anthony Kiggundu, Bin Han, Hans D. Schotten
Classification : eess.SY (Systèmes et Contrôle), cs.SY (Systèmes et Contrôle)
Date de publication : 13 octobre 2025 (arXiv v2)
Institutions : Centre de Recherche Allemand pour l'Intelligence Artificielle (DFKI), Université RPTU de Kaiserslautern-Landau
Lien de l'article : https://arxiv.org/abs/2508.04241

Résumé

Cet article étudie comment la divulgation d'informations sur l'état des files d'attente affecte les locataires impatients dans les systèmes multi-locataires de périphérie. Les auteurs proposent une stratégie d'annonce d'informations où chaque file d'attente diffuse périodiquement deux modèles markoviens : un modèle de comportement du taux de service en régime permanent et un modèle de temps de variation de la longueur de file. Les locataires décident de manière autonome d'abandonner ou de changer de file en fonction de ces informations. La file d'attente observe les réponses des locataires et s'adapte au taux de service par le biais d'une stratégie de prédiction basée sur des règles et conçue pour les environnements décentralisés, partiellement observables et variant dans le temps. Les expériences numériques quantifient les compromis entre le délai moyen, le degré d'impatience et la robustesse aux informations obsolètes.

Contexte et Motivation de la Recherche

Définition du Problème

Dans les déploiements hétérogènes 5G/6G, le partage de ressources multi-locataires n'est pas seulement régi par des configurations statiques, mais de plus en plus par les décisions autonomes des locataires (par exemple, décharger les tâches vers une file d'attente distante ou traiter localement). La divulgation de l'état de la file d'attente (telle que la longueur de la file, les estimations de temps d'attente ou les statistiques de service) peut modifier considérablement le comportement des locataires et déclencher une concurrence pour les ressources par le biais du changement de file (jockeying) et de l'abandon (reneging).

Importance de la Recherche

Les environnements modernes d'informatique en périphérie multi-accès (MEC) et de réseaux non-terrestres (NTN) sont décentralisés, avec des diffusions d'état partielles et obsolètes, et présentent des canaux variant dans le temps et de la mobilité. Dans ces environnements, supposer un contrôleur central unique disposant d'un état global instantané est irréaliste. Cependant, les règles de divulgation et les heuristiques existantes sont généralement développées pour des configurations statiques ou légèrement mobiles et ne peuvent pas répondre à trois questions fondamentales du contrôle décentralisé :

Quelles informations d'état doivent être partagées
Comment les informations doivent-elles être représentées
À quelle fréquence les mises à jour doivent-elles être distribuées

Limitations des Approches Existantes

Les méthodes d'optimisation centralisées traditionnelles (telles que les stratégies de point de couverture) supposent des informations d'état complètes et instantanées ainsi que des conditions de stationnarité, mais ces hypothèses ne sont souvent pas valides dans les conditions typiques des déploiements de cloud périphérique et non-terrestre. Les approches existantes voient leurs performances diminuer considérablement lorsque les informations deviennent partielles ou obsolètes.

Contributions Principales

Concept de Divulgation d'Informations : Introduction du concept de divulgation d'informations pour les files d'attente multi-locataires et formalisation de deux descripteurs markoviens (distribution du taux de service et temps de variation) comme résumés d'état adaptables convenant aux canaux de contrôle à ressources limitées.
Analyse Théorique : Dérivation d'expressions en forme fermée pour les probabilités de changement de file et d'abandon sous ces descripteurs, et formulation d'un problème d'optimisation conjointe minimisant les compromis entre délai, changement de file et abandon. Preuve que le problème d'optimisation est analytiquement intraitable.
Stratégie Pratique : Proposition d'une stratégie de prédiction pratique basée sur des règles qui apprend le vecteur de taux de service à partir des réponses des locataires et adapte le taux de service en ligne.
Évaluation Complète : Évaluation numérique extensive quantifiant la valeur de différents modèles d'annonce et intervalles de distribution, démontrant la robustesse de la stratégie d'apprentissage sous des charges de travail hétérogènes.

Détails de la Méthode

Définition de la Tâche

Considération d'un système de files d'attente M/M/2 contenant deux files i et j. Les nouvelles arrivées suivent une distribution de Poisson, avec un taux d'arrivée total λ = λᵢ + λⱼ. Chaque file distribue ses informations d'état aux locataires à intervalles r secondes, introduisant une certaine obsolescence. L'objectif est de minimiser une mesure de performance composite combinant délai moyen, événements de changement de file et abandon (impatience des locataires).

Architecture du Modèle

1. Modèle Markovien du Taux de Service

La distribution du taux de service de la file i ou j en régime permanent suit une chaîne de Markov en temps continu (CTMC) à K états, avec taux de service {μᵢ}ᵢ₌₁ᴷ et {μⱼ}ⱼ₌₁ᴷ. Le taux de service effectif est défini comme :

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

où πₓᵢ et πᵧⱼ sont les probabilités en régime permanent.

2. Modèle Dynamique de la Longueur de File - Distribution du Temps de Variation (ICD)

Ce modèle quantifie la fréquence des transitions dans le système de files d'attente. Pour une file à l'état n, seuls les événements d'arrivée modifient l'état lorsque n=0, tandis que les événements d'arrivée ou de départ peuvent se produire lorsque n≥1. Le modèle markovien est défini comme :

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

Le temps d'intervalle de variation attendu est :

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

3. Dominance Stochastique du Premier Ordre (FSD)

Détermination de la meilleure file en comparant les fonctions de distribution cumulative FX(μₖ) et FY(μₖ). Si PX > x ≥ PY > x ∀x ∈ ℝ, alors X domine stochastiquement Y au premier ordre.

Modélisation du Comportement

Comportement d'Abandon

La probabilité d'abandon basée sur FSD est définie comme :

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

où Δ = Tₗₒcₐₗ - ηr, η ∈ 0,1 représente le degré d'obsolescence de l'information.

Comportement de Changement de File

La probabilité de changement de file basée sur ICD est modélisée à l'aide d'une fonction sigmoïde :

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

Problème d'Optimisation

Le problème d'optimisation conjointe est formalisé comme :

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

Sous les contraintes : μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

Points d'Innovation Technique

Abstraction d'Informations : Abstraction de l'état complexe de la file d'attente en deux modèles markoviens compacts, adaptés aux canaux de contrôle à bande passante limitée.
Apprentissage Adaptatif : La stratégie de prédiction basée sur des règles peut apprendre à partir des réponses des locataires et adapter le taux de service en ligne.
Conception Robuste : Prise en compte de l'obsolescence des informations et de l'observabilité partielle, plus adaptée aux environnements réels d'informatique périphérique.

Configuration Expérimentale

Paramètres Expérimentaux

Intervalles de distribution : r ∈ {3, 5, 7, 9} secondes
Plage de taux d'arrivée : 3 ≤ λ ≤ 17
300 simulations par configuration
Configuration du système M/M/2

Indicateurs d'Évaluation

Délai moyen
Taux d'abandon
Taux de changement de file
Valeur de la fonction objectif composite (combinant délai et mesures d'impatience)

Méthodes de Comparaison

Ligne de base sans stratégie
Stratégie classique de point de couverture MDP centralisée
Stratégie de prédiction basée sur des règles proposée

Résultats Expérimentaux

Résultats Principaux

Comparaison des Modèles d'Information : Le modèle markovien du taux de service produit moins de comportements impatients que le modèle de temps de variation de la longueur de file, car il fournit un mappage direct de la vitesse de traitement.
Optimisation de la Fréquence de Distribution : Optimalité atteinte entre les intervalles de 5-7 secondes, où le degré d'impatience est minimisé et le système stable, particulièrement lorsque les demandes reçoivent des informations sur le taux de service.
Comparaison des Stratégies :
- Stratégie de point de couverture : Plus stable mais avec des taux d'abandon et de changement de file plus élevés
- Stratégie basée sur des règles : Plus variable mais peut enregistrer des taux plus faibles à intervalles plus courts
Effet d'Optimisation : La stratégie optimisée est statistiquement robuste, produisant des valeurs objectif plus faibles et plus cohérentes (moyenne=0,53 vs 1,78 sans optimisation).

Conclusions Clés

Selon le résumé quantitatif du tableau I :

Variabilité réduite des résultats optimisés (écart-type=0,15 vs 0,97)
Amélioration moyenne de 1,26
Meilleures solutions trouvées pour tous les intervalles de distribution

Analyse du Temps d'Attente

Lors de l'intégration de la stratégie, le temps d'attente des demandes abandonnées et changeant de file diminue considérablement, avec une optimalité plus importante observée lors de la diffusion du modèle markovien du taux de service.

Travaux Connexes

Les principales directions de recherche dans ce domaine incluent :

Stratégies de divulgation d'informations dans les systèmes de files d'attente
Contrôle décentralisé pour les systèmes multi-serveurs
Allocation de ressources en informatique périphérique
Modélisation du comportement des clients impatients

Les avantages de cet article par rapport aux travaux connexes résident dans :

Prise en compte de l'impact de l'obsolescence des informations
Fourniture de solutions adaptées aux environnements décentralisés
Intégration de mécanismes d'apprentissage et d'adaptation

Conclusion et Discussion

Conclusions Principales

Les informations d'état du système jouent un rôle clé dans la formation des décisions des locataires impatients
La stratégie de prédiction basée sur des règles présente une robustesse plus forte à l'obsolescence des informations
Une fréquence de divulgation d'informations appropriée est cruciale pour la performance du système
Le modèle markovien du taux de service est plus efficace que le modèle de dynamique de file

Limitations

Limitation aux configurations de Poisson M/M/2
Nécessité de quantifier les surcharges de calcul et de communication du mécanisme d'annonce
Non-prise en compte des processus d'arrivée en rafales, à queue lourde et des temps de service non-exponentiels

Directions Futures

Inclusion de modèles d'informations avec coûts d'abonnement plus abstraits
Remplacement des heuristiques basées sur des règles par des techniques d'apprentissage par renforcement
Extension à des serveurs hétérogènes multi-files
Validation de la méthode sur une plateforme de test MEC prototype

Évaluation Approfondie

Points Forts

Innovativité : Proposition d'un concept novateur de divulgation d'informations offrant de nouvelles perspectives pour le contrôle décentralisé des files d'attente
Praticité : Prise en compte de l'obsolescence des informations et de l'observabilité partielle dans les environnements réels d'informatique périphérique
Rigueur Théorique : Fourniture d'un cadre complet de modélisation et d'analyse mathématique
Expérimentation Suffisante : Validation de l'efficacité de la méthode par des expériences numériques étendues

Insuffisances

Limitations du Modèle : Considération uniquement du système M/M/2, les systèmes réels étant plus complexes
Sensibilité aux Paramètres : Manque de guidance théorique suffisante pour le choix de certains paramètres (tels que δλ, η)
Complexité Computationnelle : Analyse insuffisante de la complexité computationnelle de la résolution des conditions KKT
Validation Pratique : Absence d'expériences de validation sur des systèmes réels

Impact

Contribution Académique : Fourniture de nouvelles directions de recherche pour les domaines de la théorie des files d'attente et de l'informatique périphérique
Valeur Pratique : Orientation pour l'allocation de ressources dans les réseaux 6G
Extensibilité : Cadre méthodologique présentant une bonne extensibilité

Scénarios d'Application

Cette méthode est particulièrement adaptée à :

Systèmes d'informatique périphérique multi-locataires
Environnements de réseaux non-terrestres
Systèmes décentralisés à transmission d'informations limitée
Systèmes de service nécessitant de considérer le comportement impatient des utilisateurs

Références

L'article cite des travaux importants dans les domaines de la théorie des files d'attente, de la modélisation comportementale et de l'informatique périphérique, notamment :

Recherches de Y. Ouyang et D. Teneketzis sur la signalisation de routage décentralisée
Travaux de B. Lin et al. sur les stratégies optimales pour les systèmes de files d'attente à deux serveurs
Spécifications techniques 3GPP sur la gestion et l'orchestration du découpage de réseau

Évaluation Globale : Cet article est une recherche de haute qualité dans le domaine interdisciplinaire de la théorie des files d'attente et de l'informatique périphérique, proposant une stratégie innovante de divulgation d'informations pour traiter le problème de l'impatience des locataires dans les environnements décentralisés. Malgré certaines limitations, ses contributions théoriques et sa valeur pratique en font un progrès important dans ce domaine.