Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic
Divulgazione Adattiva Decentralizzata della Coda per Inquilini Impazienti nei Sistemi Edge e Non-Terrestri
Questo articolo esamina come la divulgazione delle informazioni sullo stato della coda influenzi gli inquilini impazienti nei sistemi edge multi-tenant. Gli autori propongono una strategia di comunicazione delle informazioni in cui ogni coda trasmette periodicamente due modelli markoviani: uno per il comportamento del tasso di servizio in stato stazionario e uno per il modello temporale dei cambiamenti della lunghezza della coda. Gli inquilini decidono autonomamente se abbandonare o trasferirsi in base a queste informazioni. La coda osserva le risposte degli inquilini e si adatta al tasso di servizio attraverso una strategia di previsione basata su regole progettata per ambienti decentralizzati, parzialmente osservabili e time-varying. Gli esperimenti numerici quantificano i compromessi tra ritardo medio, impazienzza e robustezza alle informazioni obsolete.
Nelle distribuzioni eterogenee 5G/6G, la condivisione delle risorse multi-tenant non è guidata solo da configurazioni statiche, ma sempre più dalle decisioni autonome degli inquilini (ad esempio, se scaricare i compiti in una coda remota o elaborarli localmente). La divulgazione dello stato della coda (come lunghezza della coda, stime del tempo di attesa o statistiche di servizio) può alterare significativamente il comportamento degli inquilini e innescare competizione per le risorse attraverso il cambio di coda (jockeying) e l'abbandono (reneging).
Gli ambienti moderni di Multi-access Edge Computing (MEC) e reti non-terrestri (NTN) sono decentralizzati, caratterizzati da trasmissioni di stato parziali e obsolete, e mostrano canali time-varying e mobilità. In tali ambienti, l'assunzione di un singolo controllore centrale con accesso istantaneo allo stato globale è irrealistica. Tuttavia, le regole di divulgazione e gli approcci euristici esistenti sono generalmente sviluppati per scenari statici o leggermente mobili e non rispondono a tre questioni fondamentali del controllo decentralizzato:
Quali informazioni di stato dovrebbero essere condivise
Come dovrebbero essere rappresentate le informazioni
Con quale frequenza dovrebbero essere distribuite gli aggiornamenti
I metodi di ottimizzazione centralizzati tradizionali (come le strategie di hedging) assumono informazioni di stato complete, istantanee e condizioni di stazionarietà, ma questi presupposti spesso non si verificano nelle tipiche condizioni dei cloud edge e dei deployment non-terrestri. Le prestazioni dei metodi esistenti degradano significativamente quando le informazioni diventano parziali o obsolete.
Concetto di Comunicazione delle Informazioni: Introduce il concetto di comunicazione delle informazioni per code multi-tenant e formalizza due descrittori markoviani (distribuzione del tasso di servizio e tempo di variazione) come riassunti di stato regolabili adatti ai canali di controllo con risorse limitate.
Analisi Teorica: Deriva espressioni in forma chiusa per le probabilità di cambio di coda e abbandono sotto questi descrittori, e formula un problema di minimizzazione congiunta dell'impazienzza che bilancia ritardo, cambio di coda e abbandono. Dimostra che il problema di ottimizzazione è intrattabile analiticamente.
Strategia Pratica: Propone una strategia di previsione pratica basata su regole che apprende il vettore del tasso di servizio dalle risposte degli inquilini e adatta il tasso di servizio online.
Valutazione Completa: Attraverso una valutazione numerica estesa quantifica il valore di diversi modelli di comunicazione e intervalli di distribuzione, e dimostra la robustezza della strategia di apprendimento sotto carichi di lavoro eterogenei.
Considera un sistema di code M/M/2 con due code i e j. I nuovi arrivi seguono una distribuzione di Poisson con tasso di arrivo totale λ = λᵢ + λⱼ. Ogni coda distribuisce le sue informazioni di stato agli inquilini a intervalli di r secondi, introducendo una certa obsolescenza. L'obiettivo è minimizzare una misura di prestazione composita che include ritardo medio, eventi di cambio di coda e abbandoni (impazienzza degli inquilini).
La distribuzione del tasso di servizio della coda i o j in stato di equilibrio segue una catena di Markov a tempo continuo (CTMC) a K stati con tassi di servizio {μᵢ}ᵢ₌₁ᴷ e {μⱼ}ⱼ₌₁ᴷ. Il tasso di servizio effettivo è definito come:
μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ
dove πₓᵢ e πᵧⱼ sono le probabilità in stato stazionario.
Questo modello quantifica la frequenza con cui si verificano transizioni nel sistema di code. Per una coda nello stato n, quando n=0 solo gli eventi di arrivo cambiano lo stato, mentre quando n≥1 sia gli arrivi che le partenze possono cambiare lo stato. Il modello markoviano è definito come:
Determina quale coda è migliore confrontando le funzioni di distribuzione cumulativa FX(μₖ) e FY(μₖ). Se PX > x ≥ PY > x ∀x ∈ ℝ, allora X domina stocasticamente Y al primo ordine.
Astrazione dell'Informazione: Astrae lo stato complesso della coda in due modelli markoviani compatti, adatti ai canali di controllo con larghezza di banda limitata.
Apprendimento Adattivo: La strategia di previsione basata su regole è in grado di apprendere dalle risposte degli inquilini e adattare il tasso di servizio online.
Progettazione Robusta: Considera l'obsolescenza delle informazioni e l'osservabilità parziale, più adatta agli ambienti edge computing reali.
Confronto dei Modelli di Informazione: Il modello markoviano del tasso di servizio produce meno comportamenti impazienti rispetto al modello del tempo di variazione della lunghezza della coda, poiché fornisce una mappatura diretta della velocità di elaborazione.
Ottimizzazione della Frequenza di Distribuzione: L'optimalità viene raggiunta tra intervalli di 5-7 secondi, dove il grado di impazienzza è minimizzato e il sistema è stabile, specialmente quando le richieste ricevono informazioni sul tasso di servizio.
Confronto delle Strategie:
Strategia di hedging: più stabile ma con tassi di abbandono e cambio di coda più elevati
Strategia basata su regole: più variabile ma potrebbe registrare tassi inferiori a intervalli più brevi
Effetto dell'Ottimizzazione: La strategia ottimizzata è statisticamente robusta, producendo valori obiettivo inferiori e più coerenti (media=0.53 vs 1.78 senza ottimizzazione).
Quando la strategia è incorporata, il tempo di attesa per le richieste abbandonate e cambiate è significativamente ridotto, con maggiore optimalità osservata quando si distribuisce il modello markoviano del tasso di servizio.
Innovatività: Propone un concetto innovativo di comunicazione delle informazioni, fornendo nuove prospettive per il controllo decentralizzato delle code
Praticità: Considera l'obsolescenza delle informazioni e l'osservabilità parziale negli ambienti edge computing reali
Rigore Teorico: Fornisce un framework matematico completo di modellazione e analisi
Esperimenti Estesi: Valida l'efficacia del metodo attraverso ampi esperimenti numerici
L'articolo cita importanti letterature nei campi della teoria delle code, modellazione del comportamento e computing edge, inclusi:
Ricerche di Y. Ouyang e D. Teneketzis sul routing decentralizzato
Lavori di B. Lin et al. sulle strategie ottimali per sistemi di code a doppio server
Specifiche tecniche 3GPP sulla gestione e orchestrazione del network slicing
Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità nel campo dell'intersezione tra teoria delle code e computing edge, che propone una strategia innovativa di divulgazione delle informazioni per affrontare il problema dell'impazienzza degli inquilini in ambienti decentralizzati. Nonostante alcune limitazioni, i suoi contributi teorici e il valore pratico lo rendono un progresso importante in questo campo.