Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic
Adaptive dezentralisierte Warteschlangenzustandsoffenlegung für ungeduldig Mandanten in Edge- und Nicht-terrestrischen Systemen
In dieser Arbeit wird untersucht, wie die Offenlegung von Warteschlangenzustandsinformationen das Verhalten ungeduldig Mandanten in Multi-Mandanten-Edge-Systemen beeinflusst. Die Autoren schlagen eine Informationsankündigungsstrategie vor, bei der jede Warteschlange periodisch zwei Markov-Modelle ausstrahlt: eines für das stationäre Servicerate-Verhalten und eines für das Änderungszeitmodell der Warteschlangenlänge. Mandanten treffen auf Grundlage dieser Informationen eigenständig Entscheidungen über Abbruch oder Warteschlangenwechsel. Die Warteschlange beobachtet die Mandantenreaktionen und passt die Servicerate durch eine lernbasierte, regelgestützte Vorhersagestrategie an, die für dezentralisierte, teilweise beobachtete und zeitvariable Umgebungen konzipiert ist. Numerische Experimente quantifizieren die Kompromisse zwischen durchschnittlicher Verzögerung, Ungeduld und Robustheit gegenüber veralteten Informationen.
In heterogenen 5G/6G-Bereitstellungen wird die Multi-Mandanten-Ressourcenfreigabe nicht nur durch statische Konfigurationen gesteuert, sondern zunehmend durch autonome Entscheidungen der Mandanten (z. B. ob Aufgaben auf eine Remote-Warteschlange auslagern oder lokal verarbeiten). Die Offenlegung von Warteschlangenzustandsinformationen (wie Warteschlangenlänge, Wartzeitschätzungen oder Servicestatistiken) kann das Mandantenverhalten erheblich verändern und durch Warteschlangenwechsel (Jockeying) und Abbruch (Reneging) Ressourcenkonflikte auslösen.
Moderne Multi-Access-Edge-Computing (MEC)- und Non-Terrestrial-Network (NTN)-Umgebungen sind dezentralisiert, mit teilweise und veralteten Zustandsübertragungen, und zeigen zeitvariable Kanäle und Mobilität. In solchen Umgebungen ist die Annahme eines einzelnen zentralisierten Controllers mit momentanem globalem Zustand unrealistisch. Allerdings werden bestehende Offenlegungsregeln und Heuristiken typischerweise für statische oder leicht mobile Szenarien entwickelt und können drei grundlegende Fragen der dezentralisierten Steuerung nicht beantworten:
Welche Zustandsinformationen sollten geteilt werden
Traditionelle zentralisierte Optimierungsmethoden (wie Hedging-Point-Strategien) setzen vollständige, momentane Zustandsinformationen und Stationaritätsbedingungen voraus, die unter typischen Bedingungen von Edge-Cloud- und Nicht-terrestrischen Bereitstellungen oft nicht erfüllt sind. Bestehende Methoden zeigen erhebliche Leistungseinbußen, wenn Informationen teilweise oder veraltet werden.
Informationsankündigungskonzept: Führt das Informationsankündigungskonzept für Multi-Mandanten-Warteschlangen ein und formalisiert zwei Markov-Deskriptoren (Servicerate-Verteilung und Änderungszeit) als abstimmbare Zustandszusammenfassungen, die für ressourcenbegrenzte Steuerungskanäle geeignet sind.
Theoretische Analyse: Leitet geschlossene Ausdrücke für Warteschlangenwechsel- und Abbruchwahrscheinlichkeiten unter diesen Deskriptoren ab und formuliert ein optimales Optimierungsproblem zur Minimierung der gemeinsamen Ungeduld, das Verzögerung, Wechsel und Abbruch ausgleicht. Beweist, dass das Optimierungsproblem analytisch schwer zu handhaben ist.
Praktische Strategie: Schlägt eine praktische regelgestützte Vorhersagestrategie vor, die aus Mandantenreaktionen lernt, den Servicerate-Vektor identifiziert und die Servicerate online anpasst.
Umfassende Bewertung: Quantifiziert durch umfangreiche numerische Bewertung den Wert verschiedener Ankündigungsmodelle und Verteilungsintervalle und demonstriert die Robustheit der Lernstrategie unter heterogenen Arbeitslasten.
Betrachten Sie ein M/M/2-Warteschlangensystem mit zwei Warteschlangen i und j. Neue Ankünfte folgen einer Poisson-Verteilung mit Gesamtankunftsrate λ = λᵢ + λⱼ. Jede Warteschlange verteilt ihre Zustandsinformationen in Intervallen von r Sekunden an Mandanten, was eine gewisse Veralterung einführt. Das Ziel ist die Minimierung einer zusammengesetzten Leistungsmessgröße aus durchschnittlicher Verzögerung, Wechselereignissen und Abbrüchen (Mandantenungeduld).
Die Servicerate-Verteilung der Warteschlange i oder j im Gleichgewichtszustand folgt einer K-Zustands-Continuous-Time-Markov-Chain (CTMC) mit Serviceraten {μᵢ}ᵢ₌₁ᴷ und {μⱼ}ⱼ₌₁ᴷ. Die effektive Servicerate ist definiert als:
μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ
wobei πₓᵢ und πᵧⱼ stationäre Wahrscheinlichkeiten sind.
Dieses Modell quantifiziert die Häufigkeit von Übergängen im Warteschlangensystem. Für eine Warteschlange im Zustand n ändern nur Ankunftsereignisse den Zustand, wenn n=0, und Ankunfts- oder Abgangsereignisse können den Zustand ändern, wenn n≥1. Das Markov-Modell ist definiert als:
Wird durch Vergleich der kumulativen Verteilungsfunktionen FX(μₖ) und FY(μₖ) bestimmt, um die bessere Warteschlange zu identifizieren. Wenn PX > x ≥ PY > x ∀x ∈ ℝ, dann dominiert X Y stochastisch erster Ordnung.
Informationsabstraktion: Abstrahiert komplexe Warteschlangenzustände in zwei kompakte Markov-Modelle, die für bandbreitenbegrenzte Steuerungskanäle geeignet sind.
Adaptives Lernen: Die regelgestützte Vorhersagestrategie kann aus Mandantenreaktionen lernen und die Servicerate online anpassen.
Robustheitsdesign: Berücksichtigt Informationsveralterung und teilweise Beobachtbarkeit, besser geeignet für praktische Edge-Computing-Umgebungen.
Informationsmodellvergleich: Das Markov-Servicerate-Modell führt zu weniger Ungeduldsverhalten als das Änderungszeitmodell der Warteschlangenlänge, da es eine direkte Abbildung der Verarbeitungsgeschwindigkeit bietet.
Optimierung der Verteilungshäufigkeit: Optimalität wird im Intervall von 5-7 Sekunden erreicht, bei dem die Ungeduld minimiert und das System stabil ist, besonders wenn Anfragen Servicerate-Informationen erhalten.
Strategievergleich:
Hedging-Point-Strategie: Stabiler, aber höhere Abbruchs- und Wechselraten
Regelgestützte Strategie: Volatiler, aber möglicherweise niedrigere Raten bei kleineren Intervallen
Optimierungseffekt: Die Optimierungsstrategie ist statistisch robust und erzeugt niedrigere und konsistentere Zielwerte (Mittelwert=0,53 vs. 1,78 ohne Optimierung).
Wenn die Strategie eingebettet ist, sinkt die Wartezeit für Abbruchs- und Wechselanfragen erheblich, besonders wenn das Markov-Servicerate-Modell verteilt wird, wird mehr Optimalität beobachtet.
Die Arbeit zitiert wichtige Literatur aus Warteschlangen-, Verhaltensmodellierungs- und Edge-Computing-Bereichen, einschließlich:
Forschung von Y. Ouyang und D. Teneketzis zu dezentralisiertem Routing-Signalisieren
Arbeiten von B. Lin et al. zu optimalen Strategien für Dual-Server-Warteschlangensysteme
3GPP-Technische Spezifikationen zu Netzwerk-Slicing-Management und Orchestrierung
Gesamtbewertung: Dies ist eine hochwertige Forschungsarbeit im Schnittstellenbereich von Warteschlangen- und Edge-Computing-Theorie, die eine innovative Informationsoffenlegungsstrategie zur Behandlung von Mandantenungeduld in dezentralisierten Umgebungen vorschlägt. Trotz einiger Einschränkungen machen ihre theoretischen Beiträge und praktischen Werte sie zu einem wichtigen Fortschritt in diesem Bereich.