2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten

We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.

academic

Adaptive dezentralisierte Warteschlangenzustandsoffenlegung für ungeduldig Mandanten in Edge- und Nicht-terrestrischen Systemen

Grundlegende Informationen

Paper-ID: 2508.04241
Titel: Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
Autoren: Anthony Kiggundu, Bin Han, Hans D. Schotten
Klassifizierung: eess.SY (Systeme und Steuerung), cs.SY (Systeme und Steuerung)
Veröffentlichungsdatum: 13. Oktober 2025 (arXiv v2)
Institution: Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI), RPTU Universität Kaiserslautern-Landau
Paper-Link: https://arxiv.org/abs/2508.04241

Zusammenfassung

In dieser Arbeit wird untersucht, wie die Offenlegung von Warteschlangenzustandsinformationen das Verhalten ungeduldig Mandanten in Multi-Mandanten-Edge-Systemen beeinflusst. Die Autoren schlagen eine Informationsankündigungsstrategie vor, bei der jede Warteschlange periodisch zwei Markov-Modelle ausstrahlt: eines für das stationäre Servicerate-Verhalten und eines für das Änderungszeitmodell der Warteschlangenlänge. Mandanten treffen auf Grundlage dieser Informationen eigenständig Entscheidungen über Abbruch oder Warteschlangenwechsel. Die Warteschlange beobachtet die Mandantenreaktionen und passt die Servicerate durch eine lernbasierte, regelgestützte Vorhersagestrategie an, die für dezentralisierte, teilweise beobachtete und zeitvariable Umgebungen konzipiert ist. Numerische Experimente quantifizieren die Kompromisse zwischen durchschnittlicher Verzögerung, Ungeduld und Robustheit gegenüber veralteten Informationen.

Forschungshintergrund und Motivation

Problemdefinition

In heterogenen 5G/6G-Bereitstellungen wird die Multi-Mandanten-Ressourcenfreigabe nicht nur durch statische Konfigurationen gesteuert, sondern zunehmend durch autonome Entscheidungen der Mandanten (z. B. ob Aufgaben auf eine Remote-Warteschlange auslagern oder lokal verarbeiten). Die Offenlegung von Warteschlangenzustandsinformationen (wie Warteschlangenlänge, Wartzeitschätzungen oder Servicestatistiken) kann das Mandantenverhalten erheblich verändern und durch Warteschlangenwechsel (Jockeying) und Abbruch (Reneging) Ressourcenkonflikte auslösen.

Forschungsbedeutung

Moderne Multi-Access-Edge-Computing (MEC)- und Non-Terrestrial-Network (NTN)-Umgebungen sind dezentralisiert, mit teilweise und veralteten Zustandsübertragungen, und zeigen zeitvariable Kanäle und Mobilität. In solchen Umgebungen ist die Annahme eines einzelnen zentralisierten Controllers mit momentanem globalem Zustand unrealistisch. Allerdings werden bestehende Offenlegungsregeln und Heuristiken typischerweise für statische oder leicht mobile Szenarien entwickelt und können drei grundlegende Fragen der dezentralisierten Steuerung nicht beantworten:

Welche Zustandsinformationen sollten geteilt werden
Wie sollten Informationen dargestellt werden
Wie häufig sollten Updates verteilt werden

Einschränkungen bestehender Ansätze

Traditionelle zentralisierte Optimierungsmethoden (wie Hedging-Point-Strategien) setzen vollständige, momentane Zustandsinformationen und Stationaritätsbedingungen voraus, die unter typischen Bedingungen von Edge-Cloud- und Nicht-terrestrischen Bereitstellungen oft nicht erfüllt sind. Bestehende Methoden zeigen erhebliche Leistungseinbußen, wenn Informationen teilweise oder veraltet werden.

Kernbeiträge

Informationsankündigungskonzept: Führt das Informationsankündigungskonzept für Multi-Mandanten-Warteschlangen ein und formalisiert zwei Markov-Deskriptoren (Servicerate-Verteilung und Änderungszeit) als abstimmbare Zustandszusammenfassungen, die für ressourcenbegrenzte Steuerungskanäle geeignet sind.
Theoretische Analyse: Leitet geschlossene Ausdrücke für Warteschlangenwechsel- und Abbruchwahrscheinlichkeiten unter diesen Deskriptoren ab und formuliert ein optimales Optimierungsproblem zur Minimierung der gemeinsamen Ungeduld, das Verzögerung, Wechsel und Abbruch ausgleicht. Beweist, dass das Optimierungsproblem analytisch schwer zu handhaben ist.
Praktische Strategie: Schlägt eine praktische regelgestützte Vorhersagestrategie vor, die aus Mandantenreaktionen lernt, den Servicerate-Vektor identifiziert und die Servicerate online anpasst.
Umfassende Bewertung: Quantifiziert durch umfangreiche numerische Bewertung den Wert verschiedener Ankündigungsmodelle und Verteilungsintervalle und demonstriert die Robustheit der Lernstrategie unter heterogenen Arbeitslasten.

Methodische Details

Aufgabendefinition

Betrachten Sie ein M/M/2-Warteschlangensystem mit zwei Warteschlangen i und j. Neue Ankünfte folgen einer Poisson-Verteilung mit Gesamtankunftsrate λ = λᵢ + λⱼ. Jede Warteschlange verteilt ihre Zustandsinformationen in Intervallen von r Sekunden an Mandanten, was eine gewisse Veralterung einführt. Das Ziel ist die Minimierung einer zusammengesetzten Leistungsmessgröße aus durchschnittlicher Verzögerung, Wechselereignissen und Abbrüchen (Mandantenungeduld).

Modellarchitektur

1. Markov-Servicerate-Modell

Die Servicerate-Verteilung der Warteschlange i oder j im Gleichgewichtszustand folgt einer K-Zustands-Continuous-Time-Markov-Chain (CTMC) mit Serviceraten {μᵢ}ᵢ₌₁ᴷ und {μⱼ}ⱼ₌₁ᴷ. Die effektive Servicerate ist definiert als:

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

wobei πₓᵢ und πᵧⱼ stationäre Wahrscheinlichkeiten sind.

2. Warteschlangenlängen-Dynamik-Modell – Änderungszeitverteilung (ICD)

Dieses Modell quantifiziert die Häufigkeit von Übergängen im Warteschlangensystem. Für eine Warteschlange im Zustand n ändern nur Ankunftsereignisse den Zustand, wenn n=0, und Ankunfts- oder Abgangsereignisse können den Zustand ändern, wenn n≥1. Das Markov-Modell ist definiert als:

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

Die erwartete Änderungsintervallzeit ist:

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

3. Stochastische Dominanz erster Ordnung (FSD)

Wird durch Vergleich der kumulativen Verteilungsfunktionen FX(μₖ) und FY(μₖ) bestimmt, um die bessere Warteschlange zu identifizieren. Wenn PX > x ≥ PY > x ∀x ∈ ℝ, dann dominiert X Y stochastisch erster Ordnung.

Verhaltensmodellierung

Abbruchverhalten

Die auf FSD basierende Abbruchwahrscheinlichkeit ist definiert als:

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

wobei Δ = Tₗₒcₐₗ - ηr und η ∈ 0,1 das Ausmaß der Informationsveralterung darstellt.

Wechselverhalten

Die auf ICD basierende Wechselwahrscheinlichkeit wird mit einer Sigmoid-Funktion modelliert:

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

Optimierungsproblem

Das gemeinsame Optimierungsproblem ist formalisiert als:

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

unter den Nebenbedingungen: μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

Technische Innovationen

Informationsabstraktion: Abstrahiert komplexe Warteschlangenzustände in zwei kompakte Markov-Modelle, die für bandbreitenbegrenzte Steuerungskanäle geeignet sind.
Adaptives Lernen: Die regelgestützte Vorhersagestrategie kann aus Mandantenreaktionen lernen und die Servicerate online anpassen.
Robustheitsdesign: Berücksichtigt Informationsveralterung und teilweise Beobachtbarkeit, besser geeignet für praktische Edge-Computing-Umgebungen.

Experimentelle Einrichtung

Experimentelle Parameter

Verteilungsintervalle: r ∈ {3, 5, 7, 9} Sekunden
Ankunftsratenbereich: 3 ≤ λ ≤ 17
300 Simulationen pro Konfiguration
M/M/2-Systemeinstellung

Bewertungsmetriken

Durchschnittliche Verzögerung
Abbruchrate
Wechselrate
Zusammengesetzte Zielfunktionswert (kombiniert Verzögerungs- und Ungeduldsmaße)

Vergleichsmethoden

Baseline ohne Strategie
Klassische zentralisierte MDP-Hedging-Point-Strategie
Vorgeschlagene regelgestützte Vorhersagestrategie

Experimentelle Ergebnisse

Hauptergebnisse

Informationsmodellvergleich: Das Markov-Servicerate-Modell führt zu weniger Ungeduldsverhalten als das Änderungszeitmodell der Warteschlangenlänge, da es eine direkte Abbildung der Verarbeitungsgeschwindigkeit bietet.
Optimierung der Verteilungshäufigkeit: Optimalität wird im Intervall von 5-7 Sekunden erreicht, bei dem die Ungeduld minimiert und das System stabil ist, besonders wenn Anfragen Servicerate-Informationen erhalten.
Strategievergleich:
- Hedging-Point-Strategie: Stabiler, aber höhere Abbruchs- und Wechselraten
- Regelgestützte Strategie: Volatiler, aber möglicherweise niedrigere Raten bei kleineren Intervallen
Optimierungseffekt: Die Optimierungsstrategie ist statistisch robust und erzeugt niedrigere und konsistentere Zielwerte (Mittelwert=0,53 vs. 1,78 ohne Optimierung).

Wichtigste Erkenntnisse

Gemäß der quantitativen Zusammenfassung in Tabelle I:

Geringere Variabilität der Optimierungsergebnisse (Standardabweichung=0,15 vs. 0,97)
Durchschnittliche Verbesserung von 1,26
Bessere Lösungen werden in allen Verteilungsintervallen gefunden

Wartzeitanalyse

Wenn die Strategie eingebettet ist, sinkt die Wartezeit für Abbruchs- und Wechselanfragen erheblich, besonders wenn das Markov-Servicerate-Modell verteilt wird, wird mehr Optimalität beobachtet.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Systemzustandsinformationen spielen eine Schlüsselrolle bei der Gestaltung von Entscheidungen ungeduldig Mandanten
Regelgestützte Vorhersagestrategien zeigen stärkere Robustheit gegenüber Informationsveralterung
Angemessene Informationsoffenlegungshäufigkeit ist für die Systemleistung entscheidend
Das Markov-Servicerate-Modell ist effektiver als das Warteschlangendynamik-Modell

Einschränkungen

Beschränkt auf M/M/2-Poisson-Einstellung
Erfordert Quantifizierung der Rechen- und Kommunikationskosten von Ankündigungsmechanismen
Berücksichtigt keine Burst-, Heavy-Tail-Ankunftsprozesse und nicht-exponentielle Servicezeiten

Zukünftige Richtungen

Einbeziehung von Informationsmodellen mit abstrakteren Abonnementkosten
Ersatz regelgestützter Heuristiken durch Reinforcement-Learning-Techniken
Erweiterung auf Multi-Warteschlangen-heterogene Server
Validierung der Methode auf Prototyp-MEC-Testplattformen

Tiefgreifende Bewertung

Stärken

Innovativität: Schlägt ein neuartiges Informationsankündigungskonzept vor, das neue Perspektiven für dezentralisierte Warteschlangenkontrolle bietet
Praktikalität: Berücksichtigt Informationsveralterung und teilweise Beobachtbarkeit in praktischen Edge-Computing-Umgebungen
Theoretische Strenge: Bietet einen vollständigen mathematischen Modellierungs- und Analyserahmen
Umfangreiche Experimente: Validiert die Methodeneffektivität durch umfangreiche numerische Experimente

Schwächen

Modellbeschränkungen: Berücksichtigt nur M/M/2-Systeme, praktische Systeme sind komplexer
Parametersensitivität: Die Auswahl bestimmter Parameter (wie δλ, η) mangelt es an ausreichender theoretischer Anleitung
Rechenkomplexität: Die Komplexitätsanalyse der KKT-Bedingungslösung ist nicht ausreichend detailliert
Praktische Validierung: Validierungsexperimente auf echten Systemen fehlen

Auswirkungen

Akademischer Beitrag: Bietet neue Forschungsrichtungen für Warteschlangen- und Edge-Computing-Bereiche
Praktischer Wert: Bietet Orientierung für Ressourcenallokation in 6G-Netzwerken
Skalierbarkeit: Das Methodengerüst hat gute Skalierbarkeit

Anwendungsszenarien

Diese Methode ist besonders geeignet für:

Multi-Mandanten-Edge-Computing-Systeme
Nicht-terrestrische Netzwerkumgebungen
Dezentralisierte Systeme mit begrenzter Informationsübertragung
Servicesysteme, die Mandantenungeduldsverhalten berücksichtigen müssen

Referenzen

Die Arbeit zitiert wichtige Literatur aus Warteschlangen-, Verhaltensmodellierungs- und Edge-Computing-Bereichen, einschließlich:

Forschung von Y. Ouyang und D. Teneketzis zu dezentralisiertem Routing-Signalisieren
Arbeiten von B. Lin et al. zu optimalen Strategien für Dual-Server-Warteschlangensysteme
3GPP-Technische Spezifikationen zu Netzwerk-Slicing-Management und Orchestrierung

Gesamtbewertung: Dies ist eine hochwertige Forschungsarbeit im Schnittstellenbereich von Warteschlangen- und Edge-Computing-Theorie, die eine innovative Informationsoffenlegungsstrategie zur Behandlung von Mandantenungeduld in dezentralisierten Umgebungen vorschlägt. Trotz einiger Einschränkungen machen ihre theoretischen Beiträge und praktischen Werte sie zu einem wichtigen Fortschritt in diesem Bereich.