2025-11-22T04:58:16.037782

Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems

Kiggundu, Han, Schotten
We study how queue-state information disclosures affect impatient tenants in multi-tenant edge systems. We propose an information-bulletin strategy in which each queue periodically broadcasts two Markov models. One is a model of steady-state service-rate behavior and the other a model of the queue length inter-change times. Tenants autonomously decide to renege or jockey based on this information. The queues observe tenant responses and adapt service rates via a learned, rule-based predictive policy designed for decentralized, partially-observed, and time-varying environments. We compare this decentralized, information-driven policy to the classical, centralized Markov Decision Process (MDP) hedging-point policy for M/M/2 systems. Numerical experiments quantify the tradeoffs in average delay, impatience and robustness to stale information. Results show that when full, instantaneous state information and stationarity hold, the hedging-point policy yields less impatience but this diminishes as information becomes partial or stale. The rule-based predictive policy on the other hand is more robust to staleness in dispatched information, making it conducive for conditions typical of edge cloud and non-terrestrial deployments.
academic

Adaptive dezentralisierte Warteschlangenzustandsoffenlegung für ungeduldig Mandanten in Edge- und Nicht-terrestrischen Systemen

Grundlegende Informationen

  • Paper-ID: 2508.04241
  • Titel: Adaptive Decentralized Queue Disclosure for Impatient Tenants in Edge and Non-terrestrial Systems
  • Autoren: Anthony Kiggundu, Bin Han, Hans D. Schotten
  • Klassifizierung: eess.SY (Systeme und Steuerung), cs.SY (Systeme und Steuerung)
  • Veröffentlichungsdatum: 13. Oktober 2025 (arXiv v2)
  • Institution: Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI), RPTU Universität Kaiserslautern-Landau
  • Paper-Link: https://arxiv.org/abs/2508.04241

Zusammenfassung

In dieser Arbeit wird untersucht, wie die Offenlegung von Warteschlangenzustandsinformationen das Verhalten ungeduldig Mandanten in Multi-Mandanten-Edge-Systemen beeinflusst. Die Autoren schlagen eine Informationsankündigungsstrategie vor, bei der jede Warteschlange periodisch zwei Markov-Modelle ausstrahlt: eines für das stationäre Servicerate-Verhalten und eines für das Änderungszeitmodell der Warteschlangenlänge. Mandanten treffen auf Grundlage dieser Informationen eigenständig Entscheidungen über Abbruch oder Warteschlangenwechsel. Die Warteschlange beobachtet die Mandantenreaktionen und passt die Servicerate durch eine lernbasierte, regelgestützte Vorhersagestrategie an, die für dezentralisierte, teilweise beobachtete und zeitvariable Umgebungen konzipiert ist. Numerische Experimente quantifizieren die Kompromisse zwischen durchschnittlicher Verzögerung, Ungeduld und Robustheit gegenüber veralteten Informationen.

Forschungshintergrund und Motivation

Problemdefinition

In heterogenen 5G/6G-Bereitstellungen wird die Multi-Mandanten-Ressourcenfreigabe nicht nur durch statische Konfigurationen gesteuert, sondern zunehmend durch autonome Entscheidungen der Mandanten (z. B. ob Aufgaben auf eine Remote-Warteschlange auslagern oder lokal verarbeiten). Die Offenlegung von Warteschlangenzustandsinformationen (wie Warteschlangenlänge, Wartzeitschätzungen oder Servicestatistiken) kann das Mandantenverhalten erheblich verändern und durch Warteschlangenwechsel (Jockeying) und Abbruch (Reneging) Ressourcenkonflikte auslösen.

Forschungsbedeutung

Moderne Multi-Access-Edge-Computing (MEC)- und Non-Terrestrial-Network (NTN)-Umgebungen sind dezentralisiert, mit teilweise und veralteten Zustandsübertragungen, und zeigen zeitvariable Kanäle und Mobilität. In solchen Umgebungen ist die Annahme eines einzelnen zentralisierten Controllers mit momentanem globalem Zustand unrealistisch. Allerdings werden bestehende Offenlegungsregeln und Heuristiken typischerweise für statische oder leicht mobile Szenarien entwickelt und können drei grundlegende Fragen der dezentralisierten Steuerung nicht beantworten:

  1. Welche Zustandsinformationen sollten geteilt werden
  2. Wie sollten Informationen dargestellt werden
  3. Wie häufig sollten Updates verteilt werden

Einschränkungen bestehender Ansätze

Traditionelle zentralisierte Optimierungsmethoden (wie Hedging-Point-Strategien) setzen vollständige, momentane Zustandsinformationen und Stationaritätsbedingungen voraus, die unter typischen Bedingungen von Edge-Cloud- und Nicht-terrestrischen Bereitstellungen oft nicht erfüllt sind. Bestehende Methoden zeigen erhebliche Leistungseinbußen, wenn Informationen teilweise oder veraltet werden.

Kernbeiträge

  1. Informationsankündigungskonzept: Führt das Informationsankündigungskonzept für Multi-Mandanten-Warteschlangen ein und formalisiert zwei Markov-Deskriptoren (Servicerate-Verteilung und Änderungszeit) als abstimmbare Zustandszusammenfassungen, die für ressourcenbegrenzte Steuerungskanäle geeignet sind.
  2. Theoretische Analyse: Leitet geschlossene Ausdrücke für Warteschlangenwechsel- und Abbruchwahrscheinlichkeiten unter diesen Deskriptoren ab und formuliert ein optimales Optimierungsproblem zur Minimierung der gemeinsamen Ungeduld, das Verzögerung, Wechsel und Abbruch ausgleicht. Beweist, dass das Optimierungsproblem analytisch schwer zu handhaben ist.
  3. Praktische Strategie: Schlägt eine praktische regelgestützte Vorhersagestrategie vor, die aus Mandantenreaktionen lernt, den Servicerate-Vektor identifiziert und die Servicerate online anpasst.
  4. Umfassende Bewertung: Quantifiziert durch umfangreiche numerische Bewertung den Wert verschiedener Ankündigungsmodelle und Verteilungsintervalle und demonstriert die Robustheit der Lernstrategie unter heterogenen Arbeitslasten.

Methodische Details

Aufgabendefinition

Betrachten Sie ein M/M/2-Warteschlangensystem mit zwei Warteschlangen i und j. Neue Ankünfte folgen einer Poisson-Verteilung mit Gesamtankunftsrate λ = λᵢ + λⱼ. Jede Warteschlange verteilt ihre Zustandsinformationen in Intervallen von r Sekunden an Mandanten, was eine gewisse Veralterung einführt. Das Ziel ist die Minimierung einer zusammengesetzten Leistungsmessgröße aus durchschnittlicher Verzögerung, Wechselereignissen und Abbrüchen (Mandantenungeduld).

Modellarchitektur

1. Markov-Servicerate-Modell

Die Servicerate-Verteilung der Warteschlange i oder j im Gleichgewichtszustand folgt einer K-Zustands-Continuous-Time-Markov-Chain (CTMC) mit Serviceraten {μᵢ}ᵢ₌₁ᴷ und {μⱼ}ⱼ₌₁ᴷ. Die effektive Servicerate ist definiert als:

μ̄ₓ = Σᵢ₌₁ᴷ πₓᵢ μᵢ, μ̄ᵧ = Σⱼ₌₁ᴷ πᵧⱼ μⱼ

wobei πₓᵢ und πᵧⱼ stationäre Wahrscheinlichkeiten sind.

2. Warteschlangenlängen-Dynamik-Modell – Änderungszeitverteilung (ICD)

Dieses Modell quantifiziert die Häufigkeit von Übergängen im Warteschlangensystem. Für eine Warteschlange im Zustand n ändern nur Ankunftsereignisse den Zustand, wenn n=0, und Ankunfts- oder Abgangsereignisse können den Zustand ändern, wenn n≥1. Das Markov-Modell ist definiert als:

Rᵢ = Σₙ₌₀^∞ πᵢ,ₙ (λᵢ + μᵢ · 1ₙ≥₁) = 2λᵢ

Die erwartete Änderungsintervallzeit ist:

Tᵢᴵᶜᴰ = 1/Rᵢ = 1/(2λᵢ)

3. Stochastische Dominanz erster Ordnung (FSD)

Wird durch Vergleich der kumulativen Verteilungsfunktionen FX(μₖ) und FY(μₖ) bestimmt, um die bessere Warteschlange zu identifizieren. Wenn PX > x ≥ PY > x ∀x ∈ ℝ, dann dominiert X Y stochastisch erster Ordnung.

Verhaltensmodellierung

Abbruchverhalten

Die auf FSD basierende Abbruchwahrscheinlichkeit ist definiert als:

P^FSD_reneg(ℓ) = Σᵥ₌₀^(ℓ-1) [(μᵢ - λᵢ)Δ]^v/v! e^(-(μᵢ-λᵢ)Δ)

wobei Δ = Tₗₒcₐₗ - ηr und η ∈ 0,1 das Ausmaß der Informationsveralterung darstellt.

Wechselverhalten

Die auf ICD basierende Wechselwahrscheinlichkeit wird mit einer Sigmoid-Funktion modelliert:

P^ICD_{i→j} = 1/(1 + e^(-2de^(-ηr)(λᵢ-λⱼ)))

Optimierungsproblem

Das gemeinsame Optimierungsproblem ist formalisiert als:

min_{μᵢ,μⱼ} τ[Wᵢ(μᵢ) + Wⱼ(μⱼ)] + φ[R^reneg_i(μᵢ) + R^reneg_j(μⱼ)] + ψ[R^jockey_{i→j}(μᵢ,μⱼ) + R^jockey_{j→i}(μⱼ,μᵢ)]

unter den Nebenbedingungen: μᵢ,min ≤ μᵢ < μᵢ,max, μᵢ > λᵢ

Technische Innovationen

  1. Informationsabstraktion: Abstrahiert komplexe Warteschlangenzustände in zwei kompakte Markov-Modelle, die für bandbreitenbegrenzte Steuerungskanäle geeignet sind.
  2. Adaptives Lernen: Die regelgestützte Vorhersagestrategie kann aus Mandantenreaktionen lernen und die Servicerate online anpassen.
  3. Robustheitsdesign: Berücksichtigt Informationsveralterung und teilweise Beobachtbarkeit, besser geeignet für praktische Edge-Computing-Umgebungen.

Experimentelle Einrichtung

Experimentelle Parameter

  • Verteilungsintervalle: r ∈ {3, 5, 7, 9} Sekunden
  • Ankunftsratenbereich: 3 ≤ λ ≤ 17
  • 300 Simulationen pro Konfiguration
  • M/M/2-Systemeinstellung

Bewertungsmetriken

  • Durchschnittliche Verzögerung
  • Abbruchrate
  • Wechselrate
  • Zusammengesetzte Zielfunktionswert (kombiniert Verzögerungs- und Ungeduldsmaße)

Vergleichsmethoden

  • Baseline ohne Strategie
  • Klassische zentralisierte MDP-Hedging-Point-Strategie
  • Vorgeschlagene regelgestützte Vorhersagestrategie

Experimentelle Ergebnisse

Hauptergebnisse

  1. Informationsmodellvergleich: Das Markov-Servicerate-Modell führt zu weniger Ungeduldsverhalten als das Änderungszeitmodell der Warteschlangenlänge, da es eine direkte Abbildung der Verarbeitungsgeschwindigkeit bietet.
  2. Optimierung der Verteilungshäufigkeit: Optimalität wird im Intervall von 5-7 Sekunden erreicht, bei dem die Ungeduld minimiert und das System stabil ist, besonders wenn Anfragen Servicerate-Informationen erhalten.
  3. Strategievergleich:
    • Hedging-Point-Strategie: Stabiler, aber höhere Abbruchs- und Wechselraten
    • Regelgestützte Strategie: Volatiler, aber möglicherweise niedrigere Raten bei kleineren Intervallen
  4. Optimierungseffekt: Die Optimierungsstrategie ist statistisch robust und erzeugt niedrigere und konsistentere Zielwerte (Mittelwert=0,53 vs. 1,78 ohne Optimierung).

Wichtigste Erkenntnisse

Gemäß der quantitativen Zusammenfassung in Tabelle I:

  • Geringere Variabilität der Optimierungsergebnisse (Standardabweichung=0,15 vs. 0,97)
  • Durchschnittliche Verbesserung von 1,26
  • Bessere Lösungen werden in allen Verteilungsintervallen gefunden

Wartzeitanalyse

Wenn die Strategie eingebettet ist, sinkt die Wartezeit für Abbruchs- und Wechselanfragen erheblich, besonders wenn das Markov-Servicerate-Modell verteilt wird, wird mehr Optimalität beobachtet.

Verwandte Arbeiten

Die Hauptforschungsrichtungen in diesem Bereich umfassen:

  1. Informationsoffenlegungsstrategien in Warteschlangensystemen
  2. Dezentralisierte Steuerung von Multi-Server-Systemen
  3. Ressourcenallokation in Edge-Computing
  4. Verhaltensmodellierung ungeduldig Kunden

Die Vorteile dieser Arbeit gegenüber verwandten Arbeiten sind:

  • Berücksichtigung der Auswirkungen von Informationsveralterung
  • Bereitstellung von Lösungen für dezentralisierte Umgebungen
  • Integration von Lern- und Anpassungsmechanismen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Systemzustandsinformationen spielen eine Schlüsselrolle bei der Gestaltung von Entscheidungen ungeduldig Mandanten
  2. Regelgestützte Vorhersagestrategien zeigen stärkere Robustheit gegenüber Informationsveralterung
  3. Angemessene Informationsoffenlegungshäufigkeit ist für die Systemleistung entscheidend
  4. Das Markov-Servicerate-Modell ist effektiver als das Warteschlangendynamik-Modell

Einschränkungen

  1. Beschränkt auf M/M/2-Poisson-Einstellung
  2. Erfordert Quantifizierung der Rechen- und Kommunikationskosten von Ankündigungsmechanismen
  3. Berücksichtigt keine Burst-, Heavy-Tail-Ankunftsprozesse und nicht-exponentielle Servicezeiten

Zukünftige Richtungen

  1. Einbeziehung von Informationsmodellen mit abstrakteren Abonnementkosten
  2. Ersatz regelgestützter Heuristiken durch Reinforcement-Learning-Techniken
  3. Erweiterung auf Multi-Warteschlangen-heterogene Server
  4. Validierung der Methode auf Prototyp-MEC-Testplattformen

Tiefgreifende Bewertung

Stärken

  1. Innovativität: Schlägt ein neuartiges Informationsankündigungskonzept vor, das neue Perspektiven für dezentralisierte Warteschlangenkontrolle bietet
  2. Praktikalität: Berücksichtigt Informationsveralterung und teilweise Beobachtbarkeit in praktischen Edge-Computing-Umgebungen
  3. Theoretische Strenge: Bietet einen vollständigen mathematischen Modellierungs- und Analyserahmen
  4. Umfangreiche Experimente: Validiert die Methodeneffektivität durch umfangreiche numerische Experimente

Schwächen

  1. Modellbeschränkungen: Berücksichtigt nur M/M/2-Systeme, praktische Systeme sind komplexer
  2. Parametersensitivität: Die Auswahl bestimmter Parameter (wie δλ, η) mangelt es an ausreichender theoretischer Anleitung
  3. Rechenkomplexität: Die Komplexitätsanalyse der KKT-Bedingungslösung ist nicht ausreichend detailliert
  4. Praktische Validierung: Validierungsexperimente auf echten Systemen fehlen

Auswirkungen

  1. Akademischer Beitrag: Bietet neue Forschungsrichtungen für Warteschlangen- und Edge-Computing-Bereiche
  2. Praktischer Wert: Bietet Orientierung für Ressourcenallokation in 6G-Netzwerken
  3. Skalierbarkeit: Das Methodengerüst hat gute Skalierbarkeit

Anwendungsszenarien

Diese Methode ist besonders geeignet für:

  1. Multi-Mandanten-Edge-Computing-Systeme
  2. Nicht-terrestrische Netzwerkumgebungen
  3. Dezentralisierte Systeme mit begrenzter Informationsübertragung
  4. Servicesysteme, die Mandantenungeduldsverhalten berücksichtigen müssen

Referenzen

Die Arbeit zitiert wichtige Literatur aus Warteschlangen-, Verhaltensmodellierungs- und Edge-Computing-Bereichen, einschließlich:

  • Forschung von Y. Ouyang und D. Teneketzis zu dezentralisiertem Routing-Signalisieren
  • Arbeiten von B. Lin et al. zu optimalen Strategien für Dual-Server-Warteschlangensysteme
  • 3GPP-Technische Spezifikationen zu Netzwerk-Slicing-Management und Orchestrierung

Gesamtbewertung: Dies ist eine hochwertige Forschungsarbeit im Schnittstellenbereich von Warteschlangen- und Edge-Computing-Theorie, die eine innovative Informationsoffenlegungsstrategie zur Behandlung von Mandantenungeduld in dezentralisierten Umgebungen vorschlägt. Trotz einiger Einschränkungen machen ihre theoretischen Beiträge und praktischen Werte sie zu einem wichtigen Fortschritt in diesem Bereich.