Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions
Jiang, Ma, Zhang
We study the classical Network Revenue Management (NRM) problem with accept/reject decisions and $T$ IID arrivals. We consider a distributional form where each arrival must fall under a finite number of possible categories, each with a deterministic resource consumption vector, but a random value distributed continuously over an interval. We develop an online algorithm that achieves $O(\log^2 T)$ regret under this model, with the only (necessary) assumption being that the probability densities are bounded away from 0. We derive a second result that achieves $O(\log T)$ regret under an additional assumption of second-order growth. To our knowledge, these are the first results achieving logarithmic-level regret in an NRM model with continuous values that do not require any kind of "non-degeneracy" assumptions. Our results are achieved via new techniques including a new method of bounding myopic regret, a "semi-fluid" relaxation of the offline allocation, and an improved bound on the "dual convergence".
academic
La Dégénérescence est Acceptable : Regret Logarithmique pour la Gestion des Revenus Réseau avec Distributions Non-Discrètes
Cet article étudie le problème classique de la gestion des revenus réseau (GRR), impliquant des décisions d'acceptation/rejet et T arrivées indépendantes et identiquement distribuées. Nous considérons une forme de distribution où chaque arrivée doit appartenir à un nombre fini de catégories possibles, chaque catégorie possédant un vecteur de consommation de ressources déterministe, mais avec une valeur distribuée continûment sur un intervalle. Nous développons un algorithme en ligne qui réalise un regret O(log2T) dans ce modèle, avec comme seule hypothèse (nécessaire) que la densité de probabilité s'éloigne de 0. Nous dérivons un deuxième résultat réalisant un regret O(logT) sous une hypothèse supplémentaire de croissance du second ordre. À notre connaissance, ce sont les premiers résultats réalisant un regret logarithmique dans les modèles de GRR avec valeurs continues, sans nécessiter aucune hypothèse de « non-dégénérescence ».
La gestion des revenus réseau (GRR) est un problème de contrôle de capacité nécessitant l'allocation de ressources limitées sur un horizon temporel fini de longueur T. À chaque étape temporelle t, une requête arrive, demandant un vecteur de ressources a~t et offrant une récompense r~t. Le décideur doit prendre immédiatement une décision irrévocable quant à l'acceptation ou le rejet de cette requête.
Importance pratique: La GRR possède une valeur applicative significative dans les secteurs aérien, hôtelier, etc.
Défis théoriques: La littérature existante nécessite des hypothèses fortes de « non-dégénérescence » lors du traitement de distributions continues
Limitations méthodologiques: Les approches traditionnelles supposent soit des distributions discrètes finies (hypothèse de petit N), soit des conditions de non-dégénérescence
Hypothèse de petit N: Limitée aux distributions discrètes finies, incapable de traiter les récompenses continues
Hypothèse de non-dégénérescence: Exige que la solution optimale de la relaxation fluide soit unique et satisfasse les conditions strictes de complémentarité
Méthodes de perturbation: Les approches traditionnelles de traitement de la dégénérescence en programmation linéaire conduisent à un regret Ω(T)
Première réalisation d'un regret logarithmique: Premier résultat de regret logarithmique en GRR avec distributions continues, sans hypothèse de non-dégénérescence
Nouvelle relaxation semi-fluide: Proposition d'une nouvelle méthode de relaxation intermédiaire entre l'optimum hors ligne et la relaxation fluide
Analyse améliorée du regret myope: Développement de nouvelles techniques d'analyse du regret myope
Résultats doubles:
Regret O(log2T) (nécessitant uniquement une borne inférieure de densité)
Regret O(logT) (avec condition supplémentaire de croissance du second ordre)
Jasin et Kumar (2012): Heuristiques de réoptimisation en GRR
Bumpensanti et Wang (2020): Cas discret sans hypothèse de non-dégénérescence
Li et Ye (2021): Convergence duale en programmation linéaire en ligne
Bray (2022): Problème multi-secrétaire avec valeurs continues
Cet article réalise une percée importante dans la théorie de la gestion des revenus réseau, réalisant pour la première fois un regret logarithmique dans un cadre de distribution continue sans hypothèses traditionnelles de non-dégénérescence. Les innovations techniques incluent la relaxation semi-fluide, la stratégie d'attraction aux limites et l'analyse améliorée de la convergence duale, apportant des contributions importantes au développement théorique du domaine.