Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions
Jiang, Ma, Zhang
We study the classical Network Revenue Management (NRM) problem with accept/reject decisions and $T$ IID arrivals. We consider a distributional form where each arrival must fall under a finite number of possible categories, each with a deterministic resource consumption vector, but a random value distributed continuously over an interval. We develop an online algorithm that achieves $O(\log^2 T)$ regret under this model, with the only (necessary) assumption being that the probability densities are bounded away from 0. We derive a second result that achieves $O(\log T)$ regret under an additional assumption of second-order growth. To our knowledge, these are the first results achieving logarithmic-level regret in an NRM model with continuous values that do not require any kind of "non-degeneracy" assumptions. Our results are achieved via new techniques including a new method of bounding myopic regret, a "semi-fluid" relaxation of the offline allocation, and an improved bound on the "dual convergence".
본 논문은 수락/거절 결정과 T개의 독립동일분포 도착을 포함하는 고전적인 네트워크 수익 관리(NRM) 문제를 연구합니다. 각 도착이 유한 개의 가능한 범주 중 하나에 속해야 하고, 각 범주는 결정론적 자원 소비 벡터를 가지지만 가치는 구간에서 연속 분포를 따르는 분포 형태를 고려합니다. 본 논문은 이 모델에서 O(log2T) 후회를 달성하는 온라인 알고리즘을 개발했으며, 유일한 (필요한) 가정은 확률 밀도가 0에서 멀어야 한다는 것입니다. 이차 성장의 추가 가정 하에서 O(logT) 후회를 달성하는 두 번째 결과를 도출했습니다. 우리가 아는 한, 이는 연속 가치를 가진 NRM 모델에서 어떤 "비퇴화" 가정도 필요 없이 로그 수준의 후회를 달성하는 첫 번째 결과입니다.
네트워크 수익 관리(NRM)는 길이 T의 유한 시간 범위 내에서 유한 자원을 할당해야 하는 용량 제어 문제입니다. 각 시간 단계 t에서 자원 벡터 a~t를 필요로 하고 보상 r~t를 제공하는 쿼리가 도착합니다. 의사결정자는 해당 쿼리를 서비스할지 여부에 대해 즉시 취소 불가능한 결정을 내려야 합니다.
본 논문은 네트워크 수익 관리 이론에서 중요한 돌파를 이루었으며, 전통적인 비퇴화 가정 없이 연속 분포 설정에서 로그 수준의 후회를 최초로 달성했습니다. 기술 혁신에는 반유체 완화, 경계 흡인 전략, 개선된 이중 수렴 분석이 포함되며, 이는 해당 분야의 이론적 발전에 중요한 기여를 합니다.