Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions
Jiang, Ma, Zhang
We study the classical Network Revenue Management (NRM) problem with accept/reject decisions and $T$ IID arrivals. We consider a distributional form where each arrival must fall under a finite number of possible categories, each with a deterministic resource consumption vector, but a random value distributed continuously over an interval. We develop an online algorithm that achieves $O(\log^2 T)$ regret under this model, with the only (necessary) assumption being that the probability densities are bounded away from 0. We derive a second result that achieves $O(\log T)$ regret under an additional assumption of second-order growth. To our knowledge, these are the first results achieving logarithmic-level regret in an NRM model with continuous values that do not require any kind of "non-degeneracy" assumptions. Our results are achieved via new techniques including a new method of bounding myopic regret, a "semi-fluid" relaxation of the offline allocation, and an improved bound on the "dual convergence".
academic
डीजेनरेसी ठीक है: नेटवर्क राजस्व प्रबंधन के लिए लॉगरिदमिक पश्चाताप अविवेकी वितरण के साथ
यह पेपर शास्त्रीय नेटवर्क राजस्व प्रबंधन (NRM) समस्या का अध्ययन करता है, जिसमें स्वीकृति/अस्वीकृति निर्णय और T स्वतंत्र समान रूप से वितरित आगमन शामिल हैं। हम एक वितरण रूप पर विचार करते हैं जहां प्रत्येक आगमन को सीमित संख्या में संभावित श्रेणियों में से एक से संबंधित होना चाहिए, प्रत्येक श्रेणी में निर्धारक संसाधन खपत वेक्टर है, लेकिन मूल्य अंतराल पर निरंतर वितरित है। हम इस मॉडल के तहत O(log2T) पश्चाताप प्राप्त करने वाला एक ऑनलाइन एल्गोरिदम विकसित करते हैं, एकमात्र (आवश्यक) धारणा यह है कि संभाव्यता घनत्व 0 से दूर है। हम दूसरा परिणाम प्राप्त करते हैं जो द्वितीय-क्रम वृद्धि की अतिरिक्त धारणा के तहत O(logT) पश्चाताप प्राप्त करता है। हमारे ज्ञान के अनुसार, ये निरंतर मूल्यों वाले NRM मॉडल में लॉगरिदमिक-स्तरीय पश्चाताप प्राप्त करने वाले पहले परिणाम हैं, किसी भी "गैर-डीजेनरेसी" धारणा की आवश्यकता नहीं है।
नेटवर्क राजस्व प्रबंधन (NRM) एक क्षमता नियंत्रण समस्या है जिसमें लंबाई T की सीमित समय अवधि में सीमित संसाधनों को आवंटित करना आवश्यक है। प्रत्येक समय चरण t पर, एक क्वेरी आती है जिसे संसाधन वेक्टर a~t की आवश्यकता होती है और पुरस्कार r~t प्रदान करता है। निर्णय निर्माता को तुरंत और अपरिवर्तनीय निर्णय लेना चाहिए कि इस क्वेरी को सेवा देनी है या नहीं।
Bumpensanti और Wang (2020): गैर-डीजेनरेसी धारणा के बिना असतत स्थिति
Li और Ye (2021): ऑनलाइन रैखिक प्रोग्रामिंग में दोहरी अभिसरण
Bray (2022): निरंतर मूल्य बहु-सचिव समस्या
यह पेपर नेटवर्क राजस्व प्रबंधन सिद्धांत में महत्वपूर्ण सफलता प्राप्त करता है, पहली बार निरंतर वितरण सेटिंग में लॉगरिदमिक-स्तरीय पश्चाताप प्राप्त करता है बिना पारंपरिक गैर-डीजेनरेसी धारणा के। तकनीकी नवाचार में अर्ध-द्रव विश्राम, सीमा आकर्षण रणनीति और सुधारी गई दोहरी अभिसरण विश्लेषण शामिल हैं, जो इस क्षेत्र के सैद्धांतिक विकास में महत्वपूर्ण योगदान देते हैं।