Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions
Jiang, Ma, Zhang
We study the classical Network Revenue Management (NRM) problem with accept/reject decisions and $T$ IID arrivals. We consider a distributional form where each arrival must fall under a finite number of possible categories, each with a deterministic resource consumption vector, but a random value distributed continuously over an interval. We develop an online algorithm that achieves $O(\log^2 T)$ regret under this model, with the only (necessary) assumption being that the probability densities are bounded away from 0. We derive a second result that achieves $O(\log T)$ regret under an additional assumption of second-order growth. To our knowledge, these are the first results achieving logarithmic-level regret in an NRM model with continuous values that do not require any kind of "non-degeneracy" assumptions. Our results are achieved via new techniques including a new method of bounding myopic regret, a "semi-fluid" relaxation of the offline allocation, and an improved bound on the "dual convergence".
academic
اللاتحديد مقبول: الندم اللوغاريتمي لإدارة إيرادات الشبكة مع التوزيعات غير المنفصلة
تدرس هذه الورقة مشكلة إدارة إيرادات الشبكة (NRM) الكلاسيكية، التي تتضمن قرارات القبول/الرفض و T وصول مستقل وموزع بشكل متطابق. نأخذ في الاعتبار شكل توزيع حيث يجب أن ينتمي كل وصول إلى عدد محدود من الفئات الممكنة، حيث تحتوي كل فئة على متجه استهلاك موارد حتمي، لكن القيمة موزعة بشكل مستمر على فترة زمنية. نطور خوارزمية عبر الإنترنت تحقق ندم O(log2T) تحت هذا النموذج، مع الافتراض الوحيد (الضروري) بأن كثافة الاحتمالية بعيدة عن الصفر. نشتق نتيجة ثانية تحقق ندم O(logT) تحت افتراض نمو من الدرجة الثانية إضافي. بقدر علمنا، هذه هي النتائج الأولى التي تحقق ندم لوغاريتمي في نماذج NRM ذات القيم المستمرة دون الحاجة إلى أي افتراض "لاتحديد".
إدارة إيرادات الشبكة (NRM) هي مشكلة التحكم في السعة التي تتطلب تخصيص موارد محدودة على نطاق زمني محدود بطول T. في كل خطوة زمنية t، يصل استعلام يتطلب متجه موارد a~t ويوفر مكافأة r~t. يجب على صانع القرار اتخاذ قرار فوري وغير قابل للإلغاء بشأن ما إذا كان سيخدم هذا الاستعلام.
Jasin و Kumar (2012): الاستدلالات المعاد حلها في NRM
Bumpensanti و Wang (2020): الحالات المنفصلة بدون افتراض لاتحديد
Li و Ye (2021): تقارب الثنائي في البرمجة الخطية عبر الإنترنت
Bray (2022): مشكلة الأمين المتعدد ذات القيم المستمرة
تحقق هذه الورقة اختراقاً مهماً في نظرية إدارة إيرادات الشبكة، حيث تحقق للمرة الأولى ندم لوغاريتمي في إعداد التوزيع المستمر دون الحاجة إلى افتراضات لاتحديد تقليدية. تشمل الابتكارات التقنية الاسترخاء شبه السائل واستراتيجية جذب الحدود وتحليل تقارب الثنائي المحسّن، مما يساهم بشكل كبير في تطور المجال النظري.