Time-Varying Optimization for Streaming Data Via Temporal Weighting
Abrar, Michelusi, Larsson
Classical optimization theory deals with fixed, time-invariant objective functions. However, time-varying optimization has emerged as an important subject for decision-making in dynamic environments. In this work, we study the problem of learning from streaming data through a time-varying optimization lens. Unlike prior works that focus on generic formulations, we introduce a structured, \emph{weight-based} formulation that explicitly captures the streaming-data origin of the time-varying objective, where at each time step, an agent aims to minimize a weighted average loss over all the past data samples. We focus on two specific weighting strategies: (1) uniform weights, which treat all samples equally, and (2) discounted weights, which geometrically decay the influence of older data. For both schemes, we derive tight bounds on the ``tracking error'' (TE), defined as the deviation between the model parameter and the time-varying optimum at a given time step, under gradient descent (GD) updates. We show that under uniform weighting, the TE vanishes asymptotically with a $\mathcal{O}(1/t)$ decay rate, whereas discounted weighting incurs a nonzero error floor controlled by the discount factor and the number of gradient updates performed at each time step. Our theoretical findings are validated through numerical simulations.
academic
تحسين متغير مع الزمن لبيانات البث عبر الترجيح الزمني
تتعامل نظرية التحسين التقليدية مع دوال هدف ثابتة وغير متغيرة مع الزمن. ومع ذلك، أصبح التحسين المتغير مع الزمن موضوعاً مهماً لاتخاذ القرارات في البيئات الديناميكية. تدرس هذه الورقة مشكلة التعلم من بيانات البث من منظور التحسين المتغير مع الزمن. بخلاف الأعمال السابقة التي تركز على صيغ عامة، نقدم صيغة منظمة قائمة على الترجيح تلتقط بشكل صريح مصادر البيانات المتدفقة للأهداف المتغيرة مع الزمن، حيث يهدف الوكيل في كل خطوة زمنية إلى تقليل متوسط الخسارة المرجح لجميع عينات البيانات السابقة. نركز على استراتيجيتي ترجيح محددتين: (1) الترجيح المنتظم، الذي يعامل جميع العينات بالتساوي؛ (2) الترجيح المخصوم، الذي يتسبب في تناقص هندسي لتأثير البيانات القديمة. بالنسبة لكلا المخطط، نشتق حدوداً ضيقة لـ "خطأ التتبع" (TE) تحت تحديثات الانحدار التدريجي (GD)، حيث يُعرّف TE بأنه الانحراف بين معاملات النموذج والحل الأمثل المتغير مع الزمن في خطوة زمنية معينة. نثبت أنه تحت الترجيح المنتظم، يختفي TE بشكل مقارب بمعدل تناقص O(1/t)، بينما ينتج الترجيح المخصوم حداً أدنى لخطأ غير صفري يتحكم فيه عامل الخصم وعدد تحديثات الانحدار التدريجي المنفذة في كل خطوة زمنية.
المشكلة الأساسية التي تعالجها هذه الورقة هي مشكلة التعلم بالتحسين المتغير مع الزمن في بيئة البيانات المتدفقة. بشكل محدد:
قيود التحسين التقليدي: يقوم التحسين الكلاسيكي في التعلم الآلي بتحسين دوال هدف ثابتة، مع افتراض توزيع بيانات ثابت، لكن الحلول الواقعية تعمل في بيئات تتطور ديناميكياً
تحديات البيانات المتدفقة: تصل البيانات بشكل متسلسل، وتتطور دالة الهدف مع الزمن، مما يؤدي إلى مشاكل تحسين غير ثابتة
القيود الحسابية: في الإعدادات الفورية أو المحدودة الموارد، يمكن تنفيذ عدد محدود فقط من التحديثات في كل خطوة زمنية
حدود فضفاضة للصيغ العامة: تركز معظم الأعمال الموجودة على صيغ زمنية متغيرة عامة، مما يتجاهل البنية الكامنة للبيانات المتدفقة، مما قد يؤدي إلى حدود فضفاضة لخطأ التتبع
نقص التحليل المنظم: لم تستفد الطرق الموجودة بشكل صريح من بنية الترجيح للبيانات المتدفقة للحصول على حدود أداء أضيق
الانفصال بين النظرية والممارسة: الطرق في مجال التعلم المستمر هي في الغالب تجريبية، وتفتقر إلى الأساس النظري
تستشهد الورقة بـ 40 مرجعاً ذا صلة، تغطي الأعمال المهمة في مجالات التحسين المتغير مع الزمن والتعلم المستمر والتحسين المحدب، مما يوفر أساساً نظرياً متيناً للبحث.