Time-Varying Optimization for Streaming Data Via Temporal Weighting
Abrar, Michelusi, Larsson
Classical optimization theory deals with fixed, time-invariant objective functions. However, time-varying optimization has emerged as an important subject for decision-making in dynamic environments. In this work, we study the problem of learning from streaming data through a time-varying optimization lens. Unlike prior works that focus on generic formulations, we introduce a structured, \emph{weight-based} formulation that explicitly captures the streaming-data origin of the time-varying objective, where at each time step, an agent aims to minimize a weighted average loss over all the past data samples. We focus on two specific weighting strategies: (1) uniform weights, which treat all samples equally, and (2) discounted weights, which geometrically decay the influence of older data. For both schemes, we derive tight bounds on the ``tracking error'' (TE), defined as the deviation between the model parameter and the time-varying optimum at a given time step, under gradient descent (GD) updates. We show that under uniform weighting, the TE vanishes asymptotically with a $\mathcal{O}(1/t)$ decay rate, whereas discounted weighting incurs a nonzero error floor controlled by the discount factor and the number of gradient updates performed at each time step. Our theoretical findings are validated through numerical simulations.
academic
समय-परिवर्तनशील अनुकूलन स्ट्रीमिंग डेटा के लिए अस्थायी भारण के माध्यम से
परंपरागत अनुकूलन सिद्धांत निश्चित, समय-अपरिवर्तनीय उद्देश्य कार्यों से संबंधित है। हालांकि, समय-परिवर्तनशील अनुकूलन गतिशील वातावरण में निर्णय लेने के लिए एक महत्वपूर्ण विषय बन गया है। यह पेपर समय-परिवर्तनशील अनुकूलन के दृष्टिकोण से स्ट्रीमिंग डेटा शिक्षण समस्या का अध्ययन करता है। पिछले कार्यों से भिन्न जो सामान्य सूत्रों पर ध्यान केंद्रित करते हैं, हम एक संरचित भार-आधारित सूत्र प्रस्तुत करते हैं जो स्पष्ट रूप से समय-परिवर्तनशील उद्देश्य के स्ट्रीमिंग डेटा स्रोत को कैप्चर करता है, जहां एजेंट प्रत्येक समय चरण पर सभी पिछले डेटा नमूनों के भारित औसत नुकसान को कम करने का लक्ष्य रखता है। हम दो विशिष्ट भारण रणनीतियों पर ध्यान केंद्रित करते हैं: (1) समान भार, सभी नमूनों को समान रूप से मानते हैं; (2) छूट भार, पुराने डेटा के प्रभाव को ज्यामितीय रूप से क्षय करते हैं। दोनों योजनाओं के लिए, हम ग्रेडिएंट डिसेंट (GD) अपडेट के तहत "ट्रैकिंग त्रुटि" (TE) की तंग सीमाएं प्राप्त करते हैं, TE को मॉडल पैरामीटर और दिए गए समय चरण के समय-परिवर्तनशील इष्टतम समाधान के बीच विचलन के रूप में परिभाषित किया जाता है। हम साबित करते हैं कि समान भारण के तहत, TE O(1/t) की क्षय दर पर渐近रूप से गायब हो जाता है, जबकि छूट भारण छूट कारक और प्रत्येक समय चरण पर निष्पादित ग्रेडिएंट अपडेट की संख्या द्वारा नियंत्रित एक गैर-शून्य त्रुटि निचली सीमा उत्पन्न करता है।
यह पेपर स्ट्रीमिंग डेटा वातावरण में समय-परिवर्तनशील अनुकूलन शिक्षण समस्या को हल करने के लिए है। विशेष रूप से:
परंपरागत अनुकूलन की सीमाएं: शास्त्रीय मशीन लर्निंग अनुकूलन स्थिर उद्देश्य कार्यों को मानता है, स्थिर डेटा वितरण मानता है, लेकिन वास्तविक दुनिया के समाधान गतिशील विकसित वातावरण में काम करते हैं
स्ट्रीमिंग डेटा की चुनौतियां: डेटा क्रमिक रूप से आता है, उद्देश्य कार्य समय के साथ विकसित होता है, जिससे गैर-स्थिर अनुकूलन समस्या होती है
कम्प्यूटेशनल बाधाएं: वास्तविक समय या संसाधन-सीमित सेटिंग में, प्रत्येक समय चरण पर केवल सीमित संख्या में अपडेट निष्पादित किए जा सकते हैं
सामान्य सूत्रों की ढीली सीमाएं: अधिकांश मौजूदा कार्य सामान्य समय-परिवर्तनशील सूत्रों पर ध्यान केंद्रित करते हैं, स्ट्रीमिंग डेटा की अंतर्निहित संरचना को नजरअंदाज करते हैं, जिससे ट्रैकिंग त्रुटि की ढीली सीमाएं हो सकती हैं
संरचित विश्लेषण की कमी: मौजूदा विधियां अधिक तंग प्रदर्शन सीमाएं प्राप्त करने के लिए स्ट्रीमिंग डेटा की भार संरचना का स्पष्ट रूप से उपयोग नहीं करती हैं
सिद्धांत और व्यवहार में अंतराल: सतत शिक्षा क्षेत्र की विधियां अधिकतर अनुभवजन्य हैं, सैद्धांतिक आधार की कमी है
संरचित भार सूत्र प्रस्तुत करना: स्ट्रीमिंग डेटा की संरचना को स्पष्ट रूप से कैप्चर करने वाले समय-परिवर्तनशील उद्देश्य कार्य को पेश करना, सभी पिछले नमूनों के नुकसान के भारित औसत के रूप में परिभाषित
दो भारण रणनीतियों का सैद्धांतिक विश्लेषण:
समान भार: साबित करता है कि ट्रैकिंग त्रुटि O(1/t) दर पर渐近रूप से गायब हो जाती है
छूट भार: स्पष्ट गैर-शून्य渐近ट्रैकिंग त्रुटि सीमाएं प्राप्त करता है
तंग सीमाएं प्राप्त करना: स्ट्रीमिंग डेटा संरचना का उपयोग करके मौजूदा सामान्य समय-परिवर्तनशील विश्लेषण की तुलना में अधिक तंग TE सीमाएं प्राप्त करना
सैद्धांतिक और प्रायोगिक सत्यापन: संख्यात्मक सिमुलेशन के माध्यम से सैद्धांतिक निष्कर्षों की वैधता सत्यापित करना
एक एकल एजेंट (जैसे एज या क्लाउड सर्वर) के लिए शिक्षण सेटिंग पर विचार करें जो समय-परिवर्तनशील मशीन लर्निंग मॉडल पैरामीटर को ट्रैक करने का लक्ष्य रखता है:
इनपुट: प्रत्येक पुनरावृत्ति t≥1 पर, एजेंट नया डेटा नमूना (xt, yt) प्राप्त करता है
आउटपुट: मॉडल पैरामीटर wt, संचित डेटा के भारित औसत नुकसान को कम करता है
बाधा: प्रत्येक समय चरण पर केवल E ग्रेडिएंट अपडेट निष्पादित किए जा सकते हैं
O(1/t) क्षय सत्यापन: प्रयोग सैद्धांतिक भविष्यवाणियों के अनुरूप स्पष्ट एकरस क्षय प्रदर्शित करता है
ग्रेडिएंट अपडेट संख्या प्रभाव: E को 10 से 20 तक बढ़ाने से, अनुभवजन्य TE में सुधार कारक लगभग 0.09 है, जो सैद्धांतिक भविष्यवाणी के साथ मात्रात्मक रूप से मेल खाता है
दीर्घकालीन व्यवहार: बड़े t के लिए, TE न्यूनतमकर्ता बहाव की अवशिष्ट त्रुटि द्वारा प्रभुत्व है
प्रस्ताव 3: ATEγ≤ϵ सुनिश्चित करने के लिए, निष्पादित करने की आवश्यकता है:
E≥ln(1−ημ)ln(C′(1−γ)+ϵϵ)
ग्रेडिएंट अपडेट, जिससे O(ln(1/ε)) की ग्रेडिएंट पुनरावृत्ति जटिलता होती है।
पेपर 40 संबंधित संदर्भों का हवाला देता है, जो समय-परिवर्तनशील अनुकूलन, सतत शिक्षा, उत्तल अनुकूलन आदि महत्वपूर्ण क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।