A Connection Between Score Matching and Local Intrinsic Dimension
Yeats, Jacobson, Hannan et al.
The local intrinsic dimension (LID) of data is a fundamental quantity in signal processing and learning theory, but quantifying the LID of high-dimensional, complex data has been a historically challenging task. Recent works have discovered that diffusion models capture the LID of data through the spectra of their score estimates and through the rate of change of their density estimates under various noise perturbations. While these methods can accurately quantify LID, they require either many forward passes of the diffusion model or use of gradient computation, limiting their applicability in compute- and memory-constrained scenarios.
We show that the LID is a lower bound on the denoising score matching loss, motivating use of the denoising score matching loss as a LID estimator. Moreover, we show that the equivalent implicit score matching loss also approximates LID via the normal dimension and is closely related to a recent LID estimator, FLIPD. Our experiments on a manifold benchmark and with Stable Diffusion 3.5 indicate that the denoising score matching loss is a highly competitive and scalable LID estimator, achieving superior accuracy and memory footprint under increasing problem size and quantization level.
academic
स्कोर मैचिंग और स्थानीय आंतरिक आयाम के बीच एक संबंध
स्थानीय आंतरिक आयाम (Local Intrinsic Dimension, LID) संकेत प्रसंस्करण और सीखने के सिद्धांत में एक मौलिक मात्रा है, लेकिन उच्च-आयामी जटिल डेटा के LID को मापना ऐतिहासिक रूप से एक चुनौतीपूर्ण कार्य रहा है। हाल के शोध से पता चलता है कि प्रसार मॉडल विभिन्न शोर विक्षोभों के तहत अपने स्कोर अनुमान के स्पेक्ट्रम और घनत्व अनुमान के परिवर्तन दर के माध्यम से डेटा के LID को कैप्चर करते हैं। यद्यपि ये विधियां LID को सटीक रूप से मापने में सक्षम हैं, लेकिन उन्हें प्रसार मॉडल के कई फॉरवर्ड पास या ग्रेडिएंट गणना के उपयोग की आवश्यकता होती है, जो कम्प्यूटेशनल और मेमोरी-सीमित परिदृश्यों में इसकी प्रयोज्यता को सीमित करता है।
यह पेपर साबित करता है कि LID विनोदन स्कोर मैचिंग हानि का निचला सीमा है, जिससे विनोदन स्कोर मैचिंग हानि को LID अनुमानक के रूप में उपयोग करने के लिए सैद्धांतिक आधार प्रदान करता है। इसके अलावा, लेखकों ने साबित किया कि समतुल्य निहित स्कोर मैचिंग हानि भी सामान्य आयाम के माध्यम से LID का अनुमान लगाती है, और हाल के LID अनुमानक FLIPD के साथ घनिष्ठ रूप से संबंधित है। मैनिफोल्ड बेंचमार्क और Stable Diffusion 3.5 पर प्रयोगों से पता चलता है कि विनोदन स्कोर मैचिंग हानि एक अत्यधिक प्रतिस्पर्धी और स्केलेबल LID अनुमानक है, जो समस्या के आकार और परिमाणीकरण स्तर बढ़ने पर उच्च सटीकता और मेमोरी उपयोग प्राप्त करता है।
उच्च-आयामी डेटा में आमतौर पर कम-आयामी संरचना होती है, जिसे मैनिफोल्ड परिकल्पना कहा जाता है, यह मशीन लर्निंग की मूल परिकल्पना है। स्थानीय आंतरिक आयाम (LID) कम-आयामी संरचना को एनकोड करने वाली मौलिक मात्रा है, बिंदु x के लिए, LID x के चारों ओर डेटा को बिना नुकसान के एनकोड करने के लिए आवश्यक स्थानीय आयाम है।
गैर-पैरामीट्रिक विधियां: बड़ी मात्रा में नमूना डेटा की आवश्यकता होती है, हाइपरपैरामीटर चयन से दृढ़ता से प्रभावित होती हैं, कम डेटा सेटिंग में सामान्यीकृत नहीं हो सकती हैं
पैरामीट्रिक विधियां: यद्यपि गहन जनरेटिव मॉडल का उपयोग करके स्केलेबिलिटी प्राप्त करती हैं, लेकिन LIDL को कई जनरेटिव मॉडल की आवश्यकता होती है, FLIPD और सामान्य बंडल विधियों को ग्रेडिएंट गणना या कई फॉरवर्ड पास की आवश्यकता होती है
मौजूदा पैरामीट्रिक LID अनुमान विधियों में कम्प्यूटेशनल और मेमोरी दक्षता के संदर्भ में सीमाएं हैं, विशेष रूप से बड़े पैमाने पर अनुप्रयोगों में। यह पेपर एक अधिक कुशल, स्केलेबल LID अनुमान विधि की खोज करना चाहता है।
सैद्धांतिक योगदान: साबित करता है कि विनोदन स्कोर मैचिंग हानि LID को निचली सीमा के रूप में रखती है, जिससे इसे स्केलेबल LID अनुमानक के रूप में उपयोग करने के लिए सैद्धांतिक आधार प्रदान करता है
विधि संबंध: स्कोर मैचिंग हानि और वर्तमान अग्रणी अनुमानकों (FLIPD और सामान्य बंडल विधि) के बीच घनिष्ठ संबंध स्थापित करता है
प्रायोगिक सत्यापन: मैनिफोल्ड बेंचमार्क और Stable Diffusion 3.5/2.0 पर प्रयोग दिखाते हैं कि विनोदन स्कोर मैचिंग हानि एक अत्यधिक प्रतिस्पर्धी LID अनुमानक है
व्यावहारिक लाभ: मेमोरी उपयोग और परिमाणीकरण सामंजस्य के संदर्भ में उच्च स्केलेबिलिटी प्रदर्शित करता है
d-आयामी डेटा मैनिफोल्ड M⊂Rⁿ से नमूना किए गए बिंदु x को देखते हुए, इसके स्थानीय आंतरिक आयाम d का अनुमान लगाएं। इनपुट उच्च-आयामी डेटा बिंदु हैं, आउटपुट संबंधित LID अनुमान मान हैं।
सामान्य बंडल विधि m×n मैट्रिक्स के एकवचन मान की गणना करती है, जबकि यह पेपर प्रस्तावित त्रुटि बंडल विधि त्रुटि वेक्टर मैट्रिक्स के eigenvalues की गणना करती है। विनोदन हानि Gram मैट्रिक्स eigenvalues के ट्रेस (क्षेत्र) के बराबर है, छोटे नमूनों पर भी सटीक है।
पेपर कई महत्वपूर्ण संबंधित कार्यों का हवाला देता है, जिनमें शामिल हैं:
Vincent (2011): विनोदन और जनरेटिव मॉडलिंग का संबंध
Hyvärinen & Dayan (2005): स्कोर मैचिंग का मूल सिद्धांत
Kamkari et al. (2024): FLIPD विधि
Stanczuk et al. (2024): सामान्य बंडल विधि
साथ ही प्रसार मॉडल और प्रवाह मिलान के संबंधित साहित्य
समग्र मूल्यांकन: यह सिद्धांत और व्यवहार दोनों को संतुलित करने वाला एक उत्कृष्ट पेपर है, जो LID अनुमान के लिए नया सैद्धांतिक दृष्टिकोण और व्यावहारिक विधि प्रदान करता है। यद्यपि कुछ तकनीकी विवरणों में सुधार की गुंजाइश है, लेकिन इसके मूल योगदान प्रसार मॉडल की ज्यामितीय संपत्ति को समझने और LID अनुमान विधि में सुधार के लिए महत्वपूर्ण मूल्य रखते हैं।