2025-11-10T02:37:09.167057

Distributionally robust approximation property of neural networks

Ceylan, PrÃ¶mel

The universal approximation property uniformly with respect to weakly compact families of measures is established for several classes of neural networks. To that end, we prove that these neural networks are dense in Orlicz spaces, thereby extending classical universal approximation theorems even beyond the traditional $L^p$-setting. The covered classes of neural networks include widely used architectures like feedforward neural networks with non-polynomial activation functions, deep narrow networks with ReLU activation functions and functional input neural networks.

academic

तंत्रिका नेटवर्क की वितरणात्मक रूप से मजबूत सन्निकटन संपत्ति

बुनियादी जानकारी

पेपर ID: 2510.09177
शीर्षक: तंत्रिका नेटवर्क की वितरणात्मक रूप से मजबूत सन्निकटन संपत्ति
लेखक: मिहरिबान सेयलान, डेविड जे. प्रोमेल
वर्गीकरण: stat.ML cs.LG math.FA math.PR
प्रकाशन समय: 13 अक्टूबर, 2025
पेपर लिंक: https://arxiv.org/abs/2510.09177

सारांश

कई वर्गों के तंत्रिका नेटवर्क के लिए कमजोरी से संहत माप परिवारों के संबंध में समान रूप से सार्वभौमिक सन्निकटन संपत्ति स्थापित की गई है। इस उद्देश्य के लिए, हम सिद्ध करते हैं कि ये तंत्रिका नेटवर्क ऑर्लिच स्पेस में सघन हैं, जिससे शास्त्रीय सार्वभौमिक सन्निकटन प्रमेयों को पारंपरिक $L^p$ -सेटिंग से परे भी विस्तारित किया जाता है। कवर किए गए तंत्रिका नेटवर्क वर्गों में व्यापक रूप से उपयोग की जाने वाली आर्किटेक्चर शामिल हैं जैसे गैर-बहुपद सक्रियण कार्यों के साथ फीडफॉरवर्ड तंत्रिका नेटवर्क, ReLU सक्रियण कार्यों के साथ गहरे संकीर्ण नेटवर्क और कार्यात्मक इनपुट तंत्रिका नेटवर्क।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

यह अनुसंधान वितरणात्मक रूप से मजबूत सन्निकटन संपत्ति (distributionally robust approximation property) स्थापित करने की मूल समस्या को हल करने का प्रयास करता है। विशेष रूप से, पारंपरिक सार्वभौमिक सन्निकटन प्रमेय (Universal Approximation Theorems, UATs) केवल एकल निश्चित वितरण μ के तहत $L^p(μ)$ स्पेस में सन्निकटन पर विचार करते हैं, जबकि यह पेपर सिद्ध करता है कि तंत्रिका नेटवर्क कमजोरी से संहत माप परिवार $\mathcal{M}$ पर समान रूप से कार्यों को सन्निकट कर सकते हैं, अर्थात दिए गए फ़ंक्शन $f$ और किसी भी $ε > 0$ के लिए, एक तंत्रिका नेटवर्क $η$ मौजूद है जैसे कि: $\sup_{ν \in \mathcal{M}} \|f - η\|_{L^1(ν)} < ε$

अनुसंधान का महत्व

सैद्धांतिक महत्व: शास्त्रीय सार्वभौमिक सन्निकटन प्रमेयों को एकल वितरण सेटिंग से वितरण परिवार के समान सन्निकटन तक सामान्यीकृत करता है
व्यावहारिक आवश्यकता: मशीन लर्निंग अभ्यास में, डेटा वितरण की अनिश्चितता एक सार्वभौमिक चुनौती है, जिसे वितरण अनिश्चितता (distributional uncertainty) कहा जाता है
अनुप्रयोग मूल्य: वितरणात्मक रूप से मजबूत सीखने, प्रतिकूल प्रशिक्षण, शोर डेटा प्रसंस्करण और अन्य क्षेत्रों के लिए सैद्धांतिक आधार प्रदान करता है

मौजूदा विधियों की सीमाएं

शास्त्रीय सार्वभौमिक सन्निकटन प्रमेयों में निम्नलिखित सीमाएं हैं:

एकल वितरण प्रतिबंध: केवल निश्चित एकल माप μ के लिए $L^p(μ)$ स्पेस में सन्निकटन संपत्ति
स्पेस प्रतिबंध: मुख्य रूप से $L^p$ स्पेस ढांचे तक सीमित, अधिक सामान्य फ़ंक्शन स्पेस सिद्धांत की कमी
मजबूती की कमी: वितरण बदलाव या वितरण अनिश्चितता परिदृश्यों को संभालने में असमर्थ

अनुसंधान प्रेरणा

इस पेपर की अनुसंधान प्रेरणा निम्नलिखित से उत्पन्न होती है:

वास्तविक अनुप्रयोगों में वितरण अनिश्चितता की सार्वभौमिक उपस्थिति (जैसे नाइटियन अनिश्चितता, प्रतिकूल नमूने आदि)
वितरणात्मक रूप से मजबूत अनुकूलन और सांख्यिकीय सीखने के विकास के लिए सैद्धांतिक समर्थन की आवश्यकता
तंत्रिका नेटवर्क सिद्धांत को $L^p$ स्पेस से अधिक सामान्य ऑर्लिच स्पेस तक विस्तारित करने की सैद्धांतिक आवश्यकता

मुख्य योगदान

ऑर्लिच स्पेस में सार्वभौमिक सन्निकटन प्रमेय: पहली बार कई वर्गों के तंत्रिका नेटवर्क की ऑर्लिच स्पेस में लक्समबर्ग मानदंड के संबंध में सघनता सिद्ध की गई है, जो शास्त्रीय $L^p$ स्पेस परिणामों का महत्वपूर्ण सामान्यीकरण है
वितरणात्मक रूप से मजबूत सन्निकटन संपत्ति: कमजोरी से संहत माप परिवारों के संबंध में तंत्रिका नेटवर्क के वितरणात्मक रूप से मजबूत सार्वभौमिक सन्निकटन प्रमेय स्थापित किए गए हैं, जो वितरण अनिश्चितता को संभालने के लिए सैद्धांतिक आधार प्रदान करते हैं
व्यापक नेटवर्क आर्किटेक्चर कवरेज: कई महत्वपूर्ण तंत्रिका नेटवर्क आर्किटेक्चर शामिल हैं:
- सीमित गैर-बहुपद सक्रियण कार्यों के साथ फीडफॉरवर्ड नेटवर्क
- ReLU सक्रियण के साथ गहरे संकीर्ण नेटवर्क
- कार्यात्मक इनपुट तंत्रिका नेटवर्क
सैद्धांतिक ढांचे में नवाचार: ऑर्लिच स्पेस सिद्धांत के माध्यम से, विभिन्न हानि कार्यों (जैसे क्रॉस-एंट्रॉपी, KL विचलन) को संभालने के लिए एक एकीकृत गणितीय ढांचा प्रदान करता है

विधि विवरण

कार्य परिभाषा

कमजोरी से संहत माप परिवार $\mathcal{M}$ और उपयुक्त फ़ंक्शन $f: \mathbb{R}^{N_0} \to \mathbb{R}^{N_L}$ दिए गए हैं, किसी भी $ε > 0$ के लिए, एक तंत्रिका नेटवर्क $η$ खोजें जैसे कि: $\sup_{ν \in \mathcal{M}} \|f - η\|_{L^1(ν)} < ε$

सैद्धांतिक आर्किटेक्चर

ऑर्लिच स्पेस ढांचा

पेपर ऑर्लिच स्पेस सिद्धांत पर आधारित गणितीय ढांचा बनाता है। Young फ़ंक्शन φ के लिए, ऑर्लिच स्पेस को निम्नानुसार परिभाषित किया जाता है: $L^φ(μ; \mathbb{R}^{N_L}) := \{f: \mathbb{R}^{N_0} \to \mathbb{R}^{N_L} : \int_{\mathbb{R}^{N_0}} φ(α\|f\|) dμ < ∞ \text{ कुछ } α > 0 \text{ के लिए}\}$

गेज मानदंड से सुसज्जित: $N_{φ,μ}(f) := \inf\{k > 0: \int_{\mathbb{R}^{N_0}} φ(\|f\|/k) dμ ≤ 1\}$

तंत्रिका नेटवर्क परिभाषा

फीडफॉरवर्ड तंत्रिका नेटवर्क: $η = w_L ∘ ϱ ∘ w_{L-1} ∘ \cdots ∘ ϱ ∘ w_1$
कार्यात्मक इनपुट तंत्रिका नेटवर्क: $η(x) = \sum_{n=1}^N y_n ϱ(h_n(x))$ , जहां $h_n \in \mathcal{H}$ योगात्मक परिवार है

मुख्य प्रमेय

प्रमेय 2.3 (ऑर्लिच स्पेस में सार्वभौमिक सन्निकटन प्रमेय)

N-फ़ंक्शन φ और स्थानीय रूप से परिमित बोरेल माप μ के लिए, तंत्रिका नेटवर्क ऑर्लिच कोर $M^φ(μ)$ में गेज मानदंड के संबंध में सघन हैं, जिसमें शामिल हैं:

सीमित गैर-स्थिर सक्रियण कार्य (परिमित माप)
ReLU सक्रियण कार्य (स्थानीय रूप से परिमित माप)
सतत गैर-बहुपद सक्रियण कार्य (संहत समर्थन माप)
कार्यात्मक इनपुट तंत्रिका नेटवर्क (विशिष्ट शर्तों को पूरा करते हुए)

प्रमेय 3.1 (वितरणात्मक रूप से मजबूत सार्वभौमिक सन्निकटन प्रमेय)

कमजोरी से संहत माप परिवार $\mathcal{M}$ और इसके संबंधित Young जोड़ी $(φ_\mathcal{M}, ψ_\mathcal{M})$ के लिए, किसी भी $f \in M^{φ_\mathcal{M}}(μ; \mathbb{R}^{N_L})$ और $ε > 0$ के लिए, संबंधित वर्ग का एक तंत्रिका नेटवर्क η मौजूद है जैसे कि: $\sup_{ν \in \mathcal{M}} \|f - η\|_{L^1(ν; \mathbb{R}^{N_L})} < ε$

तकनीकी नवाचार बिंदु

Young जोड़ी निर्माण: कमजोरी से संहत माप परिवार की एकसमान समाकलनीयता का उपयोग करते हुए, De la Vallée Poussin प्रमेय के माध्यम से संबंधित Young जोड़ी का निर्माण
Hölder असमानता का सामान्यीकरण: ऑर्लिच स्पेस और $L^1$ स्पेस के बीच संबंध स्थापित करने के लिए सामान्यीकृत Hölder असमानता का उपयोग
सघनता तर्क: Hahn-Banach प्रमेय और Riesz प्रतिनिधित्व प्रमेय के सामान्यीकृत संस्करणों के माध्यम से तंत्रिका नेटवर्क की सघनता सिद्ध करना

प्रायोगिक सेटअप

यह पेपर शुद्ध सैद्धांतिक अनुसंधान है, जिसमें संख्यात्मक प्रयोग नहीं हैं। सभी परिणाम कठोर गणितीय प्रमाण के माध्यम से स्थापित किए गए हैं।

प्रमाण रणनीति

विरोधाभास विधि: मान लें कि तंत्रिका नेटवर्क सघन नहीं हैं, Hahn-Banach प्रमेय का उपयोग करके विरोधाभास प्राप्त करें
रचनात्मक प्रमाण: ReLU नेटवर्क के लिए, सन्निकटन नेटवर्क का स्पष्ट निर्माण करके
सन्निकटन सिद्धांत तकनीकें: शास्त्रीय सन्निकटन सिद्धांत परिणामों को माप सिद्धांत के साथ मिलाकर

प्रायोगिक परिणाम

मुख्य सैद्धांतिक परिणाम

प्रस्ताव 2.4 (सीमित सक्रियण कार्य)

सीमित गैर-स्थिर सक्रियण कार्य ϱ और L ≥ 2 के लिए, $\mathcal{NN}^ϱ_{N_0,N_L,L,∞}$ किसी भी परिमित बोरेल माप पर $M^φ(μ)$ में सघन है।

प्रस्ताव 2.6 (ReLU सक्रियण कार्य)

ReLU सक्रियण कार्य के लिए, $\mathcal{NN}^ϱ_{N_0,N_L,∞,N_0+N_L+1}$ किसी भी स्थानीय रूप से परिमित बोरेल माप पर $M^φ(μ)$ में सघन है।

प्रस्ताव 2.8 (गैर-बहुपद सक्रियण कार्य)

सतत गैर-बहुपद सक्रियण कार्य के लिए, $\mathcal{NN}^ϱ_{N_0,N_L,L,∞}$ संहत समर्थन परिमित बोरेल माप पर $M^φ(μ)$ में सघन है।

प्रस्ताव 2.10 (कार्यात्मक इनपुट तंत्रिका नेटवर्क)

उपयुक्त शर्तों के तहत, कार्यात्मक इनपुट तंत्रिका नेटवर्क $\mathcal{NN}^{\mathcal{H},ϱ}_{\mathbb{R}^{N_0},\mathbb{R}^{N_2}}$ परिमित बोरेल माप पर $M^φ(μ)$ में सघन है।

सैद्धांतिक निष्कर्ष

स्पेस विस्तार: शास्त्रीय $L^p$ परिणामों को ऑर्लिच स्पेस तक सफलतापूर्वक सामान्यीकृत किया गया है, गैर-मानक वृद्धि शर्तों को संभालने के लिए ढांचा प्रदान करता है
माप सामान्यीकरण: Lebesgue माप से सामान्य स्थानीय रूप से परिमित बोरेल माप तक सामान्यीकृत किया गया है
आर्किटेक्चर एकीकरण: एकीकृत सैद्धांतिक ढांचे के तहत कई तंत्रिका नेटवर्क आर्किटेक्चर को संभाला जाता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

ऑर्लिच स्पेस में तंत्रिका नेटवर्क की सार्वभौमिक सन्निकटन संपत्ति स्थापित की गई है, जो शास्त्रीय सिद्धांत को महत्वपूर्ण रूप से विस्तारित करती है
तंत्रिका नेटवर्क की वितरणात्मक रूप से मजबूत सन्निकटन क्षमता सिद्ध की गई है, जो वितरण अनिश्चितता को संभालने के लिए सैद्धांतिक आधार प्रदान करती है
व्यापक रूप से उपयोग की जाने वाली तंत्रिका नेटवर्क आर्किटेक्चर को शामिल किया गया है, जिसमें अच्छा व्यावहारिक मूल्य है

सीमाएं

माप शर्तें: विभिन्न नेटवर्क आर्किटेक्चर को विभिन्न माप शर्तों की आवश्यकता होती है (परिमितता, संहत समर्थन आदि)
रचनात्मकता: हालांकि अस्तित्व सिद्ध किया गया है, लेकिन स्पष्ट नेटवर्क निर्माण विधि की कमी है
कम्प्यूटेशनल जटिलता: आवश्यक नेटवर्क आकार और सन्निकटन सटीकता के बीच मात्रात्मक संबंध का विश्लेषण नहीं किया गया है

भविष्य की दिशाएं

मात्रात्मक विश्लेषण: सन्निकटन त्रुटि और नेटवर्क जटिलता के बीच मात्रात्मक संबंध स्थापित करना
एल्गोरिथम कार्यान्वयन: सैद्धांतिक परिणामों पर आधारित व्यावहारिक एल्गोरिदम विकसित करना
अनुप्रयोग विस्तार: सिद्धांत को विशिष्ट मशीन लर्निंग कार्यों में लागू करना

गहन मूल्यांकन

लाभ

सैद्धांतिक गहराई: गणितीय रूप से कठोर और गहन, तंत्रिका नेटवर्क सिद्धांत को नई ऊंचाई तक ले जाता है
एकीकृत ढांचा: ऑर्लिच स्पेस ढांचा कई समस्याओं को संभालने के लिए एकीकृत दृष्टिकोण प्रदान करता है
व्यावहारिक महत्व: वितरणात्मक रूप से मजबूत सीखने के लिए ठोस सैद्धांतिक आधार प्रदान करता है
तकनीकी नवाचार: कार्यात्मक विश्लेषण, माप सिद्धांत और सन्निकटन सिद्धांत की तकनीकों को चतुराई से जोड़ता है

कमियां

व्यावहारिक अंतर: शुद्ध सैद्धांतिक परिणाम, व्यावहारिक अनुप्रयोग से काफी दूरी है
शर्त सीमाएं: विभिन्न परिणामों को विभिन्न तकनीकी शर्तों की आवश्यकता है, एकीकरण सीमित है
निर्माण की कमी: विशिष्ट नेटवर्क निर्माण और प्रशिक्षण एल्गोरिदम की कमी है

प्रभाव

सैद्धांतिक योगदान: तंत्रिका नेटवर्क सिद्धांत के लिए नई गणितीय नींव स्थापित करता है
अंतःविषय मूल्य: मशीन लर्निंग, कार्यात्मक विश्लेषण और माप सिद्धांत को जोड़ता है
दीर्घकालीन महत्व: भविष्य के वितरणात्मक रूप से मजबूत सीखने के अनुसंधान के लिए सैद्धांतिक मार्गदर्शन प्रदान करता है

लागू परिदृश्य

सैद्धांतिक अनुसंधान: तंत्रिका नेटवर्क सिद्धांत शोधकर्ताओं को नए उपकरण प्रदान करता है
मजबूत सीखना: वितरणात्मक रूप से मजबूत अनुकूलन और प्रतिकूल प्रशिक्षण के सैद्धांतिक विकास को निर्देशित करता है
गैर-मानक हानि: क्रॉस-एंट्रॉपी, KL विचलन आदि गैर- $L^p$ प्रकार की हानि कार्यों के सैद्धांतिक विश्लेषण को संभालता है

संदर्भ

पेपर में सन्निकटन सिद्धांत, कार्यात्मक विश्लेषण, तंत्रिका नेटवर्क सिद्धांत और वितरणात्मक रूप से मजबूत अनुकूलन सहित कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हुए समृद्ध संदर्भ हैं, जो पाठकों को व्यापक पृष्ठभूमि ज्ञान प्रदान करते हैं।

समग्र मूल्यांकन: यह सैद्धांतिक रूप से बहुत कठोर और गहन पेपर है, जो तंत्रिका नेटवर्क की सार्वभौमिक सन्निकटन सिद्धांत को शास्त्रीय $L^p$ स्पेस से ऑर्लिच स्पेस तक सफलतापूर्वक सामान्यीकृत करता है, और वितरणात्मक रूप से मजबूत सन्निकटन संपत्ति स्थापित करता है। हालांकि व्यावहारिक अनुप्रयोग से अभी दूरी है, लेकिन तंत्रिका नेटवर्क सिद्धांत और वितरणात्मक रूप से मजबूत सीखने के लिए महत्वपूर्ण गणितीय आधार प्रदान करता है।