In this paper we will give a characterization of the learnability of forgiving 0-1 loss functions in the finite label multiclass setting. To do this, we create a new combinatorial dimension that is based off of the Natarajan Dimension and we show that a hypothesis class is learnable in our setting if and only if this Generalized Natarajan Dimension is finite. We also show a connection to learning with set-valued feedback. Through our results we show that the learnability of a set learning problem is characterized by the Natarajan Dimension.
- पेपर ID: 2510.08382
- शीर्षक: क्षमाशील 0-1 हानि कार्यों की बहुवर्गीय सीखने की क्षमता का लक्षण वर्णन
- लेखक: Jacob Trauger (मिशिगन विश्वविद्यालय), Tyson Trauger (ओहियो स्टेट विश्वविद्यालय), Ambuj Tewari (मिशिगन विश्वविद्यालय)
- वर्गीकरण: cs.LG (मशीन लर्निंग), stat.ML (सांख्यिकी - मशीन लर्निंग)
- प्रकाशन समय: अक्टूबर 2025 (arXiv प्रीप्रिंट)
- पेपर लिंक: https://arxiv.org/abs/2510.08382
यह पेपर सीमित लेबल बहुवर्गीय वर्गीकरण सेटिंग में क्षमाशील 0-1 हानि कार्यों की सीखने की क्षमता का लक्षण वर्णन प्रदान करता है। इसके लिए, लेखकों ने Natarajan आयाम के आधार पर एक नया संयोजी आयाम बनाया है और सिद्ध किया है कि परिकल्पना वर्ग इस सेटिंग में सीखने योग्य है यदि और केवल यदि यह सामान्यीकृत Natarajan आयाम परिमित है। लेख समुच्चय-मूल्यवान प्रतिक्रिया सीखने के साथ संबंध भी प्रदर्शित करता है, परिणामों के माध्यम से दिखाता है कि समुच्चय सीखने की समस्याओं की सीखने की क्षमता Natarajan आयाम द्वारा लक्षणित है।
मशीन लर्निंग सिद्धांत में, वर्गीकरण कार्यों की सीखने की क्षमता का लक्षण वर्णन एक मूल समस्या है। द्विआधारी वर्गीकरण के लिए, VC आयाम PAC सीखने की क्षमता को पूरी तरह से लक्षणित करता है; बहुवर्गीय वर्गीकरण के लिए, सीमित लेबल स्थिति में Natarajan आयाम समान भूमिका निभाता है। हालांकि, ये सभी सिद्धांत मानक 0-1 हानि कार्य पर आधारित हैं, जिसमें "अविभेद्यों की पहचान" (Identity of Indiscernibles) गुण है, अर्थात् हानि शून्य है यदि और केवल यदि दोनों लेबल समान हैं।
व्यावहारिक अनुप्रयोगों में, अक्सर अधिक "क्षमाशील" हानि कार्यों की आवश्यकता होती है, उदाहरण के लिए:
- वाक्य पुनर्लेखन कार्य: कई भिन्न वाक्य सही पुनर्लेखन हो सकते हैं
- सीमा-आधारित मेट्रिक्स: एक निश्चित सीमा के भीतर आउटपुट स्वीकार्य हो सकते हैं
- समुच्चय-मूल्यवान प्रतिक्रिया सीखना: पूर्वानुमान परिणाम केवल दिए गए समुच्चय में होने की आवश्यकता है
इन परिस्थितियों में, एक ही वास्तविक लेबल के लिए कई भिन्न आउटपुट शून्य हानि उत्पन्न कर सकते हैं, जो पारंपरिक सिद्धांत की मूल मान्यताओं को तोड़ता है।
मौजूदा सीखने की क्षमता सिद्धांत (VC आयाम, Natarajan आयाम आदि) सभी निहित रूप से लेबल समानता को हानि मूल्य से जोड़ते हैं। जब हानि कार्य अविभेद्यों की पहचान को संतुष्ट नहीं करता है, तो ये सिद्धांत अब लागू नहीं होते हैं, और सीखने की क्षमता को लक्षणित करने के लिए एक नई सैद्धांतिक रूपरेखा की आवश्यकता है।
- सामान्यीकृत Natarajan आयाम का प्रस्ताव: Natarajan आयाम के आधार पर एक नया संयोजी आयाम बनाया गया है, जो क्षमाशील 0-1 हानि कार्यों के लिए उपयुक्त है
- पूर्ण सीखने की क्षमता का लक्षण वर्णन: सिद्ध किया गया है कि परिकल्पना वर्ग क्षमाशील 0-1 हानि के तहत PAC सीखने योग्य है यदि और केवल यदि सामान्यीकृत Natarajan आयाम परिमित है
- समुच्चय सीखने की समस्याओं का समाधान: बैच सेटिंग में समुच्चय-मूल्यवान प्रतिक्रिया सीखने की सीखने की क्षमता को पहली बार लक्षणित किया गया है
- सैद्धांतिक रूपरेखा की स्थापना: अविभेद्यों की पहचान को संतुष्ट न करने वाले हानि कार्यों के लिए एक व्यवस्थित सीखने का सिद्धांत स्थापित किया गया है
इनपुट स्पेस: X (कोई भी इनपुट स्पेस)
आउटपुट स्पेस: Y=[k] (सीमित लेबल समुच्चय, ∣Y∣=k)
परिकल्पना वर्ग: H⊂YXहानि कार्य: ℓ:Y×Y→{0,1}, निम्नलिखित बाधाओं को संतुष्ट करता है:
- द्विमान: ∀y1,y2∈Y,ℓ(y1,y2)∈{0,1}
- सममितता: ∀y1,y2∈Y,ℓ(y1,y2)=ℓ(y2,y1)
- गैर-समावेशन: ∀y1,y2∈Y,σ(y1)⊂σ(y2)
- स्वतुल्यता: ∀y∈Y,ℓ(y,y)=0
जहां σ(y)={y′∣ℓ(y,y′)=0} सभी लेबलों का समुच्चय दर्शाता है जो y के साथ शून्य हानि उत्पन्न करते हैं।
परिभाषा 4 (सामान्यीकृत Natarajan आयाम):
परिकल्पना वर्ग H और हानि कार्य ℓ सामान्यीकृत Natarajan समुच्चय S={s1,...,sn} को पीसते हैं, यदि h1,h2∈H मौजूद हैं जैसे कि:
- पृथक्करण शर्त: ∀si∈S,σ(h1(si))=σ(h2(si))
- वास्तविकीकरण शर्त: ∀S′⊆S, h∈H मौजूद है जैसे कि:
- ∀s∈S′:σ(h(s))=σ(h1(s))
- ∀s∈S∖S′:σ(h(s))=σ(h2(s))
सामान्यीकृत Natarajan आयाम GNdim(H,ℓ) H द्वारा सामान्यीकृत Natarajan पीसे जा सकने वाले सबसे बड़े समुच्चय की मुख्यता है।
मुख्य अंतर्दृष्टि: σ कार्य के माध्यम से समतुल्य संबंध y∼y′⇔σ(y)=σ(y′) को परिभाषित करके, मूल समस्या को भागफल स्पेस YC=Y/∼ पर मानक बहुवर्गीय सीखने की समस्या में परिवर्तित किया जाता है।
लेम्मा 1: हानि कार्य समतुल्य संबंध का सम्मान करता है, अर्थात् यदि y1∼y1′ और y2∼y2′, तो ℓ(y1,y2)=ℓ(y1′,y2′)।
परिणाम 1: मूल सीखने की समस्या (X,Y,H,ℓ) भागफल स्पेस सीखने की समस्या (X,YC,HC,ℓC) के समतुल्य है।
परिणाम 2: GNdim(H,ℓ)=Ndim(HC)
प्रमेय 1 (मुख्य परिणाम): सीखने की समस्या (X,Y,H,ℓ) PAC सीखने योग्य है यदि और केवल यदि GNdim(H,ℓ)<∞।
आवश्यकता (लेम्मा 2):
- विरोधाभास द्वारा, मान लीजिए GNdim(H,ℓ)=∞
- प्रतिकूल वितरण परिवार का निर्माण करें, जिससे कोई भी सीखने वाला एल्गोरिदम किसी वितरण पर खराब प्रदर्शन करे
- पीसने के गुण का उपयोग करके 2m बिंदुओं पर जटिल कार्य परिवार का निर्माण करें
- संभाव्यता तर्क के माध्यम से सिद्ध करें कि कोई भी एल्गोरिदम का नुकसान कम से कम 2k1 है
पर्याप्तता (लेम्मा 3):
- समतुल्य सीखने की समस्या के निर्माण का उपयोग करें
- मूल हानि को k मानक 0-1 हानियों के रैखिक संयोजन में विघटित करें: 1−LD(h)=∑i=1k(1−LDi(h))
- चूंकि HC परिमित Natarajan आयाम रखता है, इसमें एकीकृत अभिसरण गुण हैं
- संयुक्त सीमा के माध्यम से ERM एल्गोरिदम की प्रभावशीलता सिद्ध करें
यह पेपर एक शुद्ध सैद्धांतिक कार्य है, जो मुख्य रूप से गणितीय प्रमाण के माध्यम से सैद्धांतिक परिणामों को सत्यापित करता है, पारंपरिक अर्थ में कोई प्रायोगिक सेटअप नहीं है। सैद्धांतिक सत्यापन निम्नलिखित तरीकों से किया जाता है:
- रचनात्मक प्रमाण: आवश्यकता को सिद्ध करने के लिए विशिष्ट प्रतिकूल वितरण का निर्माण करें
- कमी प्रमाण: जटिल समस्याओं को ज्ञात मानक बहुवर्गीय सीखने की समस्याओं में कम करें
- आयाम विश्लेषण: संयोजी आयाम की परिमितता के माध्यम से सीखने की क्षमता को लक्षणित करें
पेपर समुच्चय सीखने की समस्याओं के माध्यम से सिद्धांत की प्रभावशीलता को सत्यापित करता है, सैद्धांतिक प्रयोज्यता को दिखाने के लिए विशिष्ट हानि मैट्रिक्स का निर्माण करता है।
प्रमेय 1 का प्रमाण पूर्ण: सामान्यीकृत Natarajan आयाम क्षमाशील 0-1 हानि कार्यों की PAC सीखने की क्षमता को पूरी तरह से लक्षणित करता है।
समुच्चय सीखने का लक्षण वर्णन (परिणाम 3):
समुच्चय सीखने की समस्याओं के लिए, जहां हानि कार्य को परिभाषित किया गया है:
ℓ(y,v)={01y∈vअन्यथा
सिद्ध किया गया है कि इस समस्या की सीखने की क्षमता मानक Natarajan आयाम द्वारा लक्षणित है, अर्थात् GNdim(H,ℓ)=Ndim(H)।
- आयाम संरक्षण गुण: कई मामलों में, भले ही हानि कार्य अधिक क्षमाशील हो जाए, सीखने की जटिलता (आयाम द्वारा मापी गई) अपरिवर्तित रह सकती है
- प्रतिकूल वितरण का अस्तित्व: PAC सीखने की कठोरता का अर्थ है कि भले ही हानि कार्य अधिकतर शून्य हो, फिर भी सीखने को कठिन बनाने वाले वितरण मौजूद हो सकते हैं
- भागफल स्पेस की महत्ता: उपयुक्त समतुल्य संबंध के माध्यम से, जटिल सीखने की समस्याओं को मानक समस्याओं में कम किया जा सकता है
- VC सिद्धांत: Vapnik & Chervonenkis (1974) ने द्विआधारी वर्गीकरण के लिए सीखने की क्षमता का सिद्धांत स्थापित किया
- Natarajan आयाम: Natarajan (1989) ने सिद्धांत को बहुवर्गीय वर्गीकरण तक विस्तारित किया
- DS आयाम: Daniely & Shalev-Shwartz (2014) ने अनंत लेबल स्थिति को संभाला
- आंशिक अवधारणा वर्ग: Alon et al. (2022) ने आंशिक रूप से परिभाषित अवधारणा वर्गों का अध्ययन किया
- बहु-आउटपुट सीखना: Raman et al. (2024) ने बहु-आउटपुट सीखने की समस्याओं को लक्षणित किया
- ऑनलाइन समुच्चय सीखना: Raman et al. (2024) ने ऑनलाइन सेटिंग में समुच्चय-मूल्यवान प्रतिक्रिया का अध्ययन किया
यह पेपर बैच सेटिंग में क्षमाशील हानि कार्यों के सिद्धांत में अंतराल को भरता है, विशेष रूप से अविभेद्यों की पहचान को संतुष्ट न करने वाले हानि कार्यों को पहली बार व्यवस्थित रूप से संभालता है।
- पूर्ण लक्षण वर्णन: सामान्यीकृत Natarajan आयाम क्षमाशील 0-1 हानि कार्यों की PAC सीखने की क्षमता को पूरी तरह से लक्षणित करता है
- समुच्चय सीखने का समाधान: बैच सेटिंग में समुच्चय सीखने की सीखने की क्षमता को पहली बार पूरी तरह से लक्षणित किया गया है
- सैद्धांतिक एकीकरण: अविभेद्यों की पहचान को संतुष्ट न करने वाले हानि कार्यों के लिए एक एकीकृत सैद्धांतिक रूपरेखा स्थापित की गई है
- सममितता धारणा: वर्तमान सिद्धांत सममित हानि कार्यों की आवश्यकता है, यह धारणा अत्यधिक कठोर हो सकती है
- सीमित लेबल प्रतिबंध: सिद्धांत केवल सीमित लेबल स्थिति पर लागू होता है, अनंत लेबलों का विस्तार अभी भी अनुसंधान की प्रतीक्षा में है
- सीखने की दर: हालांकि सीखने की क्षमता को लक्षणित किया गया है, लेकिन सीखने की दर कैसे हानि कार्य की क्षमा के साथ बदलती है, इसका विश्लेषण नहीं किया गया है
- सममितता धारणा को हटाना: गैर-सममित हानि कार्यों की सीखने की क्षमता का अध्ययन करें
- अनंत लेबल विस्तार: Natarajan आयाम के लिए DS आयाम के विस्तार के समान
- सीखने की दर विश्लेषण: अध्ययन करें कि नमूना जटिलता हानि कार्य की क्षमा के स्तर पर कैसे निर्भर करती है
- एल्गोरिदम डिजाइन: क्षमाशील हानि कार्यों के लिए विशेष रूप से डिज़ाइन किए गए कुशल सीखने के एल्गोरिदम विकसित करें
- सैद्धांतिक नवीनता मजबूत है: अविभेद्यों की पहचान को संतुष्ट न करने वाले हानि कार्यों को पहली बार व्यवस्थित रूप से संभाला गया है, महत्वपूर्ण सैद्धांतिक अंतराल को भरता है
- गणितीय कठोरता: प्रमाण पूर्ण और कठोर है, विशेष रूप से जटिल समस्याओं को भागफल स्पेस निर्माण के माध्यम से ज्ञात समस्याओं में कम करने की तकनीक बहुत चतुर है
- व्यावहारिक मूल्य अधिक है: समुच्चय सीखना आदि व्यावहारिक समस्याओं के सैद्धांतिक आधार को हल करता है, महत्वपूर्ण अनुप्रयोग मूल्य है
- लेखन स्पष्ट है: पेपर संरचना स्पष्ट है, गणितीय अभिव्यक्ति सटीक है, समझने और सत्यापित करने में आसान है
- धारणा सीमित है: सममितता और सीमित लेबल की धारणाएं सिद्धांत की प्रयोज्यता को सीमित करती हैं
- एल्गोरिदम विश्लेषण की कमी: हालांकि ERM की प्रभावशीलता सिद्ध की गई है, लेकिन विशिष्ट एल्गोरिदम डिजाइन और अनुकूलन का गहन विश्लेषण नहीं है
- प्रायोगिक सत्यापन अपर्याप्त: शुद्ध सैद्धांतिक कार्य के रूप में, वास्तविक डेटासेट पर सत्यापन और अनुप्रयोग उदाहरणों की कमी है
- जटिलता विश्लेषण अधूरा है: विशिष्ट नमूना जटिलता सीमाएं प्रदान नहीं की गई हैं
- सैद्धांतिक योगदान महत्वपूर्ण है: सीखने के सिद्धांत के लिए नई अनुसंधान दिशा खोलता है, बाद में बड़े पैमाने पर अनुसंधान को प्रेरित करने की अपेक्षा है
- व्यावहारिक मूल्य महत्वपूर्ण है: समुच्चय सीखना, बहु-लेबल सीखना आदि व्यावहारिक समस्याओं के लिए सैद्धांतिक आधार प्रदान करता है
- पुनरुत्पादनीयता अच्छी है: सैद्धांतिक परिणाम पूरी तरह से गणितीय प्रमाण पर आधारित हैं, पूर्ण पुनरुत्पादनीयता है
- प्रेरणा मजबूत है: प्रस्तावित तकनीकी विधियां (भागफल स्पेस निर्माण, समतुल्य संबंध आदि) अन्य सीखने के सिद्धांत समस्याओं पर लागू हो सकती हैं
- समुच्चय-मूल्यवान भविष्यवाणी: सिफारिश प्रणाली, सूचना पुनः प्राप्ति आदि जहां उम्मीदवार समुच्चय लौटाने की आवश्यकता है
- बहु-लेबल सीखना: पाठ वर्गीकरण, छवि एनोटेशन आदि जहां कई सही उत्तर संभव हैं
- मजबूत सीखना: लेबल शोर के प्रति सहिष्णु होने की आवश्यकता वाली सीखने की परिस्थितियां
- अनुमानित सीखना: एक निश्चित स्तर की सन्निकटन की अनुमति देने वाली भविष्यवाणी कार्य
पेपर सीखने के सिद्धांत के क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:
- Vapnik & Chervonenkis (1974): VC सिद्धांत की नींव का काम
- Natarajan (1989): बहुवर्गीय सीखने के सिद्धांत का महत्वपूर्ण योगदान
- Shalev-Shwartz & Ben-David (2014): आधुनिक सीखने के सिद्धांत की पाठ्यपुस्तक
- Daniely et al., Brukhim et al., Raman et al. आदि जैसे हाल के संबंधित कार्य
समग्र मूल्यांकन: यह सीखने के सिद्धांत के क्षेत्र में एक उच्च गुणवत्ता वाला सैद्धांतिक पेपर है जो महत्वपूर्ण योगदान देता है। हालांकि कुछ धारणा सीमाएं हैं, लेकिन यह नई अनुसंधान दिशाएं खोलता है और महत्वपूर्ण सैद्धांतिक मूल्य और व्यावहारिक महत्व रखता है।