Active Learning of Deterministic Transducers with Outputs in Arbitrary Monoids
Aristote
We study monoidal transducers, transition systems arising as deterministic automata whose transitions also produce outputs in an arbitrary monoid, for instance allowing outputs to commute or to cancel out. We use the categorical framework for minimization and learning of Colcombet, PetriÅan and Stabile to recover the notion of minimal transducer recognizing a language, and give necessary and sufficient conditions on the output monoid for this minimal transducer to exist and be unique (up to isomorphism). The categorical framework then provides an abstract algorithm for learning it using membership and equivalence queries, and we discuss practical aspects of this algorithm's implementation.
academic
मनमाने मोनॉइड्स में आउटपुट के साथ नियतात्मक ट्रांसड्यूसर्स का सक्रिय शिक्षण
यह पेपर मोनॉइडल ट्रांसड्यूसर्स का अध्ययन करता है, जो नियतात्मक ऑटोमेटा की एक श्रेणी है जहां ट्रांसडक्शन प्रक्रिया मनमाने मोनॉइड्स में आउटपुट उत्पन्न करती है, उदाहरण के लिए आउटपुट विनिमेय या परस्पर निरस्त हो सकते हैं। लेखक Colcombet, Petrişan और Stabile के वर्गीकरण ढांचे का उपयोग करके भाषाओं को पहचानने वाले न्यूनतम ट्रांसड्यूसर की अवधारणा को पुनः प्राप्त करता है, और आउटपुट मोनॉइड पर आवश्यक और पर्याप्त शर्तें देता है ताकि ऐसे न्यूनतम ट्रांसड्यूसर्स मौजूद हों और अद्वितीय हों (समरूपता के अर्थ में)। यह वर्गीकरण ढांचा सदस्यता प्रश्नों और तुल्यता प्रश्नों का उपयोग करके न्यूनतम ट्रांसड्यूसर्स सीखने के लिए एक अमूर्त एल्गोरिथ्म प्रदान करता है, और इस एल्गोरिथ्म के कार्यान्वयन के व्यावहारिक पहलुओं पर चर्चा करता है।
पारंपरिक ट्रांसड्यूसर्स आमतौर पर मुक्त मोनॉइड्स (जैसे स्ट्रिंग्स) पर आउटपुट उत्पन्न करते हैं, लेकिन कुछ अनुप्रयोग परिदृश्यों में, आउटपुट को विनिमेयता या निरस्तता जैसे बीजगणितीय गुणों को संतुष्ट करने की आवश्यकता हो सकती है। उदाहरण के लिए:
समवर्ती सिद्धांत में ट्रेस मोनॉइड: स्वतंत्र कार्यों के निष्पादन अनुक्रमों को मॉडल करने के लिए उपयोग किया जाता है, जहां कुछ कार्य अतुल्यकालिक रूप से चल सकते हैं
प्रोग्राम शेड्यूलिंग: ट्रांसड्यूसर्स का उपयोग प्रोग्रामेटिक रूप से कार्यों को शेड्यूल करने के लिए किया जा सकता है
प्राकृतिक भाषा प्रसंस्करण: कुछ आउटपुट प्रतीकों में विनिमेय गुण हो सकते हैं
मौजूदा ट्रांसड्यूसर शिक्षण एल्गोरिथ्म (जैसे Vilar एल्गोरिथ्म) मुख्य रूप से मुक्त मोनॉइड्स के लिए डिज़ाइन किए गए हैं, और गैर-मुक्त मोनॉइड्स पर सीधे अनुप्रयोग निम्नलिखित समस्याओं का सामना करता है:
गैर-समाप्ति: जैसा कि Lemma 1.1 में दिखाया गया है, कुछ मोनॉइड्स पर Vilar एल्गोरिथ्म कभी समाप्त नहीं हो सकता है
दक्षता समस्या: पहले मुक्त मोनॉइड पर ट्रांसड्यूसर सीखना और फिर न्यूनतम करना अनावश्यक स्थितियों का परिचय देता है
सैद्धांतिक कमी: मनमाने मोनॉइड्स को संभालने के लिए व्यवस्थित सैद्धांतिक ढांचे की कमी
सैद्धांतिक ढांचे का विस्तार: Colcombet-Petrişan-Stabile के वर्गीकरण शिक्षण ढांचे को मोनॉइडल ट्रांसड्यूसर्स तक विस्तारित करना
अस्तित्व की शर्तें: आउटपुट मोनॉइड के लिए आवश्यक और पर्याप्त शर्तें देना, जो सुनिश्चित करती हैं कि न्यूनतम मोनॉइडल ट्रांसड्यूसर मौजूद हैं और अद्वितीय हैं
शर्तों का अनुकूलन: Gerdjikov की न्यूनतमकरण शर्तों की श्रेणी को विस्तारित करना, हालांकि जटिलता सीमाएं संभवतः अधिक खराब हो सकती हैं
व्यावहारिक एल्गोरिथ्म: अमूर्त मोनॉइडल ट्रांसड्यूसर शिक्षण एल्गोरिथ्म के ठोस कार्यान्वयन विवरण प्रदान करना
अपघटन प्रणाली: चतुर्थांश अपघटन प्रणाली के माध्यम से शिक्षण एल्गोरिथ्म में विभिन्न प्रकार की सुसंगतता समस्याओं की व्याख्या करना
मुख्य रूप से (E₃,M₃) का उपयोग न्यूनतम ट्रांसड्यूसर को परिभाषित करने के लिए किया जाता है, जो मुक्त मोनॉइड स्थिति में अपघटन प्रणाली को सामान्यीकृत करता है।
इनपुट: EvalL, EquivL
आउटपुट: न्यूनतम ट्रांसड्यूसर MinL
1. Q = T = {ε} को आरंभ करें
2. अभिसरण तक लूप करें:
- बंद होने की शर्त जांचें: क्या कोई qa ∈ QA मौजूद है जैसे कि R(q,a,·) को पहले से मौजूद स्थितियों के अपरिवर्तनीय गुणक के रूप में प्रदर्शित नहीं किया जा सकता है
- सुसंगतता शर्तें जांचें: तीन प्रकार की सुसंगतता समस्याओं की जांच करें
- परिकल्पना ट्रांसड्यूसर H(Q,T) का निर्माण करें
- तुल्यता प्रश्न प्रस्तुत करें, प्रतिउदाहरणों को संभालें
पेपर औपचारिक भाषा सिद्धांत, वर्गीकरण सिद्धांत, मोनॉइड सिद्धांत आदि कई क्षेत्रों के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:
Angluin (1987): Learning regular sets from queries and counterexamples
Colcombet, Petrişan, Stabile (2020-2021): वर्गीकरण शिक्षण ढांचे के मूल पेपर
Gerdjikov (2018): मोनॉइडल ट्रांसड्यूसर न्यूनतमकरण पर महत्वपूर्ण कार्य
Mac Lane (1978): Categories for the Working Mathematician
समग्र मूल्यांकन: यह एक उच्च गुणवत्ता का सैद्धांतिक पेपर है जो महत्वपूर्ण वर्गीकरण शिक्षण ढांचे को अधिक सामान्य मोनॉइडल ट्रांसड्यूसर सेटिंग तक सफलतापूर्वक विस्तारित करता है। हालांकि प्रायोगिक सत्यापन की कमी है, लेकिन सैद्धांतिक योगदान महत्वपूर्ण है और संबंधित क्षेत्रों के आगे विकास के लिए एक मजबूत आधार प्रदान करता है। पेपर की गणितीय कठोरता और विधि नवाचार दोनों ही प्रशंसनीय हैं।