A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition
Hwang, Ahmadi
The ability to generate and recognize sequential data is fundamental for autonomous systems operating in dynamic environments. Inspired by the key principles of the brain-predictive coding and the Bayesian brain-we propose a novel stochastic Recurrent Neural Network with Parametric Biases (RNNPB). The proposed model incorporates stochasticity into the latent space using the reparameterization trick used in variational autoencoders. This approach enables the model to learn probabilistic representations of multidimensional sequences, capturing uncertainty and enhancing robustness against overfitting. We tested the proposed model on a robotic motion dataset to assess its performance in generating and recognizing temporal patterns. The experimental results showed that the stochastic RNNPB model outperformed its deterministic counterpart in generating and recognizing motion sequences. The results highlighted the proposed model's capability to quantify and adjust uncertainty during both learning and inference. The stochasticity resulted in a continuous latent space representation, facilitating stable motion generation and enhanced generalization when recognizing novel sequences. Our approach provides a biologically inspired framework for modeling temporal patterns and advances the development of robust and adaptable systems in artificial intelligence and robotics.
academic
अनुक्रम पीढ़ी और पहचान के लिए स्टोकेस्टिक प्रतिनिधित्व सीखने के लिए एक नवीन ढांचा
यह पेपर अनुक्रम पीढ़ी और पहचान के लिए एक नवीन स्टोकेस्टिक आवर्तक तंत्रिका नेटवर्क पैरामीटर पूर्वाग्रह (stochastic RNNPB) ढांचा प्रस्तावित करता है। यह मॉडल मस्तिष्क की भविष्यसूचक कोडिंग और बेयेसियन मस्तिष्क परिकल्पना से प्रेरित है, जो परिवर्तनशील ऑटोएनकोडर के पुनः-पैरामीटराइजेशन तकनीक के माध्यम से अव्यक्त स्थान में स्टोकेस्टिकिटी प्रस्तुत करता है। प्रायोगिक परिणाम दर्शाते हैं कि स्टोकेस्टिक RNNPB मॉडल रोबोटिक गति अनुक्रमों की पीढ़ी और पहचान कार्यों में नियतात्मक मॉडल से काफी बेहतर है, जो सीखने और अनुमान प्रक्रिया में अनिश्चितता को मापने और समायोजित करने में सक्षम है, निरंतर अव्यक्त स्थान प्रतिनिधित्व बनाता है, स्थिर गति पीढ़ी को बढ़ावा देता है और सामान्यीकरण क्षमता को बढ़ाता है।
अनुक्रम डेटा की पीढ़ी और पहचान स्वायत्त प्रणालियों की गतिशील वातावरण में संचालन की मौलिक क्षमता है। मौजूदा नियतात्मक मॉडल अनिश्चितता और सामान्यीकरण क्षमता को संभालने में सीमाएं हैं।
जैविक प्रेरणा: मस्तिष्क भविष्यसूचक कोडिंग और बेयेसियन अनुमान के माध्यम से संवेदी जानकारी को संसाधित करता है, लगातार भविष्यवाणियां उत्पन्न करता है और भविष्यवाणी त्रुटि को कम करके विश्वास को अपडेट करता है
व्यावहारिक आवश्यकता: रोबोटिक प्रणालियों को शोर और अधूरे डेटा वातावरण में मजबूत अनुक्रम मॉडलिंग की आवश्यकता है
तकनीकी चुनौती: पारंपरिक नियतात्मक मॉडल अत्यधिक फिटिंग के लिए प्रवण हैं, डेटा की आंतरिक अनिश्चितता को पकड़ना मुश्किल है
RNNPB मॉडल: हालांकि अनुक्रम पीढ़ी और पहचान कर सकता है, लेकिन विशिष्ट बिंदु अनुमान पर संचालित होता है, डेटा वितरण की अनिश्चितता को मॉडल नहीं कर सकता
VAE मॉडल: मुख्य रूप से पीढ़ी कार्यों के लिए उपयोग किया जाता है, पश्च अनुमान फीडफॉरवर्ड गणना के माध्यम से प्राप्त होता है, पुनरावृत्त अनुमान तंत्र की कमी है
नियतात्मक मॉडल: अधिक आसानी से अत्यधिक फिटिंग के लिए प्रवण, डेटा की पूर्ण परिवर्तनशीलता को प्रभावी ढंग से संभाल नहीं सकते
नवीन स्टोकेस्टिक RNNPB मॉडल प्रस्तावित करना: RNNPB और VAE को एकीकृत करना, पुनः-पैरामीटराइजेशन तकनीक के माध्यम से पैरामीटर पूर्वाग्रह में स्टोकेस्टिकिटी प्रस्तुत करना
अनुमानित बेयेसियन अनुमान को लागू करना: मॉडल अनिश्चितता को संभाल सकता है, मस्तिष्क की मूल कार्यक्षमता के समान
प्रदर्शन वृद्धि को सत्यापित करना: रोबोटिक गति डेटासेट पर स्टोकेस्टिक मॉडल को नियतात्मक मॉडल से बेहतर साबित करना
जैविक संबंध स्थापित करना: मशीन लर्निंग मॉडल को भविष्यसूचक कोडिंग, बेयेसियन मस्तिष्क सिद्धांत ढांचे के साथ संरेखित करना
जहां μ^(i) और σ^(i) क्रमशः अनुक्रम i के माध्य और मानक विचलन हैं, ε मानक सामान्य वितरण यादृच्छिक वेक्टर है।
2. प्रशिक्षण उद्देश्य फ़ंक्शन
L(θ,μ,σ) = L_rec + β × L_KLD
L_rec: पुनर्निर्माण हानि (MSE)
L_KLD: KL विचलन नियमितकरण पद
β: पुनर्निर्माण सटीकता और अव्यक्त स्थान नियमितकरण को संतुलित करने वाला हाइपरपैरामीटर
3. अनुक्रम पीढ़ी
मॉडल स्वप्रतिगामी तरीके से अनुक्रम उत्पन्न करता है, t=0 पर PB का नमूना लेता है, बाद के समय चरणों में अनुक्रम-स्तर की स्थिरता सुनिश्चित करने के लिए PB को अपरिवर्तित रखता है।
4. अनुक्रम पहचान
भविष्यवाणी त्रुटि न्यूनीकरण (PEM) के माध्यम से पहचान, μ और σ पैरामीटर को पुनरावृत्त रूप से अनुकूलित करना:
अनुक्रम-स्तर अनिश्चितता मॉडलिंग: पैरामीटर पूर्वाग्रह परत में स्टोकेस्टिकिटी प्रस्तुत करना, वजन, छिपी इकाइयों या आउटपुट परत में अनिश्चितता मॉडलिंग की तुलना में अधिक कम्प्यूटेशनल रूप से कुशल
पुनरावृत्त पश्च अनुमान: VAE के फीडफॉरवर्ड पश्च अनुमान के विपरीत, भविष्यवाणी त्रुटि न्यूनीकरण की पुनरावृत्त अनुकूलन विधि को अपनाना
प्रारंभिक अपडेट तंत्र: जब पुनर्निर्माण हानि थ्रेसहोल्ड से नीचे हो तो सीधे μ मान को अपडेट करना, अभिसरण को तेज करना
दर्पण न्यूरॉन प्रणाली विशेषता: पीढ़ी और पहचान प्रक्रिया में आंतरिक तंत्रिका प्रतिनिधित्व साझा करना
स्टोकेस्टिक मॉडल विभिन्न β सेटिंग्स के तहत पुनर्निर्माण हानि β में कमी के साथ घटती है, यह दर्शाता है कि मजबूत पूर्व पुनर्निर्माण सटीकता में कमी की ओर जाता है। नियतात्मक मॉडल PB आयाम में वृद्धि के साथ अत्यधिक फिटिंग प्रवृत्ति दिखाता है, जबकि स्टोकेस्टिक मॉडल इस समस्या से बचता है।
β में कमी के साथ, PB की संभाव्य घनत्व फ़ंक्शन अधिक तीव्र हो जाती है, यह दर्शाता है कि मॉडल प्रत्येक अनुक्रम के लिए कम विचरण सीखता है। विभिन्न अनुक्रम विभिन्न विचरण स्तर प्रदर्शित करते हैं, मॉडल की अनुक्रम-विशिष्ट अनिश्चितता को पकड़ने की क्षमता को प्रतिबिंबित करता है।
सहसंबंध विश्लेषण दर्शाता है कि स्टोकेस्टिक मॉडल अधिक चिकनी अव्यक्त स्थान विकसित करता है, जबकि नियतात्मक मॉडल छोटे विक्षोभ के प्रति संवेदनशील है, एक कठोर अव्यक्त स्थान परिदृश्य प्रदर्शित करता है।
स्टोकेस्टिक मॉडल पहचान प्रक्रिया में अव्यक्त स्थान की व्यापक श्रेणी का अन्वेषण करता है, विभिन्न परीक्षण विभिन्न अनुकूलन पथ प्रदर्शित करते हैं। नियतात्मक मॉडल समान संकीर्ण प्रक्षेपवक्र दिखाता है, प्रारंभिकीकरण पर मजबूत निर्भरता को दर्शाता है।
पेपर 44 संबंधित संदर्भों का हवाला देता है, जो भविष्यसूचक कोडिंग, बेयेसियन मस्तिष्क, परिवर्तनशील अनुमान, अनुक्रम मॉडलिंग आदि कई अनुसंधान क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, इस अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार और तकनीकी समर्थन प्रदान करता है।