A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition
Hwang, Ahmadi
The ability to generate and recognize sequential data is fundamental for autonomous systems operating in dynamic environments. Inspired by the key principles of the brain-predictive coding and the Bayesian brain-we propose a novel stochastic Recurrent Neural Network with Parametric Biases (RNNPB). The proposed model incorporates stochasticity into the latent space using the reparameterization trick used in variational autoencoders. This approach enables the model to learn probabilistic representations of multidimensional sequences, capturing uncertainty and enhancing robustness against overfitting. We tested the proposed model on a robotic motion dataset to assess its performance in generating and recognizing temporal patterns. The experimental results showed that the stochastic RNNPB model outperformed its deterministic counterpart in generating and recognizing motion sequences. The results highlighted the proposed model's capability to quantify and adjust uncertainty during both learning and inference. The stochasticity resulted in a continuous latent space representation, facilitating stable motion generation and enhanced generalization when recognizing novel sequences. Our approach provides a biologically inspired framework for modeling temporal patterns and advances the development of robust and adaptable systems in artificial intelligence and robotics.
academic
إطار عمل جديد لتعلم التمثيلات العشوائية لتوليد وتعرف التسلسلات
تقترح هذه الورقة إطار عمل جديد لشبكة عصبية متكررة عشوائية مع انحياز معاملات (stochastic RNNPB) لتوليد وتعرف التسلسلات. يستلهم النموذج من الترميز التنبؤي في الدماغ وفرضية الدماغ البايزي، ويدخل العشوائية في الفضاء الكامن من خلال تقنية إعادة المعاملات في أجهزة التشفير التلقائي المتغيرة. تُظهر النتائج التجريبية أن نموذج RNNPB العشوائي يتفوق بشكل كبير على النماذج الحتمية في مهام توليد وتعرف تسلسلات حركة الروبوت، ويمكنه تحديد وتعديل عدم اليقين في عمليات التعلم والاستدلال، وتشكيل تمثيلات فضاء كامن مستمرة، وتعزيز توليد حركة مستقر وتحسين القدرة على التعميم.
يعتبر توليد وتعرف بيانات التسلسل قدرات أساسية للأنظمة المستقلة في البيئات الديناميكية. تواجه النماذج الحتمية الحالية قيوداً في التعامل مع عدم اليقين والقدرة على التعميم.
الإلهام البيولوجي: يعالج الدماغ المعلومات الحسية من خلال الترميز التنبؤي والاستدلال البايزي، ويولد التنبؤات بشكل مستمر ويحدث المعتقدات من خلال تقليل خطأ التنبؤ
الاحتياجات العملية: تحتاج أنظمة الروبوت إلى نمذجة تسلسل قوية في بيئات بيانات مزعجة وغير كاملة
التحديات التقنية: تميل النماذج الحتمية التقليدية إلى الإفراط في التدريب وتواجه صعوبة في التقاط عدم اليقين الكامن في البيانات
حيث μ^(i) و σ^(i) هما المتوسط والانحراف المعياري للتسلسل i على التوالي، و ε هو متجه عشوائي موزع بشكل طبيعي معياري.
2. دالة الهدف التدريبي
L(θ,μ,σ) = L_rec + β × L_KLD
L_rec: خسارة إعادة البناء (MSE)
L_KLD: حد تنظيم تباعد كولباك-لايبلر
β: معامل المقايضة بين دقة إعادة البناء وتنظيم الفضاء الكامن
3. توليد التسلسل
يولد النموذج التسلسل بطريقة الانحدار الذاتي، حيث يتم أخذ عينة من PB عند t=0، وتبقى PB ثابتة في خطوات زمنية لاحقة لضمان الاتساق على مستوى التسلسل.
4. تعرف التسلسل
يتم التعرف من خلال تقليل خطأ التنبؤ (PEM)، مع تحسين معاملات μ و σ بشكل تكراري:
نمذجة عدم اليقين على مستوى التسلسل: إدخال العشوائية في طبقة انحياز المعاملات، وهو أكثر كفاءة حسابياً مقارنة بنمذجة عدم اليقين في الأوزان أو الوحدات المخفية أو طبقة الإخراج
تقدير لاحق تكراري: على عكس تقدير VAE الأمامي، يستخدم طريقة التحسين التكرارية لتقليل خطأ التنبؤ
آلية التحديث المبكر: تحديث مباشر لقيمة μ عندما تنخفض خسارة إعادة البناء تحت عتبة معينة، مما يسرع التقارب
خصائص نظام الخلايا العصبية المرآة: مشاركة التمثيلات العصبية الداخلية في عمليات التوليد والتعرف
تنخفض خسارة إعادة البناء للنموذج العشوائي مع تناقص β في إعدادات مختلفة، مما يشير إلى أن الأولوية الأقوى تؤدي إلى انخفاض دقة إعادة البناء. يُظهر النموذج الحتمي اتجاهاً للإفراط في التدريب مع زيادة بُعد PB، بينما يتجنب النموذج العشوائي هذه المشكلة.
مع تناقص β، تصبح دالة الكثافة الاحتمالية لـ PB أكثر حدة، مما يشير إلى أن النموذج يتعلم تباينًا أقل لكل تسلسل. تُظهر التسلسلات المختلفة مستويات تباين مختلفة، مما يعكس قدرة النموذج على التقاط عدم اليقين الخاص بالتسلسل.
يُظهر تحليل الارتباط أن النموذج العشوائي يطور فضاءً كامناً أكثر سلاسة، بينما يكون النموذج الحتمي حساساً للاضطرابات الطفيفة، مما يعرض منظراً كامناً وعراً.
يستكشف النموذج العشوائي نطاقاً أوسع من الفضاء الكامن أثناء عملية التعرف، وتُظهر التجارب المختلفة مسارات تحسين مختلفة. يُظهر النموذج الحتمي مسارات ضيقة متطابقة، مما يشير إلى اعتماد قوي على التهيئة.
تستشهد الورقة بـ 44 مرجعاً ذا صلة، تغطي مجالات بحثية متعددة مثل الترميز التنبؤي والدماغ البايزي والاستدلال المتغير ونمذجة التسلسل، مما يوفر أساساً نظرياً قوياً ودعماً تقنياً لهذا البحث.