A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition
Hwang, Ahmadi
The ability to generate and recognize sequential data is fundamental for autonomous systems operating in dynamic environments. Inspired by the key principles of the brain-predictive coding and the Bayesian brain-we propose a novel stochastic Recurrent Neural Network with Parametric Biases (RNNPB). The proposed model incorporates stochasticity into the latent space using the reparameterization trick used in variational autoencoders. This approach enables the model to learn probabilistic representations of multidimensional sequences, capturing uncertainty and enhancing robustness against overfitting. We tested the proposed model on a robotic motion dataset to assess its performance in generating and recognizing temporal patterns. The experimental results showed that the stochastic RNNPB model outperformed its deterministic counterpart in generating and recognizing motion sequences. The results highlighted the proposed model's capability to quantify and adjust uncertainty during both learning and inference. The stochasticity resulted in a continuous latent space representation, facilitating stable motion generation and enhanced generalization when recognizing novel sequences. Our approach provides a biologically inspired framework for modeling temporal patterns and advances the development of robust and adaptable systems in artificial intelligence and robotics.
academic
Un Cadre Novateur pour l'Apprentissage de Représentations Stochastiques pour la Génération et la Reconnaissance de Séquences
Cet article propose un cadre novateur de réseau de neurones récurrents stochastiques avec biais paramétrique (stochastic RNNPB) pour la génération et la reconnaissance de séquences. Le modèle s'inspire du codage prédictif cérébral et de l'hypothèse du cerveau bayésien, en introduisant la stochasticité dans l'espace latent par le biais de la technique de reparamétrage des autoencodeurs variationnels. Les résultats expérimentaux démontrent que le modèle stochastic RNNPB surpasse significativement les modèles déterministes dans les tâches de génération et de reconnaissance de séquences de mouvements robotiques, permettant de quantifier et d'ajuster l'incertitude lors de l'apprentissage et de l'inférence, formant des représentations d'espace latent continu qui favorisent une génération de mouvements stable et améliorent les capacités de généralisation.
La génération et la reconnaissance de données séquentielles constituent des capacités fondamentales pour les systèmes autonomes opérant dans des environnements dynamiques. Les modèles déterministes existants présentent des limitations dans le traitement de l'incertitude et les capacités de généralisation.
Inspiration biologique: Le cerveau traite les informations perceptuelles par codage prédictif et inférence bayésienne, générant continuellement des prédictions et mettant à jour les croyances en minimisant l'erreur de prédiction
Besoins pratiques: Les systèmes robotiques nécessitent une modélisation robuste de séquences dans des environnements bruyants et avec données incomplètes
Défis techniques: Les modèles déterministes traditionnels sont sujets au surapprentissage et ont du mal à capturer l'incertitude inhérente aux données
Modèle RNNPB: Bien qu'il permette la génération et la reconnaissance de séquences, il opère sur des estimations ponctuelles et ne peut pas modéliser l'incertitude de la distribution des données
Modèle VAE: Principalement utilisé pour les tâches de génération, l'estimation a posteriori est réalisée par calcul avant, manquant de mécanisme de raisonnement itératif
Modèles déterministes: Plus sujets au surapprentissage, incapables de traiter efficacement la variabilité complète des données
Proposition d'un modèle stochastic RNNPB novateur: Intégration de RNNPB et VAE, introduction de stochasticité dans les biais paramétriques par technique de reparamétrage
Réalisation d'une inférence bayésienne approximée: Le modèle peut traiter l'incertitude, similaire aux fonctions centrales du cerveau
Validation de l'amélioration des performances: Démonstration sur des ensembles de données de mouvements robotiques que le modèle stochastique surpasse le modèle déterministe dans les tâches de génération et de reconnaissance
Établissement de connexions biologiques: Alignement du modèle d'apprentissage automatique avec les cadres théoriques du codage prédictif et du cerveau bayésien
où μ^(i) et σ^(i) sont respectivement la moyenne et l'écart-type de la séquence i, et ε est un vecteur aléatoire de distribution normale standard.
2. Fonction Objectif d'Entraînement
L(θ,μ,σ) = L_rec + β × L_KLD
L_rec: Perte de reconstruction (MSE)
L_KLD: Terme de régularisation de divergence KL
β: Hyperparamètre équilibrant la précision de reconstruction et la régularisation de l'espace latent
3. Génération de Séquences
Le modèle génère des séquences de manière autorégressive, échantillonnant PB à t=0, maintenant PB constant aux pas de temps suivants pour assurer la cohérence au niveau des séquences.
4. Reconnaissance de Séquences
Reconnaissance par minimisation d'erreur de prédiction (PEM), optimisation itérative des paramètres μ et σ:
Modélisation de l'incertitude au niveau des séquences: Introduction de stochasticité dans la couche de biais paramétrique, plus efficace en termes de calcul que la modélisation de l'incertitude au niveau des poids, des unités cachées ou de la couche de sortie
Estimation a posteriori itérative: Contrairement à l'estimation a posteriori avant de VAE, utilisation d'une méthode d'optimisation itérative par minimisation d'erreur de prédiction
Mécanisme de mise à jour précoce: Mise à jour directe de la valeur μ lorsque la perte de reconstruction est inférieure à un seuil, accélérant la convergence
Caractéristiques du système de neurones miroir: Partage de représentations neurales internes lors des processus de génération et de reconnaissance
La perte de reconstruction du modèle stochastique diminue avec la réduction de β selon différents paramètres β, indiquant que des priors plus forts entraînent une diminution de la précision de reconstruction. Le modèle déterministe présente une tendance au surapprentissage avec l'augmentation de la dimension PB, tandis que le modèle stochastique évite ce problème.
Avec la réduction de β, la fonction de densité probabiliste de PB devient plus pointue, indiquant que le modèle apprend une variance plus faible pour chaque séquence. Différentes séquences présentent différents niveaux de variance, reflétant la capacité du modèle à capturer l'incertitude spécifique aux séquences.
L'analyse de corrélation montre que le modèle stochastique développe un espace latent plus lisse, tandis que le modèle déterministe est sensible aux petites perturbations, présentant un paysage d'espace latent accidenté.
Le modèle stochastique explore une plage plus large d'espace latent lors du processus de reconnaissance, différents essais présentant différents chemins d'optimisation. Le modèle déterministe affiche la même trajectoire étroite, indiquant une forte dépendance à l'initialisation.
Avantages de la stochasticité: L'introduction de stochasticité améliore significativement les performances de génération et de reconnaissance de séquences
Espace latent lisse: Le modèle stochastique apprend des représentations plus continues et stables
Quantification de l'incertitude: Le modèle peut efficacement quantifier et ajuster l'incertitude des croyances internes
Rationalité biologique: Hautement cohérent avec les théories du codage prédictif et du cerveau bayésien
L'article cite 44 références connexes, couvrant plusieurs domaines de recherche importants incluant codage prédictif, cerveau bayésien, inférence variationnelle, modélisation de séquences, etc., fournissant une base théorique et un soutien technique solides pour cette recherche.