A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition
Hwang, Ahmadi
The ability to generate and recognize sequential data is fundamental for autonomous systems operating in dynamic environments. Inspired by the key principles of the brain-predictive coding and the Bayesian brain-we propose a novel stochastic Recurrent Neural Network with Parametric Biases (RNNPB). The proposed model incorporates stochasticity into the latent space using the reparameterization trick used in variational autoencoders. This approach enables the model to learn probabilistic representations of multidimensional sequences, capturing uncertainty and enhancing robustness against overfitting. We tested the proposed model on a robotic motion dataset to assess its performance in generating and recognizing temporal patterns. The experimental results showed that the stochastic RNNPB model outperformed its deterministic counterpart in generating and recognizing motion sequences. The results highlighted the proposed model's capability to quantify and adjust uncertainty during both learning and inference. The stochasticity resulted in a continuous latent space representation, facilitating stable motion generation and enhanced generalization when recognizing novel sequences. Our approach provides a biologically inspired framework for modeling temporal patterns and advances the development of robust and adaptable systems in artificial intelligence and robotics.
academic
Ein neuartiger Rahmen zum Erlernen stochastischer Darstellungen für Sequenzgenerierung und -erkennung
Dieses Papier präsentiert einen neuartigen Rahmen für stochastische rekurrente neuronale Netze mit Parameterverzerrung (stochastic RNNPB) zur Sequenzgenerierung und -erkennung. Das Modell wird durch prädiktive Kodierung im Gehirn und die Bayessche Gehirnhypothese inspiriert und führt Stochastizität durch die Reparametrisierungstechnik von Variationsautoencodern in den latenten Raum ein. Die experimentellen Ergebnisse zeigen, dass das stochastische RNNPB-Modell deterministische Modelle bei Aufgaben zur Generierung und Erkennung von Roboterbewegungssequenzen erheblich übertrifft und Unsicherheit während des Lernens und der Inferenz quantifizieren und anpassen kann, kontinuierliche latente Raumdarstellungen bildet und stabile Bewegungsgenerierung sowie verbesserte Verallgemeinerungsfähigkeit fördert.
Die Generierung und Erkennung von Sequenzdaten sind grundlegende Fähigkeiten für autonome Systeme, die in dynamischen Umgebungen operieren. Bestehende deterministische Modelle weisen Einschränkungen bei der Behandlung von Unsicherheit und Verallgemeinerungsfähigkeit auf.
Biologische Inspiration: Das Gehirn verarbeitet Wahrnehmungsinformationen durch prädiktive Kodierung und Bayessche Inferenz, generiert kontinuierlich Vorhersagen und aktualisiert Überzeugungen durch Minimierung von Vorhersagefehlern
Praktische Anforderungen: Robotersysteme benötigen robuste Sequenzmodellierung in Umgebungen mit Rauschen und unvollständigen Daten
Technische Herausforderungen: Traditionelle deterministische Modelle neigen zu Überanpassung und können die inhärente Unsicherheit von Daten schwer erfassen
RNNPB-Modell: Obwohl es Sequenzgenerierung und -erkennung durchführen kann, arbeitet es mit Punktschätzungen und kann die Unsicherheit der Datenverteilung nicht modellieren
VAE-Modell: Hauptsächlich für Generierungsaufgaben verwendet, die Posterior-Schätzung erfolgt durch Feedforward-Berechnung und es fehlt ein iterativer Inferenzmechanismus
Deterministische Modelle: Anfälliger für Überanpassung und können die vollständige Variabilität der Daten nicht effektiv verarbeiten
Vorschlag eines neuartigen stochastischen RNNPB-Modells: Integration von RNNPB und VAE, Einführung von Stochastizität in Parameterverzerrungen durch Reparametrisierungstechnik
Realisierung approximativer Bayesscher Inferenz: Das Modell kann Unsicherheit verarbeiten, ähnlich wie Kernfunktionen des Gehirns
Validierung von Leistungsverbesserungen: Nachweis der Überlegenheit des stochastischen Modells gegenüber dem deterministischen Modell bei Generierungs- und Erkennungsaufgaben auf Roboterbewegungsdatensätzen
Etablierung biologischer Verbindungen: Ausrichtung von Maschinenlernen-Modellen mit prädiktiver Kodierung und Bayesscher Gehirntheorie
Dabei sind μ^(i) und σ^(i) jeweils der Mittelwert und die Standardabweichung der Sequenz i, und ε ist ein standardnormaler Zufallsvektor.
2. Trainingsziel-Funktion
L(θ,μ,σ) = L_rec + β × L_KLD
L_rec: Rekonstruktionsverlust (MSE)
L_KLD: KL-Divergenz-Regularisierungsterm
β: Hyperparameter zur Gewichtung von Rekonstruktionsgenauigkeit und latenter Raumregularisierung
3. Sequenzgenerierung
Das Modell generiert Sequenzen auf autoregressive Weise, sampelt PB bei t=0 und behält PB in nachfolgenden Zeitschritten bei, um Konsistenz auf Sequenzebene zu gewährleisten.
4. Sequenzerkennung
Erkennung durch Vorhersagefehlerminimierung (PEM) mit iterativer Optimierung von μ und σ Parametern:
Sequenzebenen-Unsicherheitsmodellierung: Einführung von Stochastizität in der Parameterverzerrungsschicht ist rechnerisch effizienter als die Modellierung von Unsicherheit in Gewichten, verborgenen Einheiten oder Ausgabeschichten
Iterative Posterior-Schätzung: Im Gegensatz zur Feedforward-Posterior-Schätzung von VAE wird eine iterative Optimierungsmethode mit Vorhersagefehlerminimierung verwendet
Früher Aktualisierungsmechanismus: Direkte Aktualisierung des μ-Wertes, wenn der Rekonstruktionsverlust unter einen Schwellenwert fällt, beschleunigt die Konvergenz
Spiegelneuron-Systemmerkmale: Gemeinsame Nutzung interner neuronaler Darstellungen während Generierungs- und Erkennungsprozessen
Der Rekonstruktionsverlust des stochastischen Modells bei verschiedenen β-Einstellungen nimmt mit sinkendem β ab, was zeigt, dass stärkere Priors zu geringerer Rekonstruktionsgenauigkeit führen. Das deterministische Modell zeigt Überanpassungstrends mit zunehmender PB-Dimension, während das stochastische Modell dieses Problem vermeidet.
Mit sinkendem β wird die Wahrscheinlichkeitsdichtefunktion der PB spitzer, was zeigt, dass das Modell für jede Sequenz eine niedrigere Varianz erlernt. Verschiedene Sequenzen zeigen unterschiedliche Varianzebenen und demonstrieren die Fähigkeit des Modells, sequenzspezifische Unsicherheit zu erfassen.
Die Korrelationsanalyse zeigt, dass das stochastische Modell einen glattereren latenten Raum entwickelt, während das deterministische Modell empfindlich auf kleine Störungen reagiert und eine raue Landschaft des latenten Raums aufweist.
Das stochastische Modell erforscht während des Erkennungsprozesses einen breiteren Bereich des latenten Raums, verschiedene Versuche zeigen unterschiedliche Optimierungspfade. Das deterministische Modell zeigt die gleiche enge Trajektorie, was auf starke Abhängigkeit von der Initialisierung hindeutet.
Das Papier zitiert 44 relevante Arbeiten, die wichtige Arbeiten in mehreren Forschungsbereichen wie prädiktive Kodierung, Bayessche Gehirnhypothese, Variationsinferenz und Sequenzmodellierung abdecken und eine solide theoretische Grundlage und technische Unterstützung für diese Forschung bieten.