A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition
Hwang, Ahmadi
The ability to generate and recognize sequential data is fundamental for autonomous systems operating in dynamic environments. Inspired by the key principles of the brain-predictive coding and the Bayesian brain-we propose a novel stochastic Recurrent Neural Network with Parametric Biases (RNNPB). The proposed model incorporates stochasticity into the latent space using the reparameterization trick used in variational autoencoders. This approach enables the model to learn probabilistic representations of multidimensional sequences, capturing uncertainty and enhancing robustness against overfitting. We tested the proposed model on a robotic motion dataset to assess its performance in generating and recognizing temporal patterns. The experimental results showed that the stochastic RNNPB model outperformed its deterministic counterpart in generating and recognizing motion sequences. The results highlighted the proposed model's capability to quantify and adjust uncertainty during both learning and inference. The stochasticity resulted in a continuous latent space representation, facilitating stable motion generation and enhanced generalization when recognizing novel sequences. Our approach provides a biologically inspired framework for modeling temporal patterns and advances the development of robust and adaptable systems in artificial intelligence and robotics.
academic
Новая структура для обучения стохастическим представлениям для генерации и распознавания последовательностей
В данной работе предложена новая структура стохастической рекуррентной нейронной сети с параметрическим смещением (stochastic RNNPB) для генерации и распознавания последовательностей. Модель вдохновлена предсказательным кодированием мозга и байесовской гипотезой мозга, внедряя стохастичность в скрытое пространство посредством техники переспециализации вариационного автокодировщика. Экспериментальные результаты демонстрируют, что стохастическая модель RNNPB значительно превосходит детерминированные модели в задачах генерации и распознавания последовательностей движений робота, позволяя количественно оценивать и регулировать неопределённость в процессах обучения и вывода, формируя непрерывные представления скрытого пространства, способствующие стабильной генерации движений и улучшенной способности к обобщению.
Генерация и распознавание данных последовательностей являются фундаментальными способностями автономных систем при работе в динамических окружениях. Существующие детерминированные модели имеют ограничения при обработке неопределённости и способности к обобщению.
Биологическое вдохновение: Мозг обрабатывает сенсорную информацию посредством предсказательного кодирования и байесовского вывода, постоянно генерируя предсказания и обновляя убеждения путём минимизации ошибки предсказания
Практические требования: Робототехнические системы требуют надёжного моделирования последовательностей в условиях шума и неполных данных
Технические вызовы: Традиционные детерминированные модели подвержены переобучению и испытывают трудности при захвате внутренней неопределённости данных
Модель RNNPB: Хотя способна к генерации и распознаванию последовательностей, работает на точечных оценках, не моделируя неопределённость распределения данных
Модель VAE: Главным образом используется для задач генерации, апостериорная оценка реализуется посредством прямого вычисления, отсутствует механизм итеративного вывода
Детерминированные модели: Более подвержены переобучению, неэффективно обрабатывают полную вариативность данных
Предложена новая стохастическая модель RNNPB: Интегрирует RNNPB и VAE, внедряя стохастичность в параметрическое смещение посредством техники переспециализации
Реализован приблизительный байесовский вывод: Модель способна обрабатывать неопределённость, подобно основным функциям мозга
Подтверждено повышение производительности: На наборах данных движений робота доказано превосходство стохастической модели над детерминированной в задачах генерации и распознавания
Установлена биологическая связь: Выравнены модели машинного обучения с предсказательным кодированием и теоретической структурой байесовского мозга
где μ^(i) и σ^(i) — соответственно среднее значение и стандартное отклонение для последовательности i, ε — вектор случайных величин из стандартного нормального распределения.
2. Целевая функция обучения
L(θ,μ,σ) = L_rec + β × L_KLD
L_rec: потеря реконструкции (MSE)
L_KLD: член регуляризации расхождения Кульбака-Лейблера
β: гиперпараметр, балансирующий точность реконструкции и регуляризацию скрытого пространства
3. Генерация последовательностей
Модель генерирует последовательности в авторегрессивном режиме, производя выборку PB при t=0, сохраняя PB неизменным на последующих временных шагах для обеспечения согласованности на уровне последовательности.
4. Распознавание последовательностей
Распознавание осуществляется посредством минимизации ошибки предсказания (PEM) с итеративной оптимизацией параметров μ и σ:
Моделирование неопределённости на уровне последовательности: Внедрение стохастичности в слой параметрического смещения более вычислительно эффективно по сравнению с моделированием неопределённости в весах, скрытых единицах или выходном слое
Итеративная апостериорная оценка: В отличие от прямой апостериорной оценки VAE, используется итеративный метод оптимизации минимизации ошибки предсказания
Механизм раннего обновления: Прямое обновление значения μ при снижении потери реконструкции ниже порога, ускоряя сходимость
Характеристики зеркальной нейронной системы: Общее использование внутренних нейронных представлений в процессах генерации и распознавания
Потеря реконструкции стохастической модели при различных установках β снижается с уменьшением β, указывая на то, что более сильный априор приводит к снижению точности реконструкции. Детерминированная модель демонстрирует тенденцию переобучения с увеличением размерности PB, в то время как стохастическая модель избегает этой проблемы.
С уменьшением β функция вероятностной плотности PB становится более острой, указывая на то, что модель обучается более низкой дисперсии для каждой последовательности. Различные последовательности демонстрируют различные уровни дисперсии, отражая способность модели захватывать специфичную для последовательности неопределённость.
Анализ корреляции показывает, что стохастическая модель развивает более гладкое скрытое пространство, в то время как детерминированная модель чувствительна к малым возмущениям, демонстрируя неровный ландшафт скрытого пространства.
Стохастическая модель исследует более широкий диапазон скрытого пространства в процессе распознавания, различные испытания демонстрируют различные пути оптимизации. Детерминированная модель показывает одинаковые узкие траектории, указывая на сильную зависимость от инициализации.
Статья цитирует 44 связанные работы, охватывающие важные работы в нескольких областях исследований, включая предсказательное кодирование, байесовский мозг, вариационный вывод и моделирование последовательностей, предоставляя прочную теоретическую базу и техническую поддержку для данного исследования.