Thought Flow Nets: From Single Predictions to Trains of Model Thought
Schuff, Adel, Vu
When humans solve complex problems, they typically create a sequence of ideas (involving an intuitive decision, reflection, error correction, etc.) in order to reach a conclusive decision. Contrary to this, today's models are mostly trained to map an input to one single and fixed output. In this paper, we investigate how we can give models the opportunity of a second, third and $k$-th thought. Taking inspiration from Hegel's dialectics, we propose the concept of a thought flow which creates a sequence of predictions. We present a self-correction mechanism that is trained to estimate the model's correctness and performs iterative prediction updates based on the correctness prediction's gradient. We introduce our method at the example of question answering and conduct extensive experiments that demonstrate (i) our method's ability to correct its own predictions and (ii) its potential to notably improve model performances. In addition, we conduct a qualitative analysis of thought flow correction patterns and explore how thought flow predictions affect human users within a crowdsourcing study. We find that (iii) thought flows enable improved user performance and are perceived as more natural, correct, and intelligent as single and/or top-3 predictions.
academic
Сети потоков мысли: от единичных предсказаний к цепочкам мышления модели
При решении сложных задач люди обычно создают серию идей (включая интуитивные решения, размышления, исправление ошибок и т.д.) для достижения окончательного решения. Напротив, современные модели в основном обучаются отображать входные данные в единый фиксированный выход. В данной работе исследуется, как предоставить модели возможность второго, третьего и k-го размышления. Вдохновляясь гегелевской диалектикой, авторы предлагают концепцию «потока мысли» для создания последовательности предсказаний. Статья представляет механизм самокоррекции, который обучается оценивать корректность модели и выполняет итеративное обновление предсказаний на основе градиентов предсказания корректности.
Традиционные модели машинного обучения используют одношаговый режим предсказания (x → ŷ), то есть прямое отображение входных данных в фиксированный выход, что лишает их способности к рефлексии и самокоррекции, присущей человеческому мышлению. Это создает ограничения при работе со сложными задачами (такими как вопросно-ответные системы и многошаговое логическое вывод).
Вдохновение когнитивной наукой: люди решают задачи через сложный процесс мышления, включающий начальное суждение, размышление, сравнение гипотез и разрешение противоречий
Философское теоретическое основание: три этапа гегелевской диалектики предоставляют теоретическую основу для итеративного улучшения в машинном обучении
Практические потребности: с увеличением сложности задач обучение итеративной самокоррекции может быть проще, чем прямое попадание в правильное предсказание
Одношаговое предсказание не может обрабатывать несколько этапов сложных задач логического вывода
Отсутствуют механизмы самоанализа и исправления ошибок
В задачах с большим пространством выходов (например, модели QA могут выдавать 16 миллионов возможных диапазонов) сложно прямо получить оптимальное решение
На примере извлекающей вопросно-ответной системы: при наличии вопроса и контекста с L токенами модель должна предсказать начальную и конечную позиции ответа. Традиционный метод выдает два распределения вероятностей: ŷ_start ∈ 0,1^L и ŷ_end ∈ 0,1^L.
Проблема остановки: требуется функция остановки oracle для достижения оптимальной производительности; в практических приложениях необходимо обучение определению времени остановки
Вычислительные затраты: итеративное обновление увеличивает время вывода и вычислительные затраты
Ограничения задач: метод в основном верифицирован на задачах вопросно-ответных систем; эффективность на других задачах требует проверки
Чувствительность к градиентам: требует Monte Carlo Dropout для стабилизации оценки градиентов
Статья ссылается на важные работы из нескольких областей, включая:
Философскую литературу по гегелевской диалектике
Исследования когнитивной науки и нейронауки
Методы оценки уверенности и коррекции моделей в машинном обучении
Работы по последовательному предсказанию и итеративной оптимизации
Общая оценка: Это статья с высокой степенью инновационности, которая успешно объединяет философскую теорию с современными технологиями машинного обучения, предлагая концепцию потока мысли с практической ценностью. Хотя в отношении механизма остановки еще есть место для совершенствования, её новаторский подход и убедительные экспериментальные результаты делают её значительным вкладом в данную область.