2025-11-13T22:43:11.349904

Bayes or Heisenberg: Who(se) Rules?

Li, Harjes, Ma
Although quantum systems are generally described by quantum state vectors, we show that in certain cases their measurement processes can be reformulated as probabilistic equations expressed in terms of probabilistic state vectors. These probabilistic representations can, in turn, be approximated by the neural network dynamics of the Tensor Brain (TB) model. The Tensor Brain is a recently proposed framework for modeling perception and memory in the brain, providing a biologically inspired mechanism for efficiently integrating generated symbolic representations into reasoning processes.
academic

Байес или Гейзенберг: Чьи правила?

Основная информация

  • ID статьи: 2510.13894
  • Название: Bayes or Heisenberg: Who(se) Rules?
  • Авторы: Volker Tresp, Hang Li, Federico Harjes, Yunpu Ma
  • Учреждение: LMU Munich
  • Классификация: q-bio.NC (Нейроны и познание), cs.AI, cs.LG, quant-ph
  • Дата публикации: 17 октября 2025
  • Ссылка на статью: https://arxiv.org/abs/2510.13894

Аннотация

В данной работе доказано, что процесс измерения в квантовых системах при определённых условиях может быть переформулирован как вероятностные уравнения на основе вероятностных векторов состояния. Эти вероятностные представления могут быть аппроксимированы нейросетевой динамикой модели Tensor Brain (TB). Tensor Brain — это фреймворк для моделирования восприятия и памяти мозга, предоставляющий биологически вдохновленный механизм для эффективной интеграции генерируемых символических представлений в процесс рассуждения.

Исследовательский контекст и мотивация

Основная проблема

Данное исследование пытается ответить на фундаментальный вопрос: как работает обработка информации в мозге? Как возникают восприятие и память? Следует ли рассмотреть совершенно новые подходы к моделированию и рассуждению в AI?

Исследовательская мотивация

  1. Потребность в междисциплинарной интеграции: объединение квантовой теории, байесовского вывода и нейронных сетей для предоставления единого фреймворка обработки информации в мозге
  2. Проблема вычислительной сложности: традиционный байесовский вывод имеет чрезмерно высокую вычислительную сложность в практических приложениях, требуя поиска более эффективных альтернатив
  3. Биологическая обоснованность: существующая гипотеза байесовского мозга сталкивается с критикой за биологическую неправдоподобность, требуя моделей, более соответствующих биологическим механизмам

Ограничения существующих подходов

  • Гипотеза байесовского мозга: хотя теоретически элегантна, точный байесовский вывод вычислительно неосуществим и обычно требует вариационных аппроксимаций
  • Теория квантового мозга: сталкивается с серьёзной критикой, поскольку время квантовой когерентности в мозге чрезвычайно короткое и не может поддерживать значимые квантовые вычисления
  • Чистые нейросетевые подходы: лишены теоретической основы, затрудняя объяснение символического рассуждения и механизмов памяти

Основные вклады

  1. Вероятностная квантовая фреймворк: предложен метод переформулирования процесса квантового измерения как вероятностных уравнений с использованием вероятностных состояний вместо квантовых состояний
  2. Heisenberg-Bayes POVM (HB-POVM): введена новая схема измерения, сохраняющая информацию о состоянии и устанавливающая связь между квантовым и байесовским измерениями
  3. Концепция Pro-bits: предложен вероятностный аналог кубитов, реализующий вероятностные вычисления через унитарные случайные матрицы
  4. Реализация нейронной сетью: доказано, что вероятностные квантовые алгоритмы могут быть эффективно реализованы нейронными сетями, формируя основу алгоритма Tensor Brain
  5. Теорема эквивалентности: доказано, что при определённых условиях обновление вероятностного HB-POVM математически эквивалентно байесовскому обновлению в генеративной скрытой марковской модели (gHMM)
  6. Вычислительное преимущество: при постселекции вероятностный HB-POVM вывод остаётся вычислимым, тогда как вывод gHMM становится неразрешимым

Описание методологии

Определение задачи

Основная задача данной работы — установить мост между квантовой теорией, вероятностным выводом и нейронными вычислениями, предоставляя единый математический фреймворк для механизмов восприятия и памяти мозга.

Теоретический фреймворк

1. Основы квантовых операций

  • Эволюция квантового состояния: ψUevolψ\psi \leftarrow U_{evol}\psi, где UevolU_{evol} — унитарный оператор эволюции
  • Проективное измерение (PVM): вероятность измерения P(k)=ukψ2P(k) = |u_k^\dagger\psi|^2, апостериорное состояние ψuk\psi \leftarrow u_k
  • Обобщённое измерение (POVM): более общее описание измерения, допускающее шум и взаимодействие с окружением

2. Инновация HB-POVM

Определение диагональных операторов измерения: MkHB=diag(uk)M_{k}^{HB} = \text{diag}(u_k)

Вероятность измерения: P(k)=bkTpP(k) = b_k^T p

Апостериорное обновление: ψukψP(k)\psi \leftarrow \frac{u_k \circ \psi}{\sqrt{P(k)}}

где \circ обозначает произведение Адамара, bkb_kkk-й столбец унитарной случайной матрицы BB.

3. Вероятностное квантовое представление

Посредством протокола "измерения незнания" квантовое состояние заменяется вероятностным состоянием:

  • Эволюция вероятностного состояния: pBevolpp \leftarrow B_{evol}p
  • Вероятностное PVM: pbkp \leftarrow b_k
  • Вероятностное HB-POVM: pbkpbkTpp \leftarrow \frac{b_k \circ p}{b_k^T p}

4. Pro-bits и нейронная реализация

Тензоризация вероятностного состояния в pro-bits (вероятностные биты): pi(i1,...,in)==1nγi(1γ)1ip_{i(i_1,...,i_n)} = \prod_{\ell=1}^n \gamma_\ell^{i_\ell}(1-\gamma_\ell)^{1-i_\ell}

где γ=sig(q)\gamma_\ell = \text{sig}(q_\ell), реализуется посредством нейронной сети.

Алгоритм Tensor Brain

Основной алгоритм

  1. Алгоритм эволюции: hsig(v0+Vq)h \leftarrow \text{sig}(v_0 + Vq), qWhq \leftarrow Wh
  2. Ввод и внимание: qq+g(ν)+kaksoftmax()q \leftarrow q + g(\nu) + \sum_k a_k \text{softmax}(\cdot)
  3. Генеративное измерение: выборка kk, обновление qαq+βakq \leftarrow \alpha q + \beta a_k

Ключевые характеристики

  • Когнитивное состояние мозга (CBS): γ=sig(q)\gamma = \text{sig}(q) представляет активацию представительного слоя
  • Слой символического индекса: кодирует символические интерпретации, взаимодействуя с CBS для создания восприятия и памяти
  • Интерпретация пропускных соединений: обновление HB-POVM qak+qq \leftarrow a_k + q предоставляет теоретическое объяснение пропускных соединений

Экспериментальная установка

Наборы данных

  • Подмножество ImageNet: 100 000 образцов из 200 тонкозернистых и 16 грубозернистых классов
  • Иерархия WordNet: используется для установления иерархических отношений между тонкозернистыми и грубозернистыми метками

Метрики оценки

  • Дивергенция Кульбака-Лейблера (KL): измеряет различие в предсказываемых распределениях при разных порядках запросов
  • Дивергенция Йенсена-Шеннона (JSD): симметризованная версия дивергенции KL
  • Коэффициент инверсии метки: доля изменений метки при разных порядках запросов

Методы сравнения

  • Модель PVM: модель стандартного проективного измерения значений
  • Модель HB-POVM: предложенная модель Heisenberg-Bayes POVM

Детали реализации

  • Использование ResNet-50 для извлечения визуальных признаков
  • Вычисление встраивания класса как среднего значения извлечённых векторов признаков
  • Аннотирование каждого изображения областями интереса (ROI)

Экспериментальные результаты

Основные результаты

Эксперимент эффекта порядка

МетрикаPVMHB-POVM
Дивергенция KL20.540.304
JSD0.5720.037
Коэффициент инверсии тонкозернистости (%)93.5622.86
Коэффициент инверсии грубозернистости (%)30.2815.30

Ключевые выводы

  1. Инвариантность порядка: HB-POVM демонстрирует высокую согласованность при разных порядках запросов, тогда как PVM проявляет сильную зависимость от порядка
  2. Квантовая интерференция: квантовое PVM проявляет эффекты интерференции, вероятностное PVM устраняет интерференцию, но сохраняет эффект порядка
  3. Вычислительное преимущество: при постселекции вывод HB-POVM остаётся вычислимым, тогда как классическое байесовское обновление становится неразрешимым

Анализ примеров

Качественный анализ изображения чихуахуа показывает:

  • PVM: порядок запроса влияет на предсказание, тонкозернистое→грубозернистое даёт (чихуахуа, животное), грубозернистое→тонкозернистое даёт (паук-волк, животное)
  • HB-POVM: оба порядка запроса стабильно предсказывают (чихуахуа, животное)

Связанные работы

Квантовое познание

  • Использование математической структуры квантовой теории для описания смещений в человеческом рассуждении
  • Некоммутативная алгебра захватывает эффекты порядка и нарушения закона полной вероятности

Гипотеза байесовского мозга

  • Предположение, что мозг реализует байесовский вывод на нескольких уровнях познания
  • Сталкивается с критикой за вычислительную неразрешимость и биологическую неправдоподобность

Квантовые вычисления и мозг

  • Теория Пенроуза-Хамероффа предлагает квантовые вычисления в микротрубочках
  • Подвергается серьёзной критике из-за чрезвычайно короткого времени квантовой когерентности в мозге

Выводы и обсуждение

Основные выводы

  1. Единый фреймворк: успешно установлен единый фреймворк квантовой теории, вероятностного вывода и нейронных вычислений
  2. Биологическая обоснованность: предоставлен механизм обработки информации, более соответствующий биологии, чем чистые байесовские методы
  3. Вычислительное преимущество: достигнута вычислительная разрешимость при сохранении теоретической строгости
  4. Широкая применимость: фреймворк применим к нескольким когнитивным функциям, включая восприятие, память и символическое рассуждение

Ограничения

  1. Приближающие предположения: нейросетевая реализация требует нескольких приближающих предположений (условная независимость, приближение Йенсена и т.д.)
  2. Ограниченная экспериментальная проверка: проверка проводилась в основном на эффектах порядка, отсутствует проверка на более широком спектре когнитивных задач
  3. Биологическое соответствие: соответствие теоретического фреймворка фактическим механизмам мозга требует дальнейшей проверки

Будущие направления

  1. Расширенные эксперименты: проверка эффективности фреймворка на большем спектре когнитивных задач
  2. Нейронаучная проверка: поиск соответствия между предсказаниями фреймворка и результатами нейронаучных экспериментов
  3. Инженерные приложения: применение фреймворка к проектированию практических AI систем

Глубокая оценка

Преимущества

  1. Теоретическая новизна: впервые установлена прямая связь между квантовым измерением и нейронными вычислениями, предложены оригинальные концепции, такие как HB-POVM
  2. Математическая строгость: предоставлены полные математические выводы и доказаны ключевые теоремы эквивалентности
  3. Междисциплинарная интеграция: успешно объединены концепции и методы физики, нейронауки и информатики
  4. Практическая ценность: предоставлены новые подходы к решению проблемы вычислительной сложности байесовского вывода
  5. Биологическая вдохновлённость: предоставлен фреймворк, более соответствующий биологическим принципам, чем традиционные методы

Недостатки

  1. Высокая сложность: теоретический фреймворк сложен и требует глубокого понимания квантовой механики и нейронауки
  2. Недостаточная экспериментальная проверка: эксперименты сосредоточены в основном на эффектах порядка, отсутствует полная проверка других аспектов фреймворка
  3. Накопление ошибок приближения: несколько шагов приближения могут привести к накоплению ошибок, влияющих на итоговую производительность
  4. Интерпретируемость: хотя предоставлена теоретическая основа, интерпретируемость в практических приложениях требует улучшения

Влияние

  1. Академическая ценность: предоставлен новый теоретический взгляд на когнитивную науку и AI, способный инициировать новые направления исследований
  2. Практические перспективы: предоставлено теоретическое руководство для проектирования более эффективных алгоритмов вывода
  3. Междисциплинарное влияние: может способствовать дальнейшей интеграции квантовой информации, нейронауки и AI

Применимые сценарии

  1. Системы символического рассуждения: подходят для AI систем, требующих обработки взаимодействия символической и подсимвольной информации
  2. Моделирование памяти: применимы к моделированию семантической и эпизодической памяти
  3. Системы восприятия: подходят для систем, требующих интеграции многомодальной сенсорной информации
  4. Большие языковые модели: могут предоставить теоретическую основу и направления улучшения архитектуры трансформера

Библиография

В данной работе цитируются важные работы из нескольких областей, включая квантовую информацию, когнитивную науку и нейронные сети, такие как учебник по квантовым вычислениям Nielsen & Chuang, монография по квантовому познанию Busemeyer & Bruza и оригинальные работы по Tensor Brain.


Общая оценка: Это высокозначимая междисциплинарная исследовательская работа, успешно объединяющая квантовую теорию, вероятностный вывод и нейронные вычисления в единый фреймворк. Несмотря на теоретическую сложность и ограниченную экспериментальную проверку, её оригинальность и потенциальное влияние делают её важным вкладом в области когнитивной науки и искусственного интеллекта.