2025-11-13T02:58:10.568184

Adversarial Thermodynamics

Arcos, Faist, Sagawa et al.
In thermodynamics, an agent's ability to extract work is fundamentally constrained by their environment. Traditional frameworks struggle to capture how strategic decision-making under uncertainty -- particularly an agent's tolerance for risk -- determines the trade-off between extractable work and probability of success in finite-scale experiments. Here, we develop a framework for non-equilibrium thermodynamics based on adversarial resource theories, in which work extraction is modelled as an adversarial game for an agent extracting work. Within this perspective, we recast the Szilard engine as a game isomorphic to Kelly gambling, an information-theoretic model of optimal betting under uncertainty -- but with a thermodynamic utility function. Extending the framework to finite-size regimes, we apply a risk-reward trade-off to find an interpretation of the Renyi-divergences, in terms of extractable work for a given failure probability. By incorporating risk sensitivity via utility functions, we show that the guaranteed amount of work a rational agent would accept instead of undertaking a risky protocol is given by a Rényi divergence. This provides a unified picture of thermodynamics and gambling, and highlights how generalized free energies emerge from an adversarial setup.
academic

Противоположная термодинамика

Основная информация

  • ID статьи: 2510.08298
  • Название: Adversarial Thermodynamics
  • Авторы: Maite Arcos, Philippe Faist, Takahiro Sagawa, Jonathan Oppenheim
  • Классификация: quant-ph (квантовая физика), cond-mat.stat-mech (статистическая механика)
  • Дата публикации: 9 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.08298

Аннотация

В термодинамике способность агента извлекать работу принципиально ограничена его окружением. Традиционные подходы затрудняются в захвате стратегического принятия решений в условиях неопределённости — в частности, как отношение агента к риску определяет компромисс между извлекаемой работой и вероятностью успеха в экспериментах конечного масштаба. В данной работе разработана рамка неравновесной термодинамики на основе противоположной теории ресурсов, моделирующая извлечение работы как противоположную игру между агентом и окружением. С этой точки зрения мы переформулируем двигатель Сцилярда как игру, изоморфную азартной игре Келли — информационно-теоретической модели оптимальных ставок в условиях неопределённости, но с функциями полезности термодинамики. Расширяя рамку на область конечного масштаба, мы применяем компромисс риск-доход для поиска интерпретации дивергенции Рёньи как извлекаемой работы при заданной вероятности отказа. Включая чувствительность к риску через функцию полезности, мы доказываем, что гарантированное количество работы, которое рациональный агент готов принять (в отличие от рискованных протоколов), задаётся дивергенцией Рёньи. Это обеспечивает единую картину термодинамики и азартных игр и подчёркивает, как обобщённые свободные энергии возникают из противоположных установок.

Исследовательский контекст и мотивация

Предпосылки проблемы

  1. Ограничения традиционной термодинамики: Традиционные термодинамические рамки применимы в основном к большим системам в равновесии, опираясь на усреднение по ансамблям. Однако в малых масштабах нанотехнологии и биофизики, в неравновесных системах, флуктуации доминируют, и детерминированные величины, такие как свободная энергия, должны быть заменены вероятностными, зависящими от протокола концепциями.
  2. Недостатки существующих подходов:
    • Стохастическая термодинамика: Хотя и охватывает внутреннюю стохастичность малых неравновесных систем, ей не хватает полного операционального предписания
    • Подходы теории ресурсов: Переформулируют второй закон как ограничения на преобразование состояния, но не предоставляют полного описания того, как стратегические выборы агента прямо определяют компромисс между количеством извлекаемой работы и вероятностью успеха
  3. Основной вызов: Как связать толерантность агента к риску с компромиссом риск-доход при извлечении работы в одном эксперименте конечного масштаба.

Исследовательская мотивация

Данная работа направлена на преодоление этого разрыва через перспективу теории ожидаемой полезности и теории принятия решений, рассматривая проблему извлечения работы как задачу теории принятия решений, где оптимальная стратегия определяется чувствительностью агента к флуктуациям.

Основные вклады

  1. Установление рамки противоположной термодинамики: На основе противоположной теории ресурсов моделирование извлечения работы как противоположной игры между агентом и ограничениями окружения.
  2. Обнаружение изоморфизма между двигателем Сцилярда и азартной игрой Келли: Доказательство того, что противоположный двигатель Сцилярда математически структурирован аналогично проблеме ставок Келли, но с различными классами функций полезности.
  3. Идентификация релевантных функций полезности в термодинамике: Определение функции полезности с постоянной абсолютной неприятием риска (CARA) как релевантного класса неприятия риска в термодинамике, в отличие от постоянного относительного неприятия риска (CRRA) в азартных играх.
  4. Предоставление операциональной интерпретации дивергенции Рёньи: Доказательство того, что все дивергенции Рёньи имеют операциональную интерпретацию для извлечения работы, расширяя предыдущие результаты, применимые только к D₀ и D∞.
  5. Унификация стохастических и теоретико-ресурсных точек зрения: Через принципы теории принятия решений объединение чувствительности к флуктуациям стохастической термодинамики с обобщённой свободной энергией теории ресурсов в единую рамку.

Подробное описание методов

Определение задачи

Установка противоположного двигателя Сцилярда:

  • Участники: Bob (установка начальных ограничений), Alice (оптимизация извлечения работы), Charlie (судья, исполнение случайности)
  • Входные данные: Пустой ящик объёмом V, бинарное распределение вероятностей P_X(x)
  • Выходные данные: Извлекаемое количество работы W
  • Ограничения: Изотермический процесс, эффекты конечного масштаба

Архитектура модели

1. Базовая структура игры

Bob размещает перегородку → Charlie случайно размещает молекулу → Alice выбирает финальную перегородку → Извлечение работы

2. Формула извлечения работы

Для одного раунда извлечения количество работы:

  • Когда x=0 (левая сторона): w₀ = k_BT ln(Q^A/Q^B)
  • Когда x=1 (правая сторона): w₁ = k_BT ln((1-Q^A)/(1-Q^B))

Для среднего извлечения работы за n раундов:

W = n(D(P_X||Q^B_X) - D(P_X||Q^A_X))k_BT  (1)

3. Рамка функции полезности

Применение функции полезности CARA:

u_r(w_x) = (1/r)(1 - exp(-rw_x))  (2)

где r — параметр риска:

  • r > 0: неприятие риска
  • r = 0: нейтральность к риску
  • r < 0: поиск риска

4. Оптимальная стратегия

Получение оптимальной стратегии через максимизацию ожидаемой полезности:

Q^{A,r}_X(x) = P_X(x)^{1/(1+r)} Q^B_X(x)^{r/(1+r)} / Z  (7)

Технические инновации

  1. Физическое обоснование выбора функции полезности: Идентификация того, что аддитивная природа термодинамических систем требует функции полезности CARA, а не функции CRRA в финансовых сценариях.
  2. Математическое выражение компромисса риск-доход: Преобразование проблемы извлечения работы конечного масштаба в задачу теории принятия решений типа "угадывание типа".
  3. Термодинамическая интерпретация детерминированного эквивалента: Доказательство того, что детерминированный эквивалент точно равен дивергенции Рёньи:
W_CE = D_{1/(1+r)}(P_X||Q^B_X)k_BT  (9)

Экспериментальная установка

Рамка теоретической верификации

Данная работа является в основном теоретической, верификация рамки осуществляется следующим образом:

  1. Проверка математической согласованности: Верификация восстановления классических результатов при r→0
  2. Анализ предельных случаев: Проверка поведения при экстремальном неприятии риска (r→∞) и поиске риска (r→-∞)
  3. Сравнение с известными результатами: Сравнение с исходными результатами Сцилярда и теорией азартных игр Келли

Метрики оценки

  • Ожидаемое количество извлекаемой работы EW
  • Детерминированный эквивалент W_CE
  • Ограничения вероятности успеха
  • Дивергенция Рёньи D_α

Результаты экспериментов

Основные результаты

1. Ожидаемое извлечение работы

Для уровня неприятия риска r ожидаемое извлечение работы:

E[W] = (αD(P_X||Q^B_X) + (1-α)D_α(P_X||Q^B_X))k_BT  (8)

где α = 1/(1+r)

2. Детерминированный эквивалент

W_CE = D_{1/(1+r)}(P_X||Q^B_X)k_BT  (9)

3. Границы работы конечного масштаба

В области конечного масштаба границы извлечения работы:

W_n ≥ nD_μ(P_X||Q^B_X)k_BT + (μ/(1-μ))ln ε  (17)

Теоретические находки

  1. Соответствие нейтральности к риску: Когда r=0, оптимальная стратегия Q^A_X = P_X, что точно соответствует неравновесной свободной энергии термодинамики.
  2. Верификация монотонности: Детерминированный эквивалент монотонно убывает с увеличением неприятия риска, что соответствует экономической интуиции.
  3. Условия рациональности: Для поведения, ищущего риск (r<-1), доказано, что условие первого порядка стохастического доминирования никогда не нарушается, обеспечивая рациональный выбор.

Связанные работы

Основные направления исследований

  1. Связь стохастической термодинамики и азартных игр: Работы 11-16 и др. устанавливают связь между стохастической термодинамикой и стратегиями азартных игр
  2. Подходы теории ресурсов: 4-8 развивают теоретико-ресурсную формулировку термодинамики
  3. Применение теории ожидаемой полезности в термодинамике: 16 применяет теорию ожидаемой полезности к оценке термодинамических процессов

Преимущества данной работы

  • Предоставление более глубокой аналогии, а не простого перемещения концепций
  • Формальное моделирование извлечения работы как противоположной игры
  • Раскрытие существенной роли теории принятия решений в термодинамике

Заключение и обсуждение

Основные выводы

  1. Извлечение работы конечного масштаба может быть понято в рамках теории ресурсов, основанной на противоположных азартных играх
  2. Релевантное неприятие риска в термодинамике описывается функцией полезности CARA
  3. Совпадение детерминированного эквивалента и дивергенции Рёньи предоставляет операциональное основание для обобщённого второго закона
  4. Введение неприятия риска позволяет чувствительности к флуктуациям и обобщённой свободной энергии возникать из единого принципа теории принятия решений

Ограничения

  1. Идеализированные предположения: Предположение о том, что Alice знает априорное распределение, может не выполняться в практических приложениях
  2. Бинарные системы: Основной анализ сосредоточен на бинарном двигателе Сцилярда, хотя расширение на общий случай возможно, конкретный анализ ограничен
  3. Экспериментальная верификация: Отсутствие практической экспериментальной верификации, в основном теоретическое построение

Будущие направления

  1. Исследование случаев, когда Alice не знает правильное априорное распределение
  2. Изучение более сложных многоуровневых систем двигателей
  3. Расширение рамки на квантовую термодинамику
  4. Исследование потенциальных связей с термодинамикой чёрных дыр

Глубокая оценка

Преимущества

  1. Сильная теоретическая новизна: Первая систематическая унификация теории принятия решений и термодинамики, предоставляющая совершенно новую теоретическую перспективу
  2. Математическая строгость: Строгие выводы, ясное выражение формул, приложение содержит подробные математические доказательства
  3. Междисциплинарная интеграция: Успешная интеграция концепций из термодинамики, теории информации, экономики и теории принятия решений
  4. Унифицированность: Предоставление единой рамки понимания для стохастической термодинамики и теории ресурсов

Недостатки

  1. Ограниченная практичность: Теоретическая рамка довольно абстрактна, расстояние до практического применения значительно
  2. Недостаточная верификация: Отсутствие численного моделирования или экспериментальной верификации для поддержки теоретических предсказаний
  3. Сложность: Для непрофессиональных читателей междисциплинарные концепции могут быть сложны для понимания

Влияние

  1. Академическая ценность: Предоставление новых теоретических инструментов и перспектив для неравновесной термодинамики
  2. Вдохновляющее значение: Возможность вдохновить больше междисциплинарных направлений исследований
  3. Методологический вклад: Метод противоположных игр может быть применим к другим физическим проблемам

Применимые сценарии

  1. Теоретический анализ малых термодинамических систем
  2. Исследования информационной термодинамики
  3. Анализ теории ресурсов квантовой термодинамики
  4. Моделирование процессов преобразования энергии в биологических системах

Библиография

Статья цитирует 32 важные работы, охватывающие классические работы из нескольких областей, включая стохастическую термодинамику, теорию ресурсов, теорию информации и экономику, предоставляя прочную теоретическую основу для междисциплинарных исследований.


Общая оценка: Это статья с важными теоретическими инновациями в междисциплинарной области, успешно объединяющая термодинамику, теорию информации и экономику в рамке противоположных игр. Хотя работа носит в основном теоретический характер, она предоставляет совершенно новую перспективу для понимания термодинамических систем конечного масштаба и имеет важную академическую ценность и вдохновляющее значение.