2025-11-13T02:58:10.568184

Adversarial Thermodynamics

Arcos, Faist, Sagawa et al.
In thermodynamics, an agent's ability to extract work is fundamentally constrained by their environment. Traditional frameworks struggle to capture how strategic decision-making under uncertainty -- particularly an agent's tolerance for risk -- determines the trade-off between extractable work and probability of success in finite-scale experiments. Here, we develop a framework for non-equilibrium thermodynamics based on adversarial resource theories, in which work extraction is modelled as an adversarial game for an agent extracting work. Within this perspective, we recast the Szilard engine as a game isomorphic to Kelly gambling, an information-theoretic model of optimal betting under uncertainty -- but with a thermodynamic utility function. Extending the framework to finite-size regimes, we apply a risk-reward trade-off to find an interpretation of the Renyi-divergences, in terms of extractable work for a given failure probability. By incorporating risk sensitivity via utility functions, we show that the guaranteed amount of work a rational agent would accept instead of undertaking a risky protocol is given by a Rényi divergence. This provides a unified picture of thermodynamics and gambling, and highlights how generalized free energies emerge from an adversarial setup.
academic

প্রতিকূল থার্মোডাইনামিক্স

মৌলিক তথ্য

  • পেপার আইডি: 2510.08298
  • শিরোনাম: প্রতিকূল থার্মোডাইনামিক্স
  • লেখক: Maite Arcos, Philippe Faist, Takahiro Sagawa, Jonathan Oppenheim
  • শ্রেণীবিভাগ: quant-ph (কোয়ান্টাম পদার্থবিজ্ঞান), cond-mat.stat-mech (পরিসংখ্যানগত বলবিজ্ঞান)
  • প্রকাশনার সময়: ২০২৫ সালের ৯ অক্টোবর (arXiv প্রাক-প্রিন্ট)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2510.08298

সারসংক্ষেপ

থার্মোডাইনামিক্সে, একটি এজেন্টের কাজ আহরণের ক্ষমতা মৌলিকভাবে তার পরিবেশের সীমাবদ্ধতা দ্বারা সীমাবদ্ধ। প্রচলিত কাঠামো অনিশ্চয়তার অধীনে কৌশলগত সিদ্ধান্ত গ্রহণ ক্যাপচার করতে অসুবিধা পায়—বিশেষত এজেন্টের ঝুঁকি সহনশীলতা—সীমিত স্কেল পরীক্ষায় আহরণযোগ্য কাজ এবং সাফল্যের সম্ভাবনার মধ্যে ট্রেড-অফ কীভাবে নির্ধারণ করে। এই পত্রটি প্রতিকূল সম্পদ তত্ত্বের উপর ভিত্তি করে একটি অ-সমতাপীয় থার্মোডাইনামিক কাঠামো বিকশিত করে, কাজ আহরণকে এজেন্ট এবং পরিবেশের মধ্যে একটি প্রতিকূল খেলা হিসাবে মডেল করে। এই দৃষ্টিভঙ্গির অধীনে, আমরা Szilard ইঞ্জিনকে Kelly জুয়া খেলার সাথে সমরূপী একটি খেলা হিসাবে পুনর্নির্ধারণ করি—অনিশ্চয়তার অধীনে সর্বোত্তম বাজির একটি তথ্য-তাত্ত্বিক মডেল, কিন্তু থার্মোডাইনামিক উপযোগিতা ফাংশন ব্যবহার করে। সীমিত স্কেল অঞ্চলে কাঠামো প্রসারিত করে, আমরা ঝুঁকি-রিটার্ন ট্রেড-অফ প্রয়োগ করি Rényi বিচ্যুতির ব্যাখ্যা খুঁজে পেতে, অর্থাৎ প্রদত্ত ব্যর্থতার সম্ভাবনার অধীনে আহরণযোগ্য কাজ। উপযোগিতা ফাংশনের মাধ্যমে ঝুঁকি সংবেদনশীলতা অন্তর্ভুক্ত করে, আমরা প্রমাণ করি যে যুক্তিসঙ্গত এজেন্টরা গ্যারান্টিযুক্ত কাজের পরিমাণ গ্রহণ করতে ইচ্ছুক (ঝুঁকি প্রোটোকল গ্রহণের পরিবর্তে) Rényi বিচ্যুতি দ্বারা প্রদত্ত। এটি থার্মোডাইনামিক্স এবং জুয়া খেলার একটি একীভূত চিত্র প্রদান করে এবং হাইলাইট করে কীভাবে সাধারণীকৃত মুক্ত শক্তি প্রতিকূল সেটিং থেকে উদ্ভূত হয়।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার পটভূমি

১. প্রচলিত থার্মোডাইনামিক্সের সীমাবদ্ধতা: প্রচলিত থার্মোডাইনামিক কাঠামো প্রধানত বৃহৎ সিস্টেম সমতাপীয় অবস্থার জন্য উপযুক্ত, সমষ্টি গড়ের উপর নির্ভর করে, কিন্তু ন্যানোপ্রযুক্তি এবং জৈব পদার্থবিজ্ঞানের ছোট স্কেল, অ-সমতাপীয় সিস্টেমে, ওঠানামা প্রভাবশালী, এবং নির্ধারণীয় পরিমাণ যেমন মুক্ত শক্তি অবশ্যই সম্ভাব্য, প্রোটোকল-নির্ভর ধারণা দ্বারা প্রতিস্থাপিত হবে।

२. বিদ্যমান পদ্ধতির অপর্যাপ্ততা:

  • স্টোকাস্টিক থার্মোডাইনামিক্স: যদিও ছোট স্কেল, অ-সমতাপীয় সিস্টেমের অন্তর্নিহিত স্টোকাস্টিসিটি গ্রহণ করে, তবে সম্পূর্ণ অপারেশনাল প্রেসক্রিপশনের অভাব রয়েছে
  • সম্পদ তত্ত্ব পদ্ধতি: দ্বিতীয় নিয়মকে অবস্থা রূপান্তর সীমাবদ্ধতা হিসাবে পুনর্নির্ধারণ করে, কিন্তু কোনটিই এজেন্টের কৌশলগত পছন্দ কীভাবে সরাসরি কাজ আহরণ এবং সাফল্যের সম্ভাবনার ট্রেড-অফ নির্ধারণ করে তার সম্পূর্ণ বর্ণনা প্রদান করে না।

३. মূল চ্যালেঞ্জ: একক সীমিত স্কেল পরীক্ষায়, এজেন্টের ঝুঁকির প্রতি সহনশীলতা কীভাবে কাজ আহরণের ঝুঁকি-রিটার্ন ট্রেড-অফের সাথে সংযুক্ত হয়।

গবেষণা প্রেরণা

এই পত্রটি প্রত্যাশিত উপযোগিতা তত্ত্ব এবং সিদ্ধান্ত গ্রহণ তত্ত্বের দৃষ্টিভঙ্গি থেকে এই ব্যবধান পূরণ করার লক্ষ্য রাখে, কাজ আহরণ সমস্যাকে একটি সিদ্ধান্ত গ্রহণ তত্ত্বের সমস্যা হিসাবে দেখে, যেখানে সর্বোত্তম কৌশল ওঠানামার প্রতি এজেন্টের সংবেদনশীলতা দ্বারা নির্ধারিত হয়।

মূল অবদান

१. প্রতিকূল থার্মোডাইনামিক কাঠামো প্রতিষ্ঠা: প্রতিকূল সম্পদ তত্ত্বের উপর ভিত্তি করে, কাজ আহরণকে এজেন্ট এবং পরিবেশ সীমাবদ্ধতার মধ্যে একটি প্রতিকূল খেলা হিসাবে মডেল করে।

२. Szilard ইঞ্জিন এবং Kelly জুয়া খেলার সমরূপতা আবিষ্কার: প্রমাণ করে যে প্রতিকূল Szilard ইঞ্জিন গাণিতিক কাঠামোতে Kelly বাজির সমস্যার সাথে সমরূপী, কিন্তু বিভিন্ন উপযোগিতা ফাংশন শ্রেণী সহ।

३. থার্মোডাইনামিক্সে প্রাসঙ্গিক উপযোগিতা ফাংশন চিহ্নিত করা: ধ্রুবক পরম ঝুঁকি বিরোধিতা (CARA) উপযোগিতা ফাংশন থার্মোডাইনামিক্সে প্রাসঙ্গিক ঝুঁকি বিরোধিতা শ্রেণী, জুয়া খেলায় ধ্রুবক আপেক্ষিক ঝুঁকি বিরোধিতা (CRRA) থেকে আলাদা।

४. Rényi বিচ্যুতির অপারেশনাল ব্যাখ্যা প্রদান: প্রমাণ করে যে সমস্ত Rényi বিচ্যুতির কাজ আহরণের অপারেশনাল ব্যাখ্যা রয়েছে, শুধুমাত্র D₀ এবং D∞ এর জন্য পূর্ববর্তী ফলাফল প্রসারিত করে।

५. স্টোকাস্টিক এবং সম্পদ তত্ত্ব দৃষ্টিভঙ্গি একীভূত করা: সিদ্ধান্ত গ্রহণ তত্ত্বের নীতির মাধ্যমে, স্টোকাস্টিক থার্মোডাইনামিক্সের ওঠানামা সংবেদনশীলতা এবং সম্পদ তত্ত্বের সাধারণীকৃত মুক্ত শক্তি একটি একক কাঠামোতে একীভূত করে।

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

প্রতিকূল Szilard ইঞ্জিন সেটআপ:

  • অংশগ্রহণকারী: Bob (প্রাথমিক সীমাবদ্ধতা সেট করে), Alice (কাজ আহরণ অপ্টিমাইজ করে), Charlie (রেফারি, র্যান্ডমনেস সম্পাদন করে)
  • ইনপুট: V ভলিউমের খালি বাক্স, দ্বিমুখী সম্ভাব্যতা বিতরণ P_X(x)
  • আউটপুট: আহরণকৃত কাজের পরিমাণ W
  • সীমাবদ্ধতা: সমতাপীয় প্রক্রিয়া, সীমিত স্কেল প্রভাব

মডেল আর্কিটেকচার

१. মৌলিক খেলার কাঠামো

Bob隔板স্থান রাখে → Charlie র্যান্ডমলি অণু রাখে → Alice চূড়ান্ত隔板স্থান নির্বাচন করে → কাজ আহরণ

२. কাজ আহরণ সূত্র

একক রাউন্ড আহরণের জন্য, কাজের পরিমাণ:

  • যখন x=0 (বাম): w₀ = k_BT ln(Q^A/Q^B)
  • যখন x=1 (ডান): w₁ = k_BT ln((1-Q^A)/(1-Q^B))

n রাউন্ডের গড় কাজ আহরণের জন্য:

W = n(D(P_X||Q^B_X) - D(P_X||Q^A_X))k_BT  (1)

३. উপযোগিতা ফাংশন কাঠামো

CARA উপযোগিতা ফাংশন গ্রহণ করে:

u_r(w_x) = (1/r)(1 - exp(-rw_x))  (2)

যেখানে r হল ঝুঁকি পরামিতি:

  • r > 0: ঝুঁকি বিরোধিতা
  • r = 0: ঝুঁকি নিরপেক্ষতা
  • r < 0: ঝুঁকি অনুসন্ধান

४. সর্বোত্তম কৌশল

প্রত্যাশিত উপযোগিতা সর্বাধিকীকরণের মাধ্যমে সর্বোত্তম কৌশল প্রাপ্ত:

Q^{A,r}_X(x) = P_X(x)^{1/(1+r)} Q^B_X(x)^{r/(1+r)} / Z  (7)

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. উপযোগিতা ফাংশন নির্বাচনের ভৌত ভিত্তি: থার্মোডাইনামিক সিস্টেমের সংযোজনীয় বৈশিষ্ট্য CARA উপযোগিতা ফাংশন প্রয়োজন, আর্থিক পরিস্থিতিতে CRRA ফাংশন নয়।

२. ঝুঁকি-রিটার্ন ট্রেড-অফের গাণিতিক প্রকাশ: সীমিত স্কেল কাজ আহরণ সমস্যাকে "অনুমান ধরন" সিদ্ধান্ত গ্রহণ তত্ত্ব সমস্যায় রূপান্তরিত করে।

३. নিশ্চিত সমতুল্যের থার্মোডাইনামিক ব্যাখ্যা: প্রমাণ করে যে নিশ্চিত সমতুল্য ঠিক Rényi বিচ্যুতির সমান:

W_CE = D_{1/(1+r)}(P_X||Q^B_X)k_BT  (9)

পরীক্ষামূলক সেটআপ

তাত্ত্বিক যাচাইকরণ কাঠামো

এই পত্রটি প্রধানত একটি তাত্ত্বিক কাজ, নিম্নলিখিত উপায়ে কাঠামো যাচাই করে:

१. গাণিতিক সামঞ্জস্য পরীক্ষা: r→0 এ ক্লাসিক্যাল ফলাফল পুনরুদ্ধার যাচাই করে २. সীমা কেস বিশ্লেষণ: চরম ঝুঁকি বিরোধিতা (r→∞) এবং ঝুঁকি অনুসন্ধান (r→-∞) এর আচরণ পরীক্ষা করে ३. পরিচিত ফলাফলের সাথে তুলনা: Szilard মূল ফলাফল এবং Kelly জুয়া তত্ত্বের সাথে তুলনা

মূল্যায়ন মেট্রিক্স

  • প্রত্যাশিত কাজ আহরণ EW
  • নিশ্চিত সমতুল্য W_CE
  • সাফল্যের সম্ভাবনা সীমাবদ্ধতা
  • Rényi বিচ্যুতি D_α

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

१. প্রত্যাশিত কাজ আহরণ

ঝুঁকি বিরোধিতা স্তর r এর জন্য, প্রত্যাশিত কাজ আহরণ:

E[W] = (αD(P_X||Q^B_X) + (1-α)D_α(P_X||Q^B_X))k_BT  (8)

যেখানে α = 1/(1+r)

२. নিশ্চিত সমতুল্য

W_CE = D_{1/(1+r)}(P_X||Q^B_X)k_BT  (9)

३. সীমিত স্কেল কাজ সীমাবদ্ধতা

সীমিত স্কেল অঞ্চলে, কাজ আহরণ সীমাবদ্ধতা:

W_n ≥ nD_μ(P_X||Q^B_X)k_BT + (μ/(1-μ))ln ε  (17)

তাত্ত্বিক আবিষ্কার

१. ঝুঁকি নিরপেক্ষতা সংযোগ: যখন r=0, সর্বোত্তম কৌশল Q^A_X = P_X, ঠিক থার্মোডাইনামিক অ-সমতাপীয় মুক্ত শক্তির সাথে সামঞ্জস্যপূর্ণ।

२. একঘেয়েতা যাচাইকরণ: নিশ্চিত সমতুল্য ঝুঁকি বিরোধিতা বৃদ্ধির সাথে একঘেয়েভাবে হ্রাস পায়, অর্থনৈতিক অন্তর্দৃষ্টির সাথে সামঞ্জস্যপূর্ণ।

३. যুক্তিসঙ্গত শর্ত: ঝুঁকি অনুসন্ধান আচরণের জন্য (r<-1), প্রমাণ করে যে প্রথম-অর্ডার স্টোকাস্টিক আধিপত্য শর্ত কখনও লঙ্ঘিত হয় না, যুক্তিসঙ্গত পছন্দ নিশ্চিত করে।

সম্পর্কিত কাজ

প্রধান গবেষণা দিকনির্দেশনা

१. স্টোকাস্টিক থার্মোডাইনামিক্স এবং জুয়া খেলার সংযোগ: 11-16 ইত্যাদি কাজ স্টোকাস্টিক থার্মোডাইনামিক্স এবং জুয়া খেলার কৌশলের মধ্যে সংযোগ স্থাপন করে २. সম্পদ তত্ত্ব পদ্ধতি: 4-8 থার্মোডাইনামিক্সের সম্পদ তত্ত্ব প্রকাশ বিকশিত করে ३. থার্মোডাইনামিক্সে প্রত্যাশিত উপযোগিতা তত্ত্বের প্রয়োগ: 16 থার্মোডাইনামিক প্রক্রিয়া মূল্যায়নে প্রত্যাশিত উপযোগিতা তত্ত্ব প্রয়োগ করে

এই পত্রের সুবিধা

  • গভীর সাদৃশ্য সম্পর্ক প্রদান করে, সহজ ধারণা স্থানান্তর নয়
  • আনুষ্ঠানিকভাবে কাজ আহরণকে প্রতিকূল খেলা হিসাবে মডেল করে
  • থার্মোডাইনামিক্সে সিদ্ধান্ত গ্রহণ তত্ত্বের সারাংশ প্রকাশ করে

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. সীমিত স্কেল কাজ আহরণ প্রতিকূল জুয়া খেলার উপর ভিত্তি করে সম্পদ তত্ত্ব কাঠামোর মধ্যে বোঝা যায় २. থার্মোডাইনামিক্সে প্রাসঙ্গিক ঝুঁকি বিরোধিতা CARA উপযোগিতা ফাংশন দ্বারা বর্ণিত ३. নিশ্চিত সমতুল্য এবং Rényi বিচ্যুতির সামঞ্জস্য সাধারণীকৃত দ্বিতীয় নিয়মের জন্য অপারেশনাল নীতি ভিত্তি প্রদান করে ४. ঝুঁকি বিরোধিতার প্রবর্তন ওঠানামা সংবেদনশীলতা এবং সাধারণীকৃত মুক্ত শক্তি একক সিদ্ধান্ত গ্রহণ তত্ত্ব নীতি থেকে উদ্ভূত করে

সীমাবদ্ধতা

१. আদর্শকরণ অনুমান: Alice পূর্ব বিতরণ জানে অনুমান করে, বাস্তব প্রয়োগে সত্য নাও হতে পারে २. দ্বিমুখী সিস্টেম: প্রধান বিশ্লেষণ দ্বিমুখী Szilard ইঞ্জিনে কেন্দ্রীভূত, যদিও সাধারণ কেসে প্রসারিত, নির্দিষ্ট বিশ্লেষণ সীমিত ३. পরীক্ষামূলক যাচাইকরণ: প্রকৃত পরীক্ষামূলক যাচাইকরণের অভাব, প্রধানত তাত্ত্বিক নির্মাণ

ভবিষ্যত দিকনির্দেশনা

१. Alice সঠিক পূর্ব বিতরণ না জানার পরিস্থিতি অন্বেষণ করা २. আরও জটিল বহু-স্তরের ইঞ্জিন সিস্টেম গবেষণা করা ३. কাঠামো কোয়ান্টাম থার্মোডাইনামিক্সে প্রসারিত করা ४. কৃষ্ণ গর্ত থার্মোডাইনামিক্সের সাথে সম্ভাব্য সংযোগ অন্বেষণ করা

গভীর মূল্যায়ন

সুবিধা

१. তাত্ত্বিক উদ্ভাবনী শক্তিশালী: প্রথমবারের মতো সিদ্ধান্ত গ্রহণ তত্ত্ব এবং থার্মোডাইনামিক্স সিস্টেমেটিকভাবে একীভূত করে, সম্পূর্ণ নতুন তাত্ত্বিক দৃষ্টিভঙ্গি প্রদান করে २. গাণিতিক কঠোরতা: প্রাপ্তি প্রক্রিয়া কঠোর, সূত্র প্রকাশ স্পষ্ট, পরিশিষ্ট বিস্তারিত গাণিতিক প্রমাণ প্রদান করে ३. আন্তঃশৃঙ্খলা একীকরণ: সফলভাবে থার্মোডাইনামিক্স, তথ্য তত্ত্ব, অর্থনীতি এবং সিদ্ধান্ত গ্রহণ তত্ত্বের ধারণা একীভূত করে ४. একীকরণ: স্টোকাস্টিক থার্মোডাইনামিক্স এবং সম্পদ তত্ত্বের জন্য একীভূত বোঝার কাঠামো প্রদান করে

অপূর্ণতা

१. সীমিত ব্যবহারিকতা: তাত্ত্বিক কাঠামো বেশ বিমূর্ত, বাস্তব প্রয়োগ থেকে এখনও দূরত্ব রয়েছে २. যাচাইকরণ অপর্যাপ্ত: সংখ্যাগত সিমুলেশন বা পরীক্ষামূলক যাচাইকরণের অভাব তাত্ত্বিক পূর্বাভাস সমর্থন করতে ३. জটিলতা: অ-বিশেষজ্ঞ পাঠকদের জন্য, আন্তঃশৃঙ্খলা ধারণা বোঝা কঠিন হতে পারে

প্রভাব

१. একাডেমিক মূল্য: অ-সমতাপীয় থার্মোডাইনামিক্সের জন্য নতুন তাত্ত্বিক সরঞ্জাম এবং দৃষ্টিভঙ্গি প্রদান করে २. অনুপ্রেরণা তাৎপর্য: আরও আন্তঃশৃঙ্খলা গবেষণা দিকনির্দেশনা অনুপ্রাণিত করতে পারে ३. পদ্ধতিগত অবদান: প্রতিকূল খেলা পদ্ধতি অন্যান্য ভৌত সমস্যায় প্রয়োগযোগ্য হতে পারে

প্রযোজ্য পরিস্থিতি

१. ছোট স্কেল থার্মোডাইনামিক সিস্টেমের তাত্ত্বিক বিশ্লেষণ २. তথ্য থার্মোডাইনামিক্স গবেষণা ३. কোয়ান্টাম থার্মোডাইনামিক্সের সম্পদ তত্ত্ব বিশ্লেষণ ४. জৈব সিস্টেমে শক্তি রূপান্তর প্রক্রিয়া মডেলিং

তথ্যসূত্র

পত্রটি ৩२টি গুরুত্বপূর্ণ তথ্যসূত্র উদ্ধৃত করে, স্টোকাস্টিক থার্মোডাইনামিক্স, সম্পদ তত্ত্ব, তথ্য তত্ত্ব এবং অর্থনীতি সহ একাধিক ক্ষেত্রের ক্লাসিক্যাল কাজ অন্তর্ভুক্ত করে, আন্তঃশৃঙ্খলা গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।


সামগ্রিক মূল্যায়ন: এটি একটি গুরুত্বপূর্ণ তাত্ত্বিক উদ্ভাবন সহ একটি আন্তঃশৃঙ্খলা পত্র, সফলভাবে থার্মোডাইনামিক্স, তথ্য তত্ত্ব এবং অর্থনীতি তত্ত্বকে প্রতিকূল খেলা কাঠামোতে একীভূত করে। যদিও তাত্ত্বিক প্রকৃতির, এটি সীমিত স্কেল থার্মোডাইনামিক সিস্টেম বোঝার জন্য সম্পূর্ণ নতুন দৃষ্টিভঙ্গি প্রদান করে, গুরুত্বপূর্ণ একাডেমিক মূল্য এবং অনুপ্রেরণা তাৎপর্য রয়েছে।