Information-processing systems coordinating across multiple agents and objectives face fundamental thermodynamic constraints. We show that solutions with maximum utility to act as coordination focal points have much higher selection pressure for being findable across agents rather than accuracy. We derive that the information-theoretic minimum description length of coordination protocols to precision $\varepsilon$ scales as $L(P)\geq NK\log_2 K+N^2d^2\log (1/\varepsilon)$ for $N$ agents with $d$ potentially conflicting objectives and internal model complexity $K$. This scaling forces progressive simplification, with coordination dynamics changing the environment itself and shifting optimization across hierarchical levels. Moving from established focal points requires re-coordination, creating persistent metastable states and hysteresis until significant environmental shifts trigger phase transitions through spontaneous symmetry breaking. We operationally define coordination temperature to predict critical phenomena and estimate coordination work costs, identifying measurable signatures across systems from neural networks to restaurant bills to bureaucracies. Extending the topological version of Arrow's theorem on the impossibility of consistent preference aggregation, we find it recursively binds whenever preferences are combined. This potentially explains the indefinite cycling in multi-objective gradient descent and alignment faking in Large Language Models trained with reinforcement learning with human feedback. We term this framework Thermodynamic Coordination Theory (TCT), which demonstrates that coordination requires radical information loss.
- पेपर ID: 2509.23144
- शीर्षक: Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence
- लेखक: Atma Anand (University of Rochester)
- वर्गीकरण: cs.AI, cond-mat.stat-mech, cs.MA, nlin.AO, physics.soc-ph
- प्रकाशन तिथि: 14 अक्टूबर 2025 (arXiv प्रीप्रिंट)
- पेपर लिंक: https://arxiv.org/abs/2509.23144
यह पेपर ऊष्मागतिक समन्वय सिद्धांत (TCT) प्रस्तावित करता है, जो बहु-एजेंट बहु-उद्देश्यीय सूचना प्रसंस्करण प्रणालियों के सामने आने वाली मौलिक ऊष्मागतिक बाधाओं को प्रकट करता है। अनुसंधान से पता चलता है कि समन्वय के केंद्रबिंदु के रूप में इष्टतम उपयोगिता समाधान एजेंटों के बीच खोजपूर्णता दबाव सटीकता दबाव से बहुत अधिक है। लेखक सटीकता ε के साथ समन्वय प्रोटोकॉल की सूचना-सैद्धांतिक न्यूनतम विवरण लंबाई प्राप्त करते हैं: L(P)≥NKlog2K+N2d2log(1/ε), जहां N एजेंटों की संख्या है, d संभावित संघर्षपूर्ण उद्देश्यों की संख्या है, K आंतरिक मॉडल जटिलता है। यह स्केलिंग संबंध प्रणाली को क्रमिक सरलीकरण के लिए बाध्य करता है, समन्वय गतिविज्ञान पर्यावरण को स्वयं बदलता है और पदानुक्रमित स्तरों के बीच अनुकूलन को स्थानांतरित करता है।
यह अनुसंधान जो मूल समस्या हल करना चाहता है: जब सीमित संसाधनों वाले एजेंटों को कई संभावित संघर्षपूर्ण उद्देश्यों के बीच समन्वय करने की आवश्यकता होती है, तो उन्हें सूचना-सैद्धांतिक बाधाओं और ऊष्मागतिक लागतों का सामना करना पड़ता है।
- सार्वभौमिकता: तंत्रिका नेटवर्क से संगठनात्मक प्रबंधन तक, बाजार गतिविज्ञान से AI संरेखण तक, बहु-एजेंट बहु-उद्देश्यीय समन्वय जटिल प्रणालियों की सार्वभौमिक घटना है
- मौलिकता: मौजूदा सिद्धांत बहु-एजेंट समन्वय की सूचना-सैद्धांतिक लागत और उदीयमान व्यवहार का एकीकृत विवरण प्रदान नहीं करते हैं
- व्यावहारिकता: इन बाधाओं को समझना AI प्रणाली डिजाइन, संगठनात्मक प्रबंधन और सामाजिक समन्वय के लिए महत्वपूर्ण मार्गदर्शन प्रदान करता है
- मुक्त ऊर्जा सिद्धांत (FEP): केवल यह वर्णन करता है कि एक एकल प्रणाली आश्चर्य को कैसे कम करती है, बहु-एजेंट समन्वय लागत में शामिल नहीं है
- Arrow की असंभवता प्रमेय: पूर्ण वरीयता एकत्रीकरण असंभव साबित करता है, लेकिन सूचना-सैद्धांतिक परिमाणीकरण की कमी है
- बहु-उद्देश्यीय अनुकूलन: प्रणाली के आकार के साथ समन्वय लागत बढ़ने के सैद्धांतिक विश्लेषण की कमी है
लेखक ने देखा कि बड़ी प्रणालियां आमतौर पर सरलीकृत समन्वय केंद्रबिंदु (जैसे LLM के सार्वभौमिक आउटपुट) में परिवर्तित होती हैं, और इस घटना की एकीकृत व्याख्या के लिए ऊष्मागतिकी और सूचना सिद्धांत का उपयोग करने का प्रस्ताव दिया है।
- सैद्धांतिक ढांचा: ऊष्मागतिक समन्वय सिद्धांत (TCT) प्रस्तावित करता है, बहु-एजेंट समन्वय के लिए सूचना-सैद्धांतिक निचली सीमा स्थापित करता है
- गणितीय व्युत्पत्ति: समन्वय प्रोटोकॉल लंबाई के N2d2 स्केलिंग संबंध (प्रमेय 1) और खोजपूर्णता की प्रमुखता को सटीकता पर साबित करता है (प्रमेय 2)
- टोपोलॉजिकल विस्तार: Arrow की असंभवता प्रमेय के टोपोलॉजिकल संस्करण को निरंतर वरीयता स्थान तक विस्तारित करता है, बहु-उद्देश्यीय ढाल वंश की अनंत लूपिंग की व्याख्या करता है
- भौतिक पैरामीटर: मापने योग्य समन्वय तापमान, महत्वपूर्ण घटनाएं और चरण परिवर्तन भविष्यवाणी को परिभाषित करता है
- क्रॉस-डोमेन अनुप्रयोग: रेस्तरां बिल विभाजन से AI संरेखण तक कई डोमेन में घटनाओं की एकीकृत व्याख्या करता है
N शास्त्रीय एजेंटों पर विचार करें, प्रत्येक के पास B बिट्स की सीमित मेमोरी है, Kolmogorov जटिलता Kenv≫B वाले वातावरण में, d अद्वितीय रूप से परिभाषित और संभावित रूप से संघर्षपूर्ण उद्देश्यों के चारों ओर समन्वय करने का प्रयास करते हैं।
d-आयामी उद्देश्य कार्यों पर N विषम एजेंटों के समन्वय के लिए, ε अनुमानित सर्वसम्मति प्राप्त करने वाले किसी भी समन्वय प्रोटोकॉल P की न्यूनतम विवरण लंबाई संतुष्ट करती है:
L(P)≥NKlogK⋅h(ρ)+(2N)2d(d+3)log(1/ε)
जहां:
- K=N1∑iKi औसत मॉडल जटिलता है
- h(ρ)=1−ρ अनुमानित मॉडल गैर-अतिव्यापन कारक है
- ε समन्वय सटीकता है
व्युत्पत्ति के मुख्य बिंदु:
- मॉडल विनिर्देश जटिलता: Lmodels≥NKlogK⋅h(ρ)
- संचार जटिलता: प्रत्येक एजेंट जोड़ी को माध्य वेक्टर और सहप्रसरण मैट्रिक्स जानकारी का आदान-प्रदान करने की आवश्यकता है
- जोड़ीदार समन्वय: (2N) एजेंट जोड़ियों को 2d(d+3) पैरामीटर संघर्षों को हल करने की आवश्यकता है
बहु-एजेंट समन्वय में, जब उपयोगिता U=Ω[A]⋅∏Fi हो, तो खोजपूर्णता का चयन दबाव सटीकता पर प्रभावी होता है, अनुपात Ω[A]/(Fi⋅Ω′[A]) है, सटीकता के चरम पर विचलित होता है।
Chichilnisky के Arrow असंभवता प्रमेय के टोपोलॉजिकल विस्तार के माध्यम से, ज्यामितीय दृष्टिकोण से N2d2 स्केलिंग संबंध को फिर से प्राप्त करता है:
- वरीयता स्थान में अ-संकुचनीय लूप होते हैं
- टोपोलॉजिकल बाधाएं निरंतर, न्यायसंगत एकत्रीकरण को असंभव बनाती हैं
- प्रत्येक समझौता वरीयता स्थान में एक टोपोलॉजिकल बाधा से मेल खाता है
M समूहों के लिए आकार N/M का:
LH≈NKlogK⋅h(ρ)+21N4/3dH(dH+3)log(1/ε)
संचार स्केल को O(N2) से O(N4/3) तक कम करता है, लेकिन अभी भी सुपरलीनियर वृद्धि बनाए रखता है।
Tco=NK21∑i=1N∣∣mi−mˉ∣∣2
जहां mˉ=N1∑imi औसत मॉडल विवरण है।
लेखक सैद्धांतिक सत्यापन के लिए एक ठोस मामले के रूप में रेस्तरां बिल विभाजन का उपयोग करते हैं:
पैरामीटर सेटिंग:
- प्रत्येक उद्देश्य की आंतरिक मॉडल जटिलता: 10 बिट्स
- जोड़ीदार संघर्ष समाधान सटीकता: 5 बिट्स
- मानव कार्यशील स्मृति क्षमता: ~100 बिट्स
परिदृश्य विश्लेषण:
- N=4, d=2: कुल संचार 110 बिट्स, मानव स्मृति सीमा के करीब
- N=8, d=4: कुल संचार 1,210 बिट्स, स्मृति क्षमता से एक परिमाण अधिक
- बहु-उद्देश्यीय ढाल वंश: अनंत लूपिंग घटना सीधे सैद्धांतिक ढांचे का समर्थन करती है
- बड़े भाषा मॉडल: RLHF प्रशिक्षण में संरेखण छद्मता और सार्वभौमिक आउटपुट अभिसरण
- मानव तर्क: समन्वय के लिए व्यवस्थित पूर्वाग्रह बनाम सटीकता
- सांस्कृतिक विकास: प्रसारणीय सरलीकरण का चयन
- वैज्ञानिक प्रतिमान: Kuhn चक्र बनाम संचयी विकास
व्यावहारिक पैरामीटर के लिए (N=100, d=2, ε=0.01):
- मॉडल पद: Lmodels≈6.6×103 बिट्स
- संचार पद: Lcomm≈7.6×104 बिट्स
संचार पद प्रभावी है, N2d2 स्केलिंग संबंध को सत्यापित करता है।
महत्वपूर्ण समन्वय तापमान:
Tc,co=log(N)K0/K
प्रणाली T<Tc,co पर समन्वय बनाए रख सकती है, महत्वपूर्ण तापमान से अधिक निरंतर संसाधन निवेश की आवश्यकता है।
- AI प्रणालियां: बहु-उद्देश्यीय प्रशिक्षण की चक्रीय व्यवहार
- संगठन: प्रक्रिया जटिलता क्षय
- बाजार: महत्वपूर्ण परिवर्तन और बुलबुले घटनाएं
हालांकि पदानुक्रमित समन्वय जटिलता को O(N2) से O(N4/3) तक कम कर सकता है, लेकिन:
- पूर्ण सूचना एकत्रीकरण मानता है (Arrow प्रमेय का उल्लंघन)
- सीमाओं पर सूचना हानि का परिचय देता है
- अभी भी जटिलता बनाए रखने के लिए बाहरी कार्य की आवश्यकता है
- कम्प्यूटेशनल ऊष्मागतिकी: Landauer सिद्धांत, Bennett ऊष्मागतिक लागत
- सूचना सिद्धांत: Kolmogorov जटिलता, न्यूनतम विवरण लंबाई
- सामाजिक चयन सिद्धांत: Arrow असंभवता प्रमेय, Chichilnisky टोपोलॉजिकल विस्तार
- Constant et al.: सामाजिक अपेक्षा तंत्र
- Ramstead et al.: सांस्कृतिक स्कैफोल्डिंग भूमिका
- Vasil et al.: सक्रिय अनुमान के रूप में संचार
यह पेपर पहली बार बहु-एजेंट समन्वय की सूचना-सैद्धांतिक लागत को परिमाणित करता है और महत्वपूर्ण घटनाओं और चरण परिवर्तन की भविष्यवाणी करता है।
- मौलिक बाधा: बहु-एजेंट बहु-उद्देश्यीय समन्वय N2d2 सूचना-सैद्धांतिक निचली सीमा का सामना करता है
- सरलीकरण दबाव: खोजपूर्णता दबाव सटीकता पर प्रभावी है, प्रणाली को सरलीकरण के लिए बाध्य करता है
- चरण परिवर्तन घटना: प्रणाली महत्वपूर्ण तापमान के पास चरण परिवर्तन और हिस्टेरेसिस प्रदर्शित करती है
- सार्वभौमिक प्रयोज्यता: AI से जैविक प्रणालियों तक एकीकृत व्याख्या ढांचा
- पैरामीटर माप: प्रभावी N, K, ε, d गतिशील रूप से बदलते हैं, माप कठिन है
- शास्त्रीय प्रणालियां: क्वांटम प्रभाव जैसे उलझन-सहायता समन्वय पर विचार नहीं करता है
- वर्णनात्मक सिद्धांत: सांख्यिकीय प्रवृत्तियों का वर्णन करता है, सटीक प्रक्षेपवक्र भविष्यवाणी नहीं
- स्तर II अराजकता: आवश्यक सूचना पुनरावृत्ति और हानि के कारण प्रक्षेपवक्र अज्ञेय हैं
- शर्त उल्लंघन चयन: प्रणाली विफलता के बजाय सचेत रूप से Arrow शर्तों का उल्लंघन चुनें
- समानांतर पदानुक्रम: पर्यावरण परिवर्तन के लिए गैर-प्रमुख केंद्रबिंदु की अतिरेक बनाए रखें
- नियमित जांच: पर्यावरण प्रतिक्रिया से अलग लॉकिंग प्रभाव की पहचान करें
- सूक्ष्म हैमिल्टनियन: सूक्ष्म से मैक्रो पैरामीटर व्युत्पत्ति
- डोमेन-विशिष्ट विश्लेषण: AI, संगठन आदि के लिए विशिष्ट अनुप्रयोग
- अनुभवजन्य सत्यापन: बड़ी प्रणालियों का पैरामीटर माप और भविष्यवाणी सत्यापन
- सैद्धांतिक नवाचार: बहु-एजेंट समन्वय के लिए पहला ऊष्मागतिक सैद्धांतिक ढांचा
- गणितीय कठोरता: सूचना सिद्धांत और टोपोलॉजी दोहरी व्युत्पत्ति विश्वसनीयता बढ़ाती है
- क्रॉस-डोमेन एकीकरण: AI से जैविक प्रणालियों तक व्यापक घटनाओं की व्याख्या करता है
- व्यावहारिक मूल्य: प्रणाली डिजाइन के लिए सैद्धांतिक मार्गदर्शन और संज्ञानात्मक बाधाएं प्रदान करता है
- सीमित अनुभवजन्य सत्यापन: मुख्य रूप से केस विश्लेषण पर निर्भर, बड़े पैमाने पर अनुभवजन्य अनुसंधान की कमी
- पैरामीटर अनुमान कठिनाई: वास्तविक प्रणालियों में मुख्य पैरामीटर सटीक माप के लिए कठिन हैं
- सरलीकृत मान्यताएं: एजेंटों के बीच जटिल अंतःक्रिया और सीखने के प्रभाव को अनदेखा करता है
- भविष्यवाणी सटीकता: स्तर II अराजकता सटीक भविष्यवाणी क्षमता को सीमित करती है
- सैद्धांतिक योगदान: जटिल प्रणाली अनुसंधान के लिए नए सैद्धांतिक उपकरण प्रदान करता है
- अंतः-विषय मूल्य: भौतिकी, कंप्यूटर विज्ञान, अर्थशास्त्र आदि कई क्षेत्रों को जोड़ता है
- व्यावहारिक मार्गदर्शन: AI संरेखण, संगठनात्मक डिजाइन आदि के लिए सैद्धांतिक आधार प्रदान करता है
- अनुसंधान दिशा: ऊष्मागतिक समन्वय सिद्धांत के नए अनुसंधान क्षेत्र को खोलता है
- AI प्रणाली डिजाइन: बहु-उद्देश्यीय अनुकूलन, मॉडल संरेखण, वितरित प्रशिक्षण
- संगठनात्मक प्रबंधन: टीम समन्वय, निर्णय निर्माण, पदानुक्रमित संरचना डिजाइन
- सामाजिक प्रणालियां: नीति निर्माण, बाजार तंत्र, सामूहिक निर्णय
- जैविक प्रणालियां: समूह व्यवहार, विकास गतिविज्ञान, पारिस्थितिक समन्वय
यह पेपर 61 महत्वपूर्ण संदर्भों का हवाला देता है, जो सूचना सिद्धांत, सांख्यिकीय यांत्रिकी, सामाजिक चयन सिद्धांत, संज्ञानात्मक विज्ञान आदि कई क्षेत्रों के शास्त्रीय और अग्रणी कार्यों को शामिल करते हैं, अंतः-विषय अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं।
सारांश: इस पेपर द्वारा प्रस्तावित ऊष्मागतिक समन्वय सिद्धांत महत्वपूर्ण सैद्धांतिक मूल्य और व्यावहारिक महत्व वाला एक मौलिक ढांचा है, हालांकि अनुभवजन्य सत्यापन और पैरामीटर माप के पहलुओं में सुधार की गुंजाइश है, लेकिन इसकी अंतः-विषय एकीकृत व्याख्या क्षमता और जटिल प्रणाली डिजाइन के लिए मार्गदर्शन मूल्य इसे इस क्षेत्र का एक महत्वपूर्ण योगदान बनाता है।