2025-11-16T23:37:13.075377

The Algorithmic Regulator

Ruffini
The regulator theorem states that, under certain conditions, any optimal controller must embody a model of the system it regulates, grounding the idea that controllers embed, explicitly or implicitly, internal models of the controlled. This principle underpins neuroscience and predictive brain theories like the Free-Energy Principle or Kolmogorov/Algorithmic Agent theory. However, the theorem is only proven in limited settings. Here, we treat the deterministic, closed, coupled world-regulator system $(W,R)$ as a single self-delimiting program $p$ via a constant-size wrapper that produces the world output string~$x$ fed to the regulator. We analyze regulation from the viewpoint of the algorithmic complexity of the output, $K(x)$. We define $R$ to be a \emph{good algorithmic regulator} if it \emph{reduces} the algorithmic complexity of the readout relative to a null (unregulated) baseline $\varnothing$, i.e., \[ Δ= K\big(O_{W,\varnothing}\big) - K\big(O_{W,R}\big) > 0. \] We then prove that the larger $Δ$ is, the more world-regulator pairs with high mutual algorithmic information are favored. More precisely, a complexity gap $Δ> 0$ yields \[ \Pr\big((W,R)\mid x\big) \le C\,2^{\,M(W{:}R)}\,2^{-Δ}, \] making low $M(W{:}R)$ exponentially unlikely as $Δ$ grows. This is an AIT version of the idea that ``the regulator contains a model of the world.'' The framework is distribution-free, applies to individual sequences, and complements the Internal Model Principle. Beyond this necessity claim, the same coding-theorem calculus singles out a \emph{canonical scalar objective} and implicates a \emph{planner}. On the realized episode, a regulator behaves \emph{as if} it minimized the conditional description length of the readout.
academic

एल्गोरिथमिक नियामक

मूल जानकारी

  • पेपर ID: 2510.10300
  • शीर्षक: The Algorithmic Regulator
  • लेखक: Giulio Ruffini
  • वर्गीकरण: cs.CC cs.AI cs.IT cs.SY eess.SY math.IT q-bio.NC
  • प्रकाशन तिथि: 14 अक्टूबर, 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.10300

सारांश

यह पेपर एल्गोरिथमिक सूचना सिद्धांत (AIT) के आधार पर शास्त्रीय नियामक प्रमेय का पुनर्मूल्यांकन करता है, जो कहता है कि विशिष्ट परिस्थितियों में, किसी भी इष्टतम नियंत्रक में उस प्रणाली का मॉडल होना चाहिए जिसे वह नियंत्रित करता है। लेखक नियतात्मक विश्व-नियामक युग्मित प्रणाली (W,R)(W,R) को एक एकल स्व-सीमांकित प्रोग्राम के रूप में देखता है और आउटपुट की एल्गोरिथमिक जटिलता K(x)K(x) के दृष्टिकोण से नियमन का विश्लेषण करता है। "अच्छे एल्गोरिथमिक नियामक" को उस नियामक के रूप में परिभाषित किया गया है जो बिना नियमन के आधारभूत स्तर की तुलना में आउटपुट की एल्गोरिथमिक जटिलता को कम करता है, अर्थात् Δ=K(OW,)K(OW,R)>0\Delta = K(O_{W,\varnothing}) - K(O_{W,R}) > 0। पेपर साबित करता है कि जटिलता अंतर Δ\Delta जितना बड़ा होता है, उच्च परस्पर एल्गोरिथमिक सूचना वाले विश्व-नियामक युग्म उतने ही अधिक पसंद किए जाते हैं, जिससे कम M(W:R)M(W:R) के साथ Δ\Delta की वृद्धि के साथ घातांकीय रूप से असंभव हो जाता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

  1. शास्त्रीय नियामक प्रमेय की सीमाएं: कोनेंट और एशबी (1970) द्वारा प्रस्तावित अच्छे नियामक प्रमेय (GRT) का दावा है कि "प्रत्येक अच्छा नियामक प्रणाली का मॉडल होना चाहिए", लेकिन यह प्रमेय "मॉडल" और "अच्छा" की परिभाषाओं में बहुत व्यापक है और प्रमाण पर्याप्त रूप से कठोर नहीं है।
  2. आंतरिक मॉडल सिद्धांत की सीमाएं: आधुनिक नियंत्रण सिद्धांत में आंतरिक मॉडल सिद्धांत (IMP) हालांकि कठोर है, लेकिन मुख्य रूप से रैखिक समय-अपरिवर्तनीय (LTI) प्रणालियों पर लागू होता है, और अरैखिक प्रणालियों के लिए इसका सामान्यीकरण अतिरिक्त संरचनात्मक मान्यताओं की आवश्यकता है।
  3. तंत्रिका विज्ञान सिद्धांत की आवश्यकता: मुक्त ऊर्जा सिद्धांत और कोलमोगोरोव/एल्गोरिथमिक एजेंट सिद्धांत जैसे भविष्यसूचक मस्तिष्क सिद्धांतों को "एजेंट को विश्व मॉडल होना चाहिए" के विचार को समर्थन देने के लिए अधिक सामान्य सैद्धांतिक आधार की आवश्यकता है।

अनुसंधान प्रेरणा

लेखक का उद्देश्य है:

  • एक वितरण-अज्ञेयवादी, व्यक्तिगत अनुक्रमों के लिए लागू नियमन सिद्धांत प्रदान करना
  • रैखिक मान्यताओं और संभाव्यता मॉडलों की सीमाओं को दूर करना
  • एल्गोरिथमिक सूचना सिद्धांत ढांचे के तहत नियामक प्रमेय स्थापित करना
  • तंत्रिका विज्ञान और संज्ञानात्मक विज्ञान के लिए अधिक कठोर सैद्धांतिक आधार प्रदान करना

मुख्य योगदान

  1. एल्गोरिथमिक नियामक ढांचा प्रस्तावित करना: एल्गोरिथमिक सूचना सिद्धांत के आधार पर नियामक की "अच्छाई" के मानदंड को पुनः परिभाषित करना, आउटपुट की संपीड़नशीलता को मूल्यांकन के आधार के रूप में उपयोग करना
  2. तीन मुख्य प्रमेय स्थापित करना:
    • पश्चवर्ती रूप प्रमेय: दिए गए अवलोकन आउटपुट x के लिए प्रोग्राम का पश्चवर्ती वितरण
    • विपरीत नियामक प्रमेय: जटिलता अंतर और परस्पर एल्गोरिथमिक सूचना के बीच घातांकीय संबंध साबित करना
    • लक्ष्य फलन अनुमान प्रमेय: नियामक अदिश लक्ष्य फलन की पहचान करना
  3. वितरण-अज्ञेयवादी सिद्धांत प्रदान करना: संभाव्यता वितरण मान्यताओं पर निर्भर नहीं, एकल वास्तविकता अनुक्रमों के लिए लागू
  4. आंतरिक मॉडल सिद्धांत को पूरक करना: सूचना सिद्धांत स्तर पर IMP के संरचनात्मक आवश्यक शर्तों को पूरक करना

विधि विवरण

कार्य परिभाषा

नियतात्मक युग्मित विश्व-नियामक प्रणाली (W,R)(W,R) का अध्ययन करना, जहां:

  • WW: विश्व प्रोग्राम (3-टेप ट्यूरिंग मशीन)
  • RR: नियामक प्रोग्राम (3-टेप ट्यूरिंग मशीन)
  • NN: निर्धारित समय सीमा
  • x=OW,R(N)x = O^{(N)}_{W,R}: नियामक सक्षम होने पर विश्व आउटपुट
  • y=OW,(N)y = O^{(N)}_{W,\varnothing}: नियामक अक्षम होने पर विश्व आउटपुट

मुख्य परिभाषाएं

एल्गोरिथमिक "आंतरिक मॉडल" परिभाषा

निर्धारित सीमा NN को देखते हुए, यदि M(W:R)>0M(W:R) > 0 (जो K(WR)<K(W)K(W|R) < K(W) के बराबर है), तो RR को एल्गोरिथमिक अर्थ में WW का आंतरिक मॉडल होना कहा जाता है।

अच्छे एल्गोरिथमिक नियामक की परिभाषा

जटिलता अंतर को परिभाषित करें: Δ:=K(OW,(N))K(OW,R(N))\Delta := K(O^{(N)}_{W,\varnothing}) - K(O^{(N)}_{W,R})

यदि Δ>0\Delta > 0, तो RR को सीमा NN के तहत WW का अच्छा एल्गोरिथमिक नियामक कहा जाता है।

मुख्य प्रमेय

प्रमेय 3.1: प्रोग्राम पश्चवर्ती रूप

P((W,R)x)[1c~2,1c~1]2K(x)K(W,R)<1c~2M(W:R)P((W,R)|x) \in \left[\frac{1}{\tilde{c}_2}, \frac{1}{\tilde{c}_1}\right] \cdot 2^{K(x)-K(W,R)} < \frac{1}{\tilde{c}} 2^{M(W:R)}

प्रमेय 3.2: संभाव्यता नियामक प्रमेय

Δ:=K(OW,(N))K(OW,R(N))\Delta := K(O^{(N)}_{W,\varnothing}) - K(O^{(N)}_{W,R}) को परिभाषित करें, तो एक स्थिरांक C>0C > 0 मौजूद है जैसे: P((W,R)OW,R(N),EbR)C2M(W:R)2ΔP((W,R)|O^{(N)}_{W,R}, E^R_b) \leq C \cdot 2^{M(W:R)} 2^{-\Delta}

इसका अर्थ है कि M(W:R)M(W:R) में Δ\Delta के प्रत्येक बिट की कमी के लिए, पश्चवर्ती समर्थन लगभग 212^{-1} के कारक से नुकसान उठाता है।

प्रमेय 3.3: लक्ष्य फलन अनुमान

सार्वभौमिक पूर्व माप के तहत: log2m(OW,R(N))m(OW,(N))=K(OW,(N))K(OW,R(N))±O(1)\log_2 \frac{m(O^{(N)}_{W,R})}{m(O^{(N)}_{W,\varnothing})} = K(O^{(N)}_{W,\varnothing}) - K(O^{(N)}_{W,R}) \pm O(1)

अर्थात् वास्तविकता के एपिसोड पर, नियामक ऐसे कार्य करता है जैसे वह K(OW,R(N))K(O^{(N)}_{W,R}) को न्यूनतम कर रहा हो।

तकनीकी नवाचार बिंदु

  1. संपीड़न दृष्टिकोण का नियमन: नियमन को आउटपुट को अधिक संपीड़नीय बनाने की प्रक्रिया के रूप में परिभाषित करना, नियंत्रण सिद्धांत और सूचना सिद्धांत को जोड़ना
  2. विपरीत विश्लेषण: नियामक के सक्षम/अक्षम होने पर जटिलता अंतर की तुलना करके नियमन प्रभाव का मूल्यांकन करना
  3. सार्वभौमिक पूर्व: सोलोमोनॉफ-लेविन सार्वभौमिक वितरण का उपयोग करके वितरण-अज्ञेयवादी विश्लेषण ढांचा प्रदान करना
  4. 3-टेप ट्यूरिंग मशीन मॉडल: मानक कम्प्यूटेशनल मॉडल का उपयोग करके परिणामों की सार्वभौमिकता सुनिश्चित करना

सैद्धांतिक विश्लेषण

आंतरिक मॉडल सिद्धांत के साथ संबंध

पेपर AIT ढांचे और IMP के बीच अंतर की विस्तार से तुलना करता है:

पहलूIMPAIT ढांचा
मान्यताएंLTI प्रणाली, संरचनात्मक मान्यताएंआर्किटेक्चर-अज्ञेयवादी, नियतात्मक युग्मन
"मॉडल" परिभाषागतिशील प्रतिलिपिएल्गोरिथमिक निर्भरता M(W:R)>0M(W:R) > 0
आवश्यकतासंरचनात्मकसूचना सिद्धांत संबंधी
लागू सीमाशास्त्रीय नियमनएकल एपिसोड, वितरण-अज्ञेयवादी

व्यावहारिक अनुमान

चूंकि कोलमोगोरोव जटिलता अगणनीय है, व्यावहार में निम्नलिखित का उपयोग किया जाता है:

  • लेम्पेल-जिव संपीड़क: K()K(\cdot) के ऊपरी सीमा अनुमान के रूप में
  • ब्लॉक विघटन विधि (BDM): छोटे ब्लॉक की जटिलता तालिका खोज के माध्यम से
  • तंत्रिका नेटवर्क संपीड़क: परिवर्तनशील ऑटोएनकोडर आदि पर आधारित

घरेलू थर्मोस्टेट उदाहरण

पेपर ढांचे के अनुप्रयोग को समझाने के लिए थर्मोस्टेट का उदाहरण देता है:

  • विश्व WW: कमरे की ऊष्मागतिकी + बाहरी व्यवधान
  • नियामक RR: थर्मोस्टेट तर्क
  • आउटपुट xx: कमरे का तापमान या त्रुटि संकेत
  • अच्छा नियामक: तापमान को नियमित मृत क्षेत्र पैटर्न के भीतर रखता है, बिना नियमन की स्थिति की तुलना में अधिक संपीड़नीय

संबंधित कार्य

शास्त्रीय नियमन सिद्धांत

  1. कोनेंट-एशबी GRT (1970): अग्रणी कार्य, लेकिन परिभाषाएं अस्पष्ट हैं
  2. फ्रांसिस-वोनहैम IMP (1975-76): रैखिक प्रणालियों के लिए कठोर परिणाम
  3. अरैखिक आउटपुट नियमन: अतिरिक्त समाधानशीलता और स्थिरता शर्तों की आवश्यकता है

एल्गोरिथमिक सूचना सिद्धांत

  1. सोलोमोनॉफ प्रेरण: सार्वभौमिक पूर्व और कोडिंग प्रमेय
  2. कोलमोगोरोव जटिलता: व्यक्तिगत अनुक्रमों की जटिलता का माप
  3. न्यूनतम विवरण लंबाई: मॉडल चयन और संपीड़न का संबंध

तंत्रिका विज्ञान सिद्धांत

  1. मुक्त ऊर्जा सिद्धांत: जैविक एजेंट परिवर्तनशील मुक्त ऊर्जा को न्यूनतम करते हैं
  2. भविष्यसूचक कोडिंग: मस्तिष्क एक भविष्यसूचक मशीन के रूप में
  3. एल्गोरिथमिक एजेंट सिद्धांत: संपीड़न मॉडल पर आधारित चेतना सिद्धांत

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. एल्गोरिथमिक आवश्यकता: निरंतर जटिलता लाभ Δ>0\Delta > 0 कम M(W:R)M(W:R) को घातांकीय रूप से असंभव बनाता है
  2. नियामक लक्ष्य: कोडिंग प्रमेय नियामक अदिश लक्ष्य फलन की पहचान करता है
  3. एजेंट व्याख्या: नियामक ऐसे कार्य करता है जैसे वह विवरण लंबाई को न्यूनतम कर रहा हो

सीमाएं

  1. कम्प्यूटेशनल अव्यावहारिकता: कोलमोगोरोव जटिलता अगणनीय है, अनुमान की आवश्यकता है
  2. एकल एपिसोड सीमा: परिणाम व्यक्तिगत वास्तविकता पर आधारित हैं, विश्वास बढ़ाने के लिए कई अवलोकनों की आवश्यकता हो सकती है
  3. निदान आवश्यकता: विपरीत प्रभावी होने के लिए उपयुक्त पठन संकेत चुनने की आवश्यकता है
  4. स्थिरांक कारक: मशीन-संबंधित स्थिरांक व्यावहार में काफी बड़े हो सकते हैं

भविष्य की दिशाएं

  1. बहु-एपिसोड विस्तार: कई एपिसोड में संचित साक्ष्य का अध्ययन करना
  2. अनुमानित एल्गोरिथम: कोलमोगोरोव जटिलता अनुमान के लिए बेहतर विधियां विकसित करना
  3. प्रायोगिक सत्यापन: वास्तविक नियंत्रण प्रणालियों में ढांचे का परीक्षण करना
  4. तंत्रिका विज्ञान अनुप्रयोग: मस्तिष्क कार्य अनुसंधान में सिद्धांत लागू करना

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक कठोरता: शास्त्रीय नियामक प्रमेय का कठोर एल्गोरिथमिक सूचना सिद्धांत संस्करण प्रदान करता है
  2. सार्वभौमिक प्रयोज्यता: रैखिक या संभाव्यता मान्यताओं पर निर्भर नहीं, व्यापक लागू सीमा
  3. गहन अंतर्दृष्टि: नियमन को संपीड़न से जोड़ता है, नई सैद्धांतिक दृष्टि प्रदान करता है
  4. अंतःविषय मूल्य: तंत्रिका विज्ञान और संज्ञानात्मक विज्ञान के लिए सैद्धांतिक आधार प्रदान करता है

कमियां

  1. व्यावहारिक चुनौतियां: कोलमोगोरोव जटिलता की अगणनीयता सीधे अनुप्रयोग को सीमित करती है
  2. अनुभवजन्य सत्यापन की कमी: बड़े पैमाने पर वास्तविक प्रणालियों का सत्यापन अभाव
  3. स्थिरांक निर्भरता: परिणामों में स्थिरांक कारक व्यावहारिक अनुप्रयोग प्रभाव को प्रभावित कर सकते हैं
  4. एकल दृष्टिकोण: मुख्य रूप से सूचना सिद्धांत दृष्टिकोण पर केंद्रित, अन्य महत्वपूर्ण कारकों को नज़रअंदाज़ कर सकता है

प्रभाव

  1. सैद्धांतिक योगदान: नियंत्रण सिद्धांत के लिए नया सूचना सिद्धांत आधार प्रदान करता है
  2. अंतःविषय पुल: नियंत्रण सिद्धांत, सूचना सिद्धांत और तंत्रिका विज्ञान को जोड़ता है
  3. पद्धति नवाचार: प्रणाली सिद्धांत में AIT के अनुप्रयोग की संभावना प्रदर्शित करता है
  4. भविष्य अनुसंधान: संबंधित क्षेत्रों में बाद के अनुसंधान के लिए आधार तैयार करता है

लागू परिदृश्य

  1. सैद्धांतिक विश्लेषण: नियंत्रण प्रणालियों के सैद्धांतिक विश्लेषण और समझ के लिए उपयुक्त
  2. प्रणाली निदान: यह मूल्यांकन करने के लिए उपयोग किया जा सकता है कि क्या नियंत्रण प्रणाली में उपयुक्त विश्व मॉडल है
  3. तंत्रिका विज्ञान अनुसंधान: मस्तिष्क के भविष्यसूचक कार्य का अध्ययन करने के लिए मात्रात्मक ढांचा प्रदान करता है
  4. कृत्रिम बुद्धिमत्ता: विश्व मॉडल वाली बुद्धिमान प्रणालियों के डिजाइन के लिए मार्गदर्शन प्रदान करता है

संदर्भ

पेपर 65 महत्वपूर्ण संदर्भों का हवाला देता है, मुख्य रूप से:

  1. कोनेंट और एशबी (1970): "प्रत्येक अच्छा नियामक एक प्रणाली का मॉडल होना चाहिए"
  2. फ्रांसिस और वोनहैम (1975, 1976): आंतरिक मॉडल सिद्धांत का मूल कार्य
  3. ली और विटानी (2019): कोलमोगोरोव जटिलता की अधिकृत पाठ्यपुस्तक
  4. सोलोमोनॉफ (1964): एल्गोरिथमिक संभाव्यता सिद्धांत की स्थापना
  5. ग्रुनवाल्ड (2007): न्यूनतम विवरण लंबाई सिद्धांत
  6. फ्रिस्टन: मुक्त ऊर्जा सिद्धांत संबंधित कार्य
  7. रुफिनी: एल्गोरिथमिक एजेंट सिद्धांत में लेखक का पूर्व कार्य

समग्र मूल्यांकन: यह सैद्धांतिक रूप से बहुत कठोर और गहन पेपर है, जो एल्गोरिथमिक सूचना सिद्धांत को नियंत्रण सिद्धांत में सफलतापूर्वक प्रस्तुत करता है और शास्त्रीय नियामक प्रमेय के लिए नया दृष्टिकोण प्रदान करता है। हालांकि व्यावहारिकता के संदर्भ में चुनौतियां मौजूद हैं, लेकिन इसके सैद्धांतिक योगदान और अंतःविषय मूल्य इसे संबंधित क्षेत्रों का महत्वपूर्ण कार्य बनाते हैं।