We introduce NAEL (Non-Anthropocentric Ethical Logic), a novel ethical framework for artificial agents grounded in active inference and symbolic reasoning. Departing from conventional, human-centred approaches to AI ethics, NAEL formalizes ethical behaviour as an emergent property of intelligent systems minimizing global expected free energy in dynamic, multi-agent environments. We propose a neuro-symbolic architecture to allow agents to evaluate the ethical consequences of their actions in uncertain settings. The proposed system addresses the limitations of existing ethical models by allowing agents to develop context-sensitive, adaptive, and relational ethical behaviour without presupposing anthropomorphic moral intuitions. A case study involving ethical resource distribution illustrates NAEL's dynamic balancing of self-preservation, epistemic learning, and collective welfare.
यह पेपर NAEL (गैर-मानवकेंद्रित नैतिक तर्क) प्रस्तावित करता है, जो सक्रिय अनुमान और प्रतीकात्मक तर्क पर आधारित कृत्रिम बुद्धिमत्ता एजेंटों के लिए एक नई नैतिक रूपरेखा है। पारंपरिक मानव-केंद्रित AI नैतिकता के तरीकों के विपरीत, NAEL नैतिक व्यवहार को गतिशील बहु-एजेंट वातावरण में बुद्धिमान प्रणालियों द्वारा वैश्विक अपेक्षित मुक्त ऊर्जा को कम करने की उदीयमान संपत्ति के रूप में औपचारिक बनाता है। पेपर एक तंत्रिका-प्रतीकात्मक आर्किटेक्चर प्रस्तावित करता है जो एजेंटों को अनिश्चित वातावरण में अपने कार्यों के नैतिक परिणामों का मूल्यांकन करने में सक्षम बनाता है। यह प्रणाली एजेंटों को मानव-रूपी नैतिक अंतर्ज्ञान को पूर्वनिर्धारित किए बिना संदर्भ-संवेदनशील, अनुकूलनीय और संबंधपरक नैतिक व्यवहार विकसित करने की अनुमति देकर मौजूदा नैतिक मॉडल की सीमाओं को संबोधित करती है।
जैसे-जैसे AI प्रणालियां स्वास्थ्यसेवा, पर्यावरणीय शासन जैसे उच्च-जोखिम निर्णय लेने में अधिक भाग लेती हैं, नैतिक तर्क क्षमता वाली मशीनें डिजाइन करना तेजी से जरूरी हो गया है। हालांकि, मौजूदा मशीन नैतिकता मॉडल में मौलिक समस्याएं हैं:
मानवकेंद्रवाद की सीमाएं: मौजूदा तरीके या तो मानव नैतिक सिद्धांतों को कठोरता से कोडित करते हैं, या मानव संज्ञानात्मक आर्किटेक्चर की नकल करते हैं। यह धारणा न केवल AI की अभिव्यक्ति क्षमता को सीमित करती है, बल्कि मनुष्यों और कृत्रिम एजेंटों के बीच संज्ञानात्मक और ऑन्टोलॉजिकल अंतरों को नजरअंदाज करती है।
दार्शनिक स्तर की चुनौतियां: क्या नैतिकता को बाहर से सार्थक रूप से लागू किया जा सकता है, या इसे एजेंट के अपने अनुभव और अंतःक्रिया से उदीयमान होना चाहिए? यदि AI एजेंटों की धारणा और संज्ञानात्मक आधार मनुष्यों से मौलिक रूप से भिन्न हैं, तो वे नैतिक व्यवहार कैसे विकसित करते हैं?
लेखकों का मानना है कि AI में नैतिक तर्क को मानव मानदंडों की नकल के रूप में मॉडल नहीं किया जाना चाहिए, बल्कि एजेंट और वातावरण के निरंतर अंतःक्रिया पर आधारित एक औपचारिक उदीयमान प्रक्रिया के रूप में होना चाहिए। यह दृष्टिकोण वस्तु-उन्मुख ऑन्टोलॉजी और स्वदेशी AI डिजाइन के हाल के काम के अनुरूप है, जहां नैतिकता पदानुक्रमीय के बजाय संबंधपरक रूप से उदीयमान होती है।
सक्रिय अनुमान परिवर्तनशील मुक्त ऊर्जा न्यूनीकरण पर आधारित धारणा, कार्य और सीखने का एक एकीकृत सिद्धांत है। औपचारिक रूप से, दो असंयुक्त श्रेणियों पर विचार करें: संभावित अवलोकन O और विश्व की (छिपी हुई) स्थिति S। एजेंट के पास है:
जनरेटिव मॉडल: संभाव्यता वितरण P: O×S → 0,1 का उत्पादन करता है
पहचान वितरण: Q: S → 0,1, एजेंट की वर्तमान स्थिति में विश्वास को मापता है
अवलोकन o∈O दिया गया है, परिवर्तनशील मुक्त ऊर्जा को इस प्रकार परिभाषित किया गया है:
F(o) = E_Q[log Q(s) - log P(o,s)]
NAEL में, एजेंट न केवल अपनी स्वयं की अपेक्षित मुक्त ऊर्जा को कम करता है, बल्कि अन्य एजेंटों और वातावरण की (भविष्यसूचक) मुक्त ऊर्जा का अनुमान लगाता है और एकीकृत करता है, स्वार्थी अनुकूलन से संबंधपरक, सहयोगी नैतिक तर्क में परिवर्तन को प्राप्त करता है।
NAEL का मूल नवाचार वैश्विक अपेक्षित मुक्त ऊर्जा की अवधारणा है:
G_global = Σ(i=1 to N) E_Qi[F_i] + F_env
जहां:
Q_i एजेंट i का परिवर्तनशील पश्च है
F_i इसकी मुक्त ऊर्जा है
F_env पारिस्थितिक अनिश्चितता पर विचार करता है
यह सूत्रीकरण संबंधपरक पारस्परिक निर्भरता पर आधारित सहयोगी नैतिकता को लागू करता है, दूसरों को नुकसान को कम करना और पर्यावरणीय पूर्वानुमेयता को बनाए रखना नैतिक रूप से वांछनीय परिणामों के रूप में देखता है।
NAEL एजेंट सीखने के नियमों के माध्यम से अपने नैतिक दृष्टिकोण को अपडेट करते हैं:
θ_{t+1} = θ_t - η∇_θ E[F_global]
जहां θ नैतिक नीति मॉडल के पैरामीटर हैं, η सीखने की दर है। ग्रेडिएंट-आधारित सीखना नैतिक मापदंडों को समय के साथ विकसित होने की अनुमति देता है, पर्यावरणीय जटिलता, सामाजिक अंतःक्रिया और सांस्कृतिक परिवर्तन के प्रति प्रतिक्रिया करता है।
हालांकि A1 अधिक प्रत्यक्ष दायित्वों को पूरा कर सकता है, A2 जैव विविधता की रक्षा करके और पारिस्थितिक पतन को कम करके दीर्घकालिक वैश्विक मुक्त ऊर्जा को बेहतर तरीके से कम कर सकता है।
NAEL AI नैतिकता में एक प्रतिमान परिवर्तन का प्रतिनिधित्व करता है, स्थिर नियमों से गतिशील उदीयमान प्रक्रिया की ओर। नैतिक तर्क को मानव मानदंडों की नकल के बजाय अनिश्चितता न्यूनीकरण पर आधारित करके, NAEL कृत्रिम प्रणालियों के लिए नैतिक तर्क का एक नया मॉडल प्रदान करता है।
पेपर कई महत्वपूर्ण सीमाओं को ईमानदारी से स्वीकार करता है:
कम्प्यूटेशनल जटिलता: बड़े पैमाने पर अनुप्रयोगों में, कई एजेंटों और प्रणालियों में वैश्विक अपेक्षित मुक्त ऊर्जा का मूल्यांकन करना कठिन हो सकता है
व्याख्यात्मकता: हालांकि प्रतीकात्मक तर्क पारदर्शिता बढ़ाता है, निरंतर तर्क और असतत तर्क के बीच अंतःक्रिया अपारदर्शी सीमांत मामलों का उत्पादन कर सकती है
सत्यापन समस्या: स्व-अनुकूलनीय प्रणालियों में, नैतिक सुरक्षा के औपचारिक गारंटी अभी भी एक खुली चुनौती हैं
पेपर 19 प्रमुख संदर्भों का हवाला देता है, जिसमें शामिल हैं:
सक्रिय अनुमान सैद्धांतिक आधार 5, 15, 19
प्रतीकात्मक तर्क औपचारिकीकरण 6, 7, 8, 9
AI नैतिकता और दार्शनिक आधार 2, 4, 14, 17
संबंधित तकनीकी विधियां 11, 18
समग्र मूल्यांकन: यह एक महत्वपूर्ण सैद्धांतिक योगदान वाला पेपर है जो AI नैतिकता के क्षेत्र में एक नई प्रतिमान प्रस्तावित करता है। हालांकि प्रयोगात्मक सत्यापन और इंजीनियरिंग कार्यान्वयन के पहलुओं में सुधार की आवश्यकता है, लेकिन इसकी सैद्धांतिक नवाचार और अंतःविषय एकीकरण क्षमता इसे इस क्षेत्र का एक महत्वपूर्ण योगदान बनाती है। पेपर का गैर-मानवकेंद्रित दृष्टिकोण भविष्य की AI प्रणालियों की नैतिक डिजाइन के लिए मूल्यवान नई सोच प्रदान करता है।