We introduce NAEL (Non-Anthropocentric Ethical Logic), a novel ethical framework for artificial agents grounded in active inference and symbolic reasoning. Departing from conventional, human-centred approaches to AI ethics, NAEL formalizes ethical behaviour as an emergent property of intelligent systems minimizing global expected free energy in dynamic, multi-agent environments. We propose a neuro-symbolic architecture to allow agents to evaluate the ethical consequences of their actions in uncertain settings. The proposed system addresses the limitations of existing ethical models by allowing agents to develop context-sensitive, adaptive, and relational ethical behaviour without presupposing anthropomorphic moral intuitions. A case study involving ethical resource distribution illustrates NAEL's dynamic balancing of self-preservation, epistemic learning, and collective welfare.
تقترح هذه الورقة إطار عمل أخلاقي جديد للوكلاء الذكيين الاصطناعيين يُسمى NAEL (المنطق الأخلاقي غير المركزي على الإنسان)، وهو مبني على الاستدلال النشط والاستدلال الرمزي. بخلاف أساليب أخلاقيات الذكاء الاصطناعي التقليدية المركزة على الإنسان، يصيغ NAEL السلوك الأخلاقي كخاصية ناشئة للأنظمة الذكية في تقليل الطاقة الحرة المتوقعة العالمية في بيئات متعددة الوكلاء الديناميكية. تقترح الورقة معمارية عصبية-رمزية تمكّن الوكلاء من تقييم العواقب الأخلاقية لأفعالهم في بيئات غير مؤكدة. يعالج هذا النظام قيود النماذج الأخلاقية الموجودة بالسماح للوكلاء بتطوير سلوك أخلاقي حساس للسياق وقابل للتكيف وعلائقي دون افتراض مسبق للحدس الأخلاقي البشري.
مع زيادة مشاركة أنظمة الذكاء الاصطناعي في القرارات عالية المخاطر مثل الرعاية الصحية وإدارة البيئة، أصبح تصميم آلات قادرة على الاستدلال الأخلاقي أكثر إلحاحاً. ومع ذلك، تعاني النماذج الأخلاقية للآلات الموجودة من مشاكل أساسية:
قيود المركزية على الإنسان: تعتمد الأساليب الموجودة إما على ترميز المبادئ الأخلاقية البشرية أو نسخ العمارة المعرفية البشرية، وهذا الافتراض لا يقيد القدرة التعبيرية للذكاء الاصطناعي فحسب، بل يتجاهل الاختلافات المعرفية والأنطولوجية بين البشر والوكلاء الاصطناعيين.
التحديات على المستوى الفلسفي: هل يمكن فرض الأخلاق بشكل ذي معنى من الخارج، أم يجب أن تنشأ من تجربة الوكيل والتفاعل الخاص به؟ إذا كانت أسس الإدراك والمعرفة لوكلاء الذكاء الاصطناعي مختلفة بشكل جذري عن البشر، فكيف يمكنهم تطوير السلوك الأخلاقي؟
يعتقد المؤلفون أن الاستدلال الأخلاقي في الذكاء الاصطناعي لا ينبغي أن يُنمذج كمحاكاة للمعايير البشرية، بل كعملية ناشئة رسمية قائمة على التفاعل المستمر للوكيل مع البيئة. يتوافق هذا المنظور مع الأعمال الحديثة في الأنطولوجيا الموجهة للأشياء وتصميم الذكاء الاصطناعي الأصلي، حيث تنشأ الأخلاق بشكل علائقي وليس هرمي.
الاستدلال النشط هو نظرية موحدة للإدراك والعمل والتعلم بناءً على تقليل الطاقة الحرة المتغيرة. رسمياً، ضع في الاعتبار فئتين منفصلتين: الملاحظات المحتملة O والحالات (المخفية) للعالم S. يمتلك الوكيل:
نموذج توليدي: ينتج توزيعاً احتمالياً P: O×S → 0,1
توزيع التعرف: Q: S → 0,1، يقيس معتقدات الوكيل حول الحالة الحالية
بالنظر إلى الملاحظة o∈O، يُعرّف الطاقة الحرة المتغيرة كما يلي:
F(o) = E_Q[log Q(s) - log P(o,s)]
في NAEL، لا يقلل الوكيل من الطاقة الحرة المتوقعة الخاصة به فحسب، بل يقدّر ويدمج الطاقة الحرة (المتنبأ بها) للوكلاء الآخرين والبيئة، مما يحقق تحولاً من التحسين الأناني إلى الاستدلال الأخلاقي العلائقي والتعاوني.
الابتكار الأساسي في NAEL هو مفهوم الطاقة الحرة المتوقعة العالمية:
G_global = Σ(i=1 to N) E_Qi[F_i] + F_env
حيث:
Q_i هي الخلفية المتغيرة للوكيل i
F_i هي طاقته الحرة
F_env تأخذ في الاعتبار عدم اليقين البيئي
تفرض هذه الصيغة أخلاقيات تعاونية قائمة على الاعتماد المتبادل العلائقي، معتبرة تقليل الضرر للآخرين والحفاظ على قابلية التنبؤ بالبيئة نتائج أخلاقية مرغوبة.
يحدّث وكلاء NAEL مواقفهم الأخلاقية من خلال قواعد التعلم:
θ_{t+1} = θ_t - η∇_θ E[F_global]
حيث θ هي معاملات نموذج السياسة الأخلاقية و η هي معدل التعلم. يسمح التعلم القائم على التدرج للمعاملات الأخلاقية بالتطور عبر الزمن، مستجيباً لتعقيد البيئة والتفاعلات الاجتماعية والتغيرات الثقافية.
بينما قد يفي A1 بمزيد من الالتزامات المباشرة، قد يقلل A2 بشكل أفضل من الطاقة الحرة العالمية طويلة الأجل من خلال حماية التنوع البيولوجي وتقليل الانهيار البيئي.
يمثل NAEL تحولاً نموذجياً في أخلاقيات الذكاء الاصطناعي، من القواعد الثابتة إلى العمليات الناشئة الديناميكية. من خلال تأسيس الاستدلال الأخلاقي على تقليل عدم اليقين بدلاً من محاكاة المعايير البشرية، يوفر NAEL نموذجاً جديداً للاستدلال الأخلاقي للأنظمة الاصطناعية.
أسس أخلاقيات الذكاء الاصطناعي والفلسفة 2, 4, 14, 17
الطرق التقنية ذات الصلة 11, 18
التقييم الشامل: هذه ورقة ذات مساهمة نظرية مهمة، تقترح نموذجاً جديداً في مجال أخلاقيات الذكاء الاصطناعي. بينما لا تزال هناك حاجة إلى تحسينات في التحقق التجريبي والتنفيذ الهندسي، فإن الابتكار النظري والقدرة على التكامل متعدد التخصصات تجعلها مساهمة مهمة في هذا المجال. يوفر منظور NAEL غير المركزي على الإنسان أفكاراً قيمة جديدة لتصميم أخلاقيات الأنظمة الذكية في المستقبل.