We introduce NAEL (Non-Anthropocentric Ethical Logic), a novel ethical framework for artificial agents grounded in active inference and symbolic reasoning. Departing from conventional, human-centred approaches to AI ethics, NAEL formalizes ethical behaviour as an emergent property of intelligent systems minimizing global expected free energy in dynamic, multi-agent environments. We propose a neuro-symbolic architecture to allow agents to evaluate the ethical consequences of their actions in uncertain settings. The proposed system addresses the limitations of existing ethical models by allowing agents to develop context-sensitive, adaptive, and relational ethical behaviour without presupposing anthropomorphic moral intuitions. A case study involving ethical resource distribution illustrates NAEL's dynamic balancing of self-preservation, epistemic learning, and collective welfare.
본 논문은 능동 추론(active inference)과 기호 추론(symbolic reasoning)에 기반한 인공지능 에이전트를 위한 새로운 윤리 프레임워크인 NAEL(비인간중심 윤리 논리)을 제안한다. 전통적인 인간중심 AI 윤리 접근법과 달리, NAEL은 윤리적 행동을 동적 다중 에이전트 환경에서 전역 기대 자유 에너지(global expected free energy)를 최소화하는 지능형 시스템의 창발적 속성으로 형식화한다. 본 논문은 에이전트가 불확실한 환경에서 자신의 행동의 윤리적 결과를 평가할 수 있도록 하는 신경기호 아키텍처를 제안한다. 이 시스템은 에이전트가 인간 형태의 도덕적 직관을 미리 설정하지 않고도 맥락에 민감하고 적응적이며 관계적인 윤리적 행동을 발전시킬 수 있도록 함으로써 기존 윤리 모델의 한계를 해결한다.
저자들은 AI의 윤리 추론이 인간 규범의 모방으로 모델링되어서는 안 되며, 에이전트와 환경의 지속적인 상호작용에 기반한 형식적 창발 과정으로 접근해야 한다고 주장한다. 이러한 관점은 객체지향 존재론(object-oriented ontology)과 토착 AI 설계(indigenous AI design)의 최근 연구와 일치하며, 여기서 윤리는 계층적이 아닌 관계적으로 창발한다.
종합 평가: 이는 AI 윤리 분야에서 중요한 이론적 기여를 제시하는 논문으로, 새로운 패러다임을 제안한다. 실험 검증 및 공학적 구현 측면에서 개선의 여지가 있지만, 이론적 혁신성과 학제간 통합 능력은 해당 분야의 중요한 기여를 만든다. 논문의 비인간중심 관점은 향후 AI 시스템의 윤리 설계를 위한 귀중한 새로운 사고방식을 제공한다.