We introduce NAEL (Non-Anthropocentric Ethical Logic), a novel ethical framework for artificial agents grounded in active inference and symbolic reasoning. Departing from conventional, human-centred approaches to AI ethics, NAEL formalizes ethical behaviour as an emergent property of intelligent systems minimizing global expected free energy in dynamic, multi-agent environments. We propose a neuro-symbolic architecture to allow agents to evaluate the ethical consequences of their actions in uncertain settings. The proposed system addresses the limitations of existing ethical models by allowing agents to develop context-sensitive, adaptive, and relational ethical behaviour without presupposing anthropomorphic moral intuitions. A case study involving ethical resource distribution illustrates NAEL's dynamic balancing of self-preservation, epistemic learning, and collective welfare.
В данной статье предлагается NAEL (неантропоцентрическая этическая логика) — новая этическая система для искусственных агентов, основанная на активном выводе и символическом рассуждении. В отличие от традиционных антропоцентрических подходов к этике ИИ, NAEL формализует этическое поведение как возникающее свойство интеллектуальных систем, минимизирующих глобальную ожидаемую свободную энергию в динамичной многоагентной среде. Статья предлагает нейросимволическую архитектуру, позволяющую агентам оценивать этические последствия своих действий в условиях неопределённости. Система решает ограничения существующих этических моделей, позволяя агентам развивать контекстно-чувствительное, адаптивное и реляционное этическое поведение без предварительного задания человеческих моральных интуиций.
По мере возрастающего участия систем ИИ в высокорисковых решениях в здравоохранении, управлении окружающей средой и других областях становится всё более актуальным разработка машин с этическими способностями рассуждения. Однако существующие модели машинной этики имеют фундаментальные проблемы:
Ограничения антропоцентризма: Существующие подходы либо жёстко кодируют человеческие моральные принципы, либо воспроизводят человеческую когнитивную архитектуру. Такие предположения не только ограничивают выразительные возможности ИИ, но и игнорируют когнитивные и онтологические различия между людьми и искусственными агентами.
Философические вызовы: Может ли мораль осмысленно навязываться извне или она должна возникать из опыта и взаимодействия самого агента? Если когнитивные основы ИИ-агентов принципиально отличаются от человеческих, как они могут развивать этическое поведение?
Авторы утверждают, что этическое рассуждение в ИИ не должно моделироваться как имитация человеческих норм, а должно рассматриваться как формальный процесс возникновения, основанный на постоянном взаимодействии агента с окружающей средой. Эта точка зрения согласуется с недавними работами в области объектно-ориентированной онтологии и дизайна коренного ИИ, где этика возникает релятивно, а не иерархически.
Предложена система NAEL: Неантропоцентрическая этическая логика, объединяющая активный вывод и символическое рассуждение
Разработана иерархическая нейросимволическая архитектура: Включающая слой восприятия, слой этического рассуждения и слой выбора действий
Введен принцип минимизации глобальной свободной энергии: Этическое поведение определяется как процесс минимизации общей неопределённости системы
Интегрированы различные логические формы: Объединены деонтическая логика, логика позиций и субъективная логика для обработки различных аспектов этического рассуждения
Предоставлены практические примеры применения: Демонстрация применения системы на примере распределения водных ресурсов в засушливых регионах
Активный вывод — это унифицированная теория восприятия, действия и обучения, основанная на минимизации вариационной свободной энергии. Формально рассмотрим две непересекающиеся категории: возможные наблюдения O и (скрытые) состояния мира S. Агент обладает:
Распределением признания: Q: S → 0,1, измеряющим убеждения агента о текущем состоянии
Для наблюдения o∈O вариационная свободная энергия определяется как:
F(o) = E_Q[log Q(s) - log P(o,s)]
В NAEL агент не только минимизирует собственную ожидаемую свободную энергию, но также оценивает и интегрирует (прогнозируемую) свободную энергию других агентов и окружающей среды, осуществляя переход от эгоистичной оптимизации к релятивному, кооперативному этическому рассуждению.
Эта формализация обеспечивает кооперативную этику, основанную на релятивной взаимозависимости, рассматривая минимизацию вреда другим и сохранение предсказуемости окружающей среды как этически желаемые результаты.
Агенты NAEL обновляют свои этические позиции через правила обучения:
θ_{t+1} = θ_t - η∇_θ E[F_global]
где θ — параметры модели этической политики, η — скорость обучения. Обучение на основе градиентов позволяет этическим параметрам эволюционировать во времени в ответ на сложность окружающей среды, социальные взаимодействия и культурные изменения.
A2: Распределить 40% для C1, 40% для C2, 20% для W
Хотя A1 может удовлетворять большему количеству непосредственных обязательств, A2 может лучше минимизировать долгосрочную глобальную свободную энергию, защищая биоразнообразие и снижая риск экологического коллапса.
NAEL представляет парадигматический сдвиг в этике ИИ — от статичных правил к динамичным процессам возникновения. Основывая этическое рассуждение на минимизации неопределённости, а не на имитации человеческих норм, NAEL предлагает новую модель морального рассуждения для искусственных систем.
Статья честно признаёт несколько важных ограничений:
Вычислительная сложность: В крупномасштабных приложениях оценка глобальной ожидаемой свободной энергии по множественным агентам и системам может быть неразрешимой
Интерпретируемость: Несмотря на повышение прозрачности символическим рассуждением, взаимодействие между непрерывным и дискретным логическим выводом может создавать непрозрачные граничные случаи
Проблемы верификации: В адаптивных системах формальные гарантии этической безопасности остаются открытой проблемой
Авторы предлагают несколько направлений исследований:
Расширение на многоагентные системы: Исследование многоагентных систем с конфликтующими этическими позициями
Практические приложения: Применение к экологической этике, такой как робототехника консервации и планирование климатически чувствительной инфраструктуры
Усовершенствование гибридной архитектуры: Включение нейронного обучения с подкреплением или символических иерархических байесовских моделей
Гарантии безопасности: Разработка логических задач вывода и границ свободной энергии для обеспечения гарантий безопасности и доверия
Ограниченная экспериментальная верификация: Предоставлено только одно упрощённое тематическое исследование, отсутствует крупномасштабная экспериментальная верификация
Недостаточно обоснована вычислительная осуществимость: Практическая осуществимость вычисления глобальной свободной энергии требует дополнительного анализа
Недостаточное сравнение с существующими системами: Отсутствует систематическое сравнение с другими системами этического ИИ
Неясные метрики оценки: Остаётся неясным, как объективно оценивать качество этических решений
Недостаточные гарантии безопасности: В критических приложениях гарантии безопасности и надёжности системы ещё не установлены
Общая оценка: Это статья с важным теоретическим вкладом, предлагающая новую парадигму в области этики ИИ. Хотя в экспериментальной верификации и инженерной реализации есть место для совершенствования, её теоретическая инновативность и способность к междисциплинарной интеграции делают её значительным вкладом в данную область. Неантропоцентрический подход статьи предоставляет ценные новые идеи для будущего этического проектирования систем ИИ.