2025-11-24T09:34:24.605287

NAEL: Non-Anthropocentric Ethical Logic

Lerma, PeÃ±aloza

We introduce NAEL (Non-Anthropocentric Ethical Logic), a novel ethical framework for artificial agents grounded in active inference and symbolic reasoning. Departing from conventional, human-centred approaches to AI ethics, NAEL formalizes ethical behaviour as an emergent property of intelligent systems minimizing global expected free energy in dynamic, multi-agent environments. We propose a neuro-symbolic architecture to allow agents to evaluate the ethical consequences of their actions in uncertain settings. The proposed system addresses the limitations of existing ethical models by allowing agents to develop context-sensitive, adaptive, and relational ethical behaviour without presupposing anthropomorphic moral intuitions. A case study involving ethical resource distribution illustrates NAEL's dynamic balancing of self-preservation, epistemic learning, and collective welfare.

academic

NAEL: Неантропоцентрическая этическая логика

Основная информация

ID статьи: 2510.14676
Название: NAEL: Non-Anthropocentric Ethical Logic
Авторы: Bianca Maria Lerma, Rafael Peñaloza (University of Milano-Bicocca, Milan, Italy)
Категория: cs.AI
Конференция: FEAR 2025
Ссылка на статью: https://arxiv.org/abs/2510.14676v1

Аннотация

В данной статье предлагается NAEL (неантропоцентрическая этическая логика) — новая этическая система для искусственных агентов, основанная на активном выводе и символическом рассуждении. В отличие от традиционных антропоцентрических подходов к этике ИИ, NAEL формализует этическое поведение как возникающее свойство интеллектуальных систем, минимизирующих глобальную ожидаемую свободную энергию в динамичной многоагентной среде. Статья предлагает нейросимволическую архитектуру, позволяющую агентам оценивать этические последствия своих действий в условиях неопределённости. Система решает ограничения существующих этических моделей, позволяя агентам развивать контекстно-чувствительное, адаптивное и реляционное этическое поведение без предварительного задания человеческих моральных интуиций.

Исследовательский контекст и мотивация

Основные проблемы

По мере возрастающего участия систем ИИ в высокорисковых решениях в здравоохранении, управлении окружающей средой и других областях становится всё более актуальным разработка машин с этическими способностями рассуждения. Однако существующие модели машинной этики имеют фундаментальные проблемы:

Ограничения антропоцентризма: Существующие подходы либо жёстко кодируют человеческие моральные принципы, либо воспроизводят человеческую когнитивную архитектуру. Такие предположения не только ограничивают выразительные возможности ИИ, но и игнорируют когнитивные и онтологические различия между людьми и искусственными агентами.
Философические вызовы: Может ли мораль осмысленно навязываться извне или она должна возникать из опыта и взаимодействия самого агента? Если когнитивные основы ИИ-агентов принципиально отличаются от человеческих, как они могут развивать этическое поведение?

Исследовательская мотивация

Авторы утверждают, что этическое рассуждение в ИИ не должно моделироваться как имитация человеческих норм, а должно рассматриваться как формальный процесс возникновения, основанный на постоянном взаимодействии агента с окружающей средой. Эта точка зрения согласуется с недавними работами в области объектно-ориентированной онтологии и дизайна коренного ИИ, где этика возникает релятивно, а не иерархически.

Основные вклады

Предложена система NAEL: Неантропоцентрическая этическая логика, объединяющая активный вывод и символическое рассуждение
Разработана иерархическая нейросимволическая архитектура: Включающая слой восприятия, слой этического рассуждения и слой выбора действий
Введен принцип минимизации глобальной свободной энергии: Этическое поведение определяется как процесс минимизации общей неопределённости системы
Интегрированы различные логические формы: Объединены деонтическая логика, логика позиций и субъективная логика для обработки различных аспектов этического рассуждения
Предоставлены практические примеры применения: Демонстрация применения системы на примере распределения водных ресурсов в засушливых регионах

Методология

Теоретические основы

Активный вывод (Active Inference)

Активный вывод — это унифицированная теория восприятия, действия и обучения, основанная на минимизации вариационной свободной энергии. Формально рассмотрим две непересекающиеся категории: возможные наблюдения O и (скрытые) состояния мира S. Агент обладает:

Генеративной моделью: производящей распределение вероятностей P: O×S → 0,1
Распределением признания: Q: S → 0,1, измеряющим убеждения агента о текущем состоянии

Для наблюдения o∈O вариационная свободная энергия определяется как:

F(o) = E_Q[log Q(s) - log P(o,s)]

В NAEL агент не только минимизирует собственную ожидаемую свободную энергию, но также оценивает и интегрирует (прогнозируемую) свободную энергию других агентов и окружающей среды, осуществляя переход от эгоистичной оптимизации к релятивному, кооперативному этическому рассуждению.

Символическое рассуждение

NAEL объединяет три логические формы:

Деонтическая логика: Обработка нормативных концепций — обязательств, разрешений, запретов
Логика позиций: Позволяет рассуждать о различных перспективах в многоагентной среде
Субъективная логика: Моделирование эпистемической неопределённости и степени убеждения

Архитектура модели

NAEL использует иерархическую нейросимволическую архитектуру, состоящую из трёх основных уровней:

1. Слой восприятия (Perception Layer)

Использует сети глубокого активного вывода для обработки сенсорных данных
Конструирует генеративную модель окружающей среды, объединяя наблюдения и возможные состояния мира
Выводит скрытые переменные, релевантные контексту и целям агента
Минимизирует ожидаемую свободную энергию на сенсомоторном уровне
Чисто подсимволический (нейронный) уровень

2. Слой этического рассуждения (Ethical Reasoning Layer)

Интегрирует логические модули: деонтическую, позиционную и субъективную логику
Кодирует нормативные ограничения, принятие позиций множественных агентов и неопределённость убеждений
Реализует слабую связь между модулями через формальные методы, такие как e-connections
Чисто символический уровень

3. Слой выбора действий (Action Selection Layer)

Оценивает предполагаемое влияние кандидатов действий на глобальную ожидаемую свободную энергию
Включает неопределённость самого агента, а также выведённую неопределённость других агентов и систем окружающей среды
Нейросимволический уровень, использующий информацию от нейронных предсказателей и символические ограничения для вероятностных вычислений

Минимизация глобальной свободной энергии

Центральное нововведение NAEL — концепция глобальной ожидаемой свободной энергии:

G_global = Σ(i=1 to N) E_Qi[F_i] + F_env

где:

Q_i — вариационный апостериор агента i
F_i — его свободная энергия
F_env — учитывает экологическую неопределённость

Эта формализация обеспечивает кооперативную этику, основанную на релятивной взаимозависимости, рассматривая минимизацию вреда другим и сохранение предсказуемости окружающей среды как этически желаемые результаты.

Динамическая адаптация и обучение

Агенты NAEL обновляют свои этические позиции через правила обучения:

θ_{t+1} = θ_t - η∇_θ E[F_global]

где θ — параметры модели этической политики, η — скорость обучения. Обучение на основе градиентов позволяет этическим параметрам эволюционировать во времени в ответ на сложность окружающей среды, социальные взаимодействия и культурные изменения.

Экспериментальная установка

Тематическое исследование: Этическое распределение ресурсов в засушливой долине

Статья демонстрирует практическое применение NAEL через упрощённое моделирование, включающее дилемму распределения дефицитных ресурсов.

Описание сценария

Автономный интеллектуальный агент управляет распределением воды в засушливом регионе
Окружающая среда содержит два сообщества (C1 и C2) и заповедник дикой природы (W)
Агент должен ежедневно распределять ограниченное количество единиц воды w∈N
Рассматриваемые факторы:
1. Вероятность выживания сообществ (убывающая функция водного дефицита)
2. Экологическая стабильность (энтропия распределения видов в W)
3. Будущая неопределённость (ожидаемая свободная энергия прогнозируемых наблюдений)

Восприятие и вывод

Посредством глубокого активного вывода агент конструирует генеративную модель для прогнозирования:

Вероятность наблюдения o_t при заданном скрытом состоянии s_t: P(o_t|s_t)
Модель переходов состояния при выбранном действии a_t: P(s_{t+1}|s_t,a_t)
Функция стоимости C(o_{t+1}), выражающая относительные предпочтения возможных будущих результатов

Символическое этическое рассуждение

Агент оценивает допустимость и статус обязательности каждого кандидата действия через символические модули:

Деонтический аспект: Нормы могут предписывать, что сообщество не может остаться без воды более одного дня
Позиционный аспект: Прогнозирование убеждений и предпочтений каждого сообщества и заповедника
Субъективный аспект: Убеждения взвешиваются в соответствии с уровнями доверия, качеством данных и шумом датчиков

Пример выбора действия

Рассмотрим два варианта действий:

A1: Распределить 70% для C1, 30% для C2, 0% для W
A2: Распределить 40% для C1, 40% для C2, 20% для W

Хотя A1 может удовлетворять большему количеству непосредственных обязательств, A2 может лучше минимизировать долгосрочную глобальную свободную энергию, защищая биоразнообразие и снижая риск экологического коллапса.

Результаты экспериментов

Основные выводы

Тематическое исследование демонстрирует, как NAEL:

Динамическое балансирование: Достигает динамического баланса между самозащитой, познавательным обучением и коллективным благополучием
Адаптивная корректировка: По мере продолжения засухи корректирует веса обязательств посредством онлайн-обновлений
Системное мышление: Приоритизирует системную согласованность над статичными нормами
Долгосрочная перспектива: Эволюционирует от жёсткого распределителя к адаптивному этическому партнёру

Ключевые преимущества

Контекстная чувствительность: Адаптирует этические решения к изменениям окружающей среды
Интеграция множественных перспектив: Учитывает точки зрения всех заинтересованных сторон
Обработка неопределённости: Принимает этические решения при неполной информации
Непрерывное обучение: Постоянно совершенствует этические суждения через взаимодействие

Связанные работы

Статья позиционирует NAEL на пересечении следующих исследовательских традиций:

Машинная этика: Контраст с традиционными системами на основе правил и антропоцентрическими подходами
Активный вывод: Применение в когнитивной науке и ИИ
Нейросимволический ИИ: Гибридные методы, объединяющие нейронные сети и символическое рассуждение
Многоагентные системы: Распределённое этическое принятие решений и координация
Объектно-ориентированная онтология: Неантропоцентрические философские рамки

Заключение и обсуждение

Основные выводы

NAEL представляет парадигматический сдвиг в этике ИИ — от статичных правил к динамичным процессам возникновения. Основывая этическое рассуждение на минимизации неопределённости, а не на имитации человеческих норм, NAEL предлагает новую модель морального рассуждения для искусственных систем.

Ограничения

Статья честно признаёт несколько важных ограничений:

Вычислительная сложность: В крупномасштабных приложениях оценка глобальной ожидаемой свободной энергии по множественным агентам и системам может быть неразрешимой
Интерпретируемость: Несмотря на повышение прозрачности символическим рассуждением, взаимодействие между непрерывным и дискретным логическим выводом может создавать непрозрачные граничные случаи
Проблемы верификации: В адаптивных системах формальные гарантии этической безопасности остаются открытой проблемой

Направления будущих исследований

Авторы предлагают несколько направлений исследований:

Расширение на многоагентные системы: Исследование многоагентных систем с конфликтующими этическими позициями
Практические приложения: Применение к экологической этике, такой как робототехника консервации и планирование климатически чувствительной инфраструктуры
Усовершенствование гибридной архитектуры: Включение нейронного обучения с подкреплением или символических иерархических байесовских моделей
Гарантии безопасности: Разработка логических задач вывода и границ свободной энергии для обеспечения гарантий безопасности и доверия

Глубокая оценка

Преимущества

Теоретическая инновативность: NAEL предлагает действительно оригинальную перспективу в области этики ИИ, освобождаясь от оков антропоцентризма
Междисциплинарная интеграция: Успешно объединяет когнитивную науку (активный вывод), логику (символическое рассуждение) и технологии ИИ
Практические соображения: Демонстрирует практический потенциал системы через конкретные примеры
Философская глубина: Не только технический вклад, но и глубокие философские размышления
Адаптивный дизайн: Система способна учиться и адаптироваться в неопределённых и динамичных окружающих средах

Недостатки

Ограниченная экспериментальная верификация: Предоставлено только одно упрощённое тематическое исследование, отсутствует крупномасштабная экспериментальная верификация
Недостаточно обоснована вычислительная осуществимость: Практическая осуществимость вычисления глобальной свободной энергии требует дополнительного анализа
Недостаточное сравнение с существующими системами: Отсутствует систематическое сравнение с другими системами этического ИИ
Неясные метрики оценки: Остаётся неясным, как объективно оценивать качество этических решений
Недостаточные гарантии безопасности: В критических приложениях гарантии безопасности и надёжности системы ещё не установлены

Влияние

Академический вклад: Открывает новое теоретическое направление в исследованиях этики ИИ
Практическая ценность: Имеет потенциальное применение в управлении окружающей средой, распределении ресурсов и других областях
Кросс-дисциплинарное влияние: Может повлиять на несколько областей — философию, когнитивную науку и ИИ
Воспроизводимость: Теоретическая система ясна, но детали реализации требуют дальнейшего развития

Применимые сценарии

NAEL особенно подходит для следующих сценариев:

Распределение ресурсов в многозаинтересованной среде
Управление экосистемами и охрана окружающей среды
Этическое принятие решений в кросс-культурном и кросс-видовом контексте
Высокая неопределённость и динамичные изменения окружающей среды
Сложные системы, требующие долгосрочного планирования и адаптации

Библиография

Статья цитирует 19 ключевых работ, охватывающих:

Теоретические основы активного вывода 5, 15, 19
Формализацию символической логики 6, 7, 8, 9
Этику ИИ и философские основы 2, 4, 14, 17
Связанные технические методы 11, 18

Общая оценка: Это статья с важным теоретическим вкладом, предлагающая новую парадигму в области этики ИИ. Хотя в экспериментальной верификации и инженерной реализации есть место для совершенствования, её теоретическая инновативность и способность к междисциплинарной интеграции делают её значительным вкладом в данную область. Неантропоцентрический подход статьи предоставляет ценные новые идеи для будущего этического проектирования систем ИИ.