2025-11-23T18:13:16.980826

Unraveling the Black Box of Neural Networks: A Dynamic Extremum Mapper

Chen
We point out that neural networks are not black boxes, and their generalization stems from the ability to dynamically map a dataset to the extrema of the model function. We further prove that the number of extrema in a neural network is positively correlated with the number of its parameters. We then propose a new algorithm that is significantly different from back-propagation algorithm, which mainly obtains the values of parameters by solving a system of linear equations. Some difficult situations, such as gradient vanishing and overfitting, can be simply explained and dealt with in this framework.
academic

Раскрытие "чёрного ящика" нейронных сетей: динамический картограф экстремумов

Основная информация

  • ID статьи: 2507.03885
  • Название: Unraveling the Black Box of Neural Networks: A Dynamic Extremum Mapper
  • Автор: Shengjian Chen (Intelligent Robotics Center, Jihua Laboratory)
  • Категория: cs.LG (Машинное обучение)
  • Дата публикации: препринт arXiv (версия от 10 октября 2025 г.)
  • Ссылка на статью: https://arxiv.org/abs/2507.03885v3

Аннотация

В данной работе утверждается, что нейронные сети не являются "чёрным ящиком", а их способность к обобщению обусловлена динамическим отображением набора данных на точки экстремума функции модели. Автор доказывает, что количество экстремальных точек в нейронной сети положительно коррелирует с количеством параметров и предлагает новый алгоритм, существенно отличающийся от алгоритма обратного распространения ошибки, основанный главным образом на решении систем линейных уравнений. В рамках этого подхода можно просто объяснить и решить такие сложные проблемы, как исчезновение градиента и переобучение.

Научный контекст и мотивация

Постановка проблемы

Несмотря на то, что модели искусственного интеллекта на основе нейронных сетей достигли превосходящей точности прогнозирования по сравнению с традиционными алгоритмами машинного обучения в таких областях, как распознавание изображений и обработка естественного языка, механизмы их работы остаются недостаточно изученными и широко рассматриваются как "чёрный ящик".

Значимость исследования

  1. Требования безопасности: в областях, требующих высокой надёжности и безопасности в реальном времени, таких как автономное вождение, необходимо понимание принципов работы нейронных сетей
  2. Диагностика неисправностей: при возникновении проблем в модели невозможно быстро выявить источник ошибки и немедленно её устранить
  3. Совершенствование теории: требуется математическое объяснение механизмов работы нейронных сетей, а не только инженерные подходы

Ограничения существующих методов

  1. Методы интерпретации: в основном анализируют связи между входом и выходом, но остаётся ещё много нерешённых вопросов
  2. Теория информационного узкого места: хотя и предоставляет полезные ориентиры, но не предлагает конкретных методов решения параметров
  3. Теорема универсальной аппроксимации: Кибенко и Хорник доказали, что прямые нейронные сети могут аппроксимировать произвольные непрерывные функции, но не предоставили методов нахождения конкретной функции

Основные вклады

  1. Характеристики идеальной модели машинного обучения: предложены основные характеристики идеальной модели машинного обучения и на их основе предоставлены универсальные этапы обучения модели
  2. Теория экстремального отображения: математически доказано, что нейронные сети достигают обобщения путём отображения набора данных на локальные экстремумы функции; предложен алгоритм приращения экстремума (EI)
  3. Унифицированная схема объяснения проблем: на основе алгоритма EI можно относительно легко объяснить причины исчезновения/взрыва градиента, переобучения и других классических проблем, а также предложить соответствующие решения

Подробное описание методов

Общие характеристики идеальной модели

Точное отображение

Автор сначала определяет характеристики идеальной модели: для набора данных D = {(x^(i), y^(i))|i ∈ 1, 3} целью является нахождение функции F такой, что y^(i) = F(x^(i)). При наличии образцов одного типа кривая функции должна изменять форму для включения новых образцов, образуя несколько локальных экстремальных точек.

Ослабленное отображение

Когда параметры функции ограничены, степень изменения формы кривой ограничена, и количество экстремальных точек не может увеличиваться произвольно. Решение заключается в расширении сущности от одной точки к интервалу, концентрируя образцы с немного отличающейся поверхностью, но одинаковой сущностью в этом интервале.

Преобразование N-классификации в бинарную классификацию

Преобразование функции N-классификации F в N функций бинарной классификации {F_j|j ∈ 1,N}, где j-я функция бинарной классификации F_j определяет, принадлежит ли входной образец j-й сущности класса:

F_j(x^(i)) = {UB, y^(i) = j
              {LB, y^(i) ≠ j

Анализ экстремальных точек нейронной сети

Декомпозиция модели

Автор разлагает нейронную сеть на множество составных функций {h_v^n|v ∈ 1,ln}, где каждая составная функция фактически представляет задачу бинарной классификации.

Математический вывод экстремальных точек

Для функции h_v^u выражение имеет вид:

h_v^[u](x) = S(∑_{k=1}^{l_{u-1}} w_{v,k}^[u] * h_k^[u-1](x))

Путём вычисления частных производных и приравнивания их к нулю получается однородная система линейных уравнений:

L(n,v) = {∑_{k=1}^{l_{n-1}} w_{v,k}^[n] * ∂h_k^[n-1](x)/∂x_t = 0 | t ∈ [1,m]}

Когда l_ > m, система имеет бесконечное множество решений, что является основной причиной сильной способности нейронной сети к обобщению.

Схема алгоритма EI

Основная идея алгоритма

Основные этапы алгоритма EI существенно отличаются от алгоритма обратного распространения:

  1. Алгоритм BP использует обновление градиента для приближения к идеальным значениям параметров; алгоритм EI напрямую получает значения параметров путём решения систем уравнений
  2. Алгоритм BP требует обновления всех параметров на каждой итерации; алгоритм EI требует обновления только части параметров

Процедура алгоритма

  1. Инициализация: ручная разметка набора образцов, инициализация набора параметров W ненулевыми вещественными числами
  2. Послойное решение: последовательное выполнение обновления параметров от последнего скрытого слоя к первому скрытому слою
  3. Операция поляризации: выбор частного решения W^u:n, удовлетворяющего условиям завершения, из общего решения W^u:n
  4. Обновление параметров: если найдено частное решение, параметры обновляются; в противном случае вводятся дополнительные параметры

Оптимизация вычислительной сложности

Снижение вычислительной сложности путём ослабления условий завершения и введения концепции окрестности поверхности:

  • Использование ослабленных условий завершения, требующих только, чтобы значение функции классификации образца было значительно больше значений других функций классификации
  • Использование окрестности поверхности, применяя строгие условия только к репрезентативным образцам

Теоретический анализ и объяснение проблем

Исчезновение/взрыв градиента

  • Исчезновение градиента: в рамках алгоритма EI, если можно найти частное решение из общего решения W^u:n, параметры более ранних скрытых слоёв могут сохранять начальные значения, поэтому исчезновение градиента является неизбежным результатом
  • Взрыв градиента: соответствует случаю, когда система уравнений не имеет решения; решение заключается в увеличении количества скрытых слоёв или параметров в каждом слое

Переобучение

Переобучение по сути является врождённой характеристикой ограниченного количества экстремальных точек при ограниченных параметрах. Решения:

  1. Увеличение количества скрытых слоёв или параметров в каждом слое
  2. Использование операции кластеризации для размещения большего количества образцов в нейронной сети с фиксированной структурой

Влияние шума

Концепция окрестности поверхности объясняет, как образцы с шумом могут значительно отклоняться от окрестности исходных образцов, что приводит к неправильной обработке нейронной сетью.

Мелкие/глубокие сети

Количество образцов, которые нейронная сеть может точно аппроксимировать, в основном положительно коррелирует с общим количеством параметров сети и не имеет необходимой связи с глубиной сети. Рекомендуется использовать сетевую архитектуру "наклонной трапеции".

Обсуждение и ограничения

Нерешённые проблемы

  1. Алгоритм поляризации: кроме перебора, ещё не предложен эффективный алгоритм нахождения частного решения из общего решения
  2. Анализ выходного слоя: требуется полный анализ частных производных функции softmax
  3. Функции активации: как анализировать случаи недифференцируемых функций, таких как ReLU
  4. Проблема седловых точек: точки, где первые частные производные равны нулю, могут быть седловыми точками, а не экстремальными точками

Исследование альтернативных функций

Другие функции с аналогичной динамической вариативностью (такие как синусоидальные функции, полиномы) могут обладать аналогичной сильной способностью к обобщению.

Глубокая оценка

Преимущества

  1. Теоретическая инновация: раскрывает сущность способности нейронных сетей к обобщению с математической точки зрения, дополняя теорему универсальной аппроксимации
  2. Унифицированное объяснение проблем: объясняет исчезновение градиента, переобучение и другие классические проблемы в единой схеме
  3. Инновация алгоритма: предлагает алгоритм EI, существенно отличающийся от алгоритма BP, предоставляя новые идеи для обучения нейронных сетей
  4. Математическая строгость: основан на строгих математических выводах, преобразуя проблемы нейронных сетей в решение однородных систем линейных уравнений

Недостатки

  1. Ограничения практического применения: отсутствие эффективного алгоритма поляризации ограничивает практическое применение алгоритма EI
  2. Недостаточная экспериментальная верификация: статья в основном содержит теоретический анализ, не хватает достаточной экспериментальной верификации
  3. Ограничения области применения: анализ в основном основан на полносвязных сетях и функциях активации сигмоида
  4. Вычислительная сложность: хотя предложены оптимизационные решения, вычислительная сложность для крупномасштабного применения всё ещё требует верификации

Влияние

  1. Теоретический вклад: предоставляет новую математическую схему для исследования интерпретируемости нейронных сетей
  2. Практическое руководство: предоставляет теоретическое руководство для проектирования сетевой архитектуры и инициализации параметров
  3. Направление исследований: открывает новое направление исследования нейронных сетей с точки зрения экстремального отображения

Применимые сценарии

  1. Теоретические исследования: применимо к исследованиям интерпретируемости и теоретического анализа нейронных сетей
  2. Инициализация параметров: может служить модулем инициализации для алгоритма BP
  3. Проектирование сети: предоставляет руководство для проектирования сетевой архитектуры с конкретными требованиями к точности

Заключение

В данной работе раскрыты принципы работы нейронных сетей с математической точки зрения, предложена схема алгоритма EI на основе экстремального отображения. Хотя требуется дальнейшее совершенствование в практическом применении (в частности, алгоритм поляризации), работа предоставляет важный вклад в теоретическое понимание и исследование интерпретируемости нейронных сетей. Данное исследование имеет потенциал стать важным мостом, соединяющим "чёрный ящик" нейронных сетей с математической интерпретируемостью.

Библиография

  • Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function
  • Hornik, K., et al. (1989). Multilayer feedforward networks are universal approximators
  • Tishby, N. & Zaslavsky, N. (2015). Deep learning and the information bottleneck principle