A non-commutative algorithm for multiplying 4x4 matrices using 48 non-complex multiplications
Dumas, Pernet, Sedoglavic
The quest for non-commutative matrix multiplication algorithms in small dimensions has seen a lot of recent improvements recently. In particular, the number of scalar multiplications required to multiply two $4\times4$ matrices was first reduced in \cite{Fawzi:2022aa} from 49 (two recursion levels of Strassen's algorithm) to 47 but only in characteristic 2 or more recently to 48 in \cite{alphaevolve} but over complex numbers. We propose an algorithm in 48 multiplications with only rational coefficients, hence removing the complex number requirement. It was derived from the latter one, under the action of an isotropy which happen to project the algorithm on the field of rational numbers. We also produce a straight line program of this algorithm, reducing the leading constant in the complexity, as well as an alternative basis variant of it, leading to an algorithm running in $7 n^{2+\frac{\log_2 3}{2}} +o\left(n^{2+\frac{log_2 3}{2}}\right)$ operations over any ring containing an inverse of 2.
academic
Некоммутативный алгоритм умножения матриц 4×4 с использованием 48 скалярных умножений
В статье предложен алгоритм вычисления произведения матриц размером 4×4 с использованием 48 скалярных умножений, использующий только рациональные коэффициенты без привлечения комплексных чисел. Это улучшение алгоритма в комплексной области, предложенного AlphaEvolve11, достигнутое путём проектирования на поле рациональных чисел с помощью изотропных преобразований. Статья содержит реализацию в виде прямолинейной программы и предлагает альтернативный вариант базиса, обеспечивающий сложность 7n2+2log23+o(n2+2log23) в произвольном кольце, содержащем обратный элемент к 2.
Основная задача: Поиск оптимальных некоммутативных алгоритмов умножения матриц малых размеров, в частности снижение требуемого количества скалярных умножений. Умножение матриц является фундаментальной операцией в информатике и численных вычислениях, его эффективность напрямую влияет на производительность многих приложений.
Значимость:
Временная сложность умножения матриц напрямую влияет на эффективность линейной алгебры, машинного обучения, научных вычислений и других областей
Алгоритм Штрассена (1969) впервые снизил сложность с O(n3) до O(n2.81), открыв направление исследований быстрого умножения матриц
Алгоритмы умножения матриц малых размеров могут применяться рекурсивно к большим матрицам, имея практическую ценность
Ограничения существующих методов:
Алгоритм Штрассена требует 49 умножений для матриц 4×4 (две рекурсивные итерации)
Fawzi и др.5 достигли 47 умножений в полях характеристики 2
AlphaEvolve11 использовал большие языковые модели и эволюционные агенты кодирования для нахождения алгоритма с 48 умножениями, но требует комплексных коэффициентов
Комплексные коэффициенты ограничивают применимость алгоритма на некоторых кольцах (целые числа, конечные поля)
Исследовательская мотивация:
Устранение требования комплексных чисел для расширения применимости алгоритма на более широкий класс алгебраических структур
Использование симметрий теории тензорного разложения (действие изотропных групп) для систематического преобразования алгоритмов
Предоставление практической реализации в виде прямолинейной программы с оптимизацией константных множителей
Главный теоретический вклад: Доказано существование рациональной точки в изотропной орбите алгоритма AlphaEvolve, предложен алгоритм с 48 умножениями с чисто рациональными коэффициентами
Методологический вклад: Систематическое применение теории изотропных групп тензорного разложения, проектирование алгоритма из комплексной области в область рациональных чисел посредством изотропных преобразований (уравнение 24)
Практический вклад:
Полная реализация в виде прямолинейной программы (Listings 1-4), всего 341 операция
Теоретическая граница сложности 11.65625n2.792−10.65625n2
Альтернативный вариант базиса, требующий всего 6 операций (1+2+3), с сложностью 7n2.792
Универсальность: Алгоритм применим к любому кольцу, содержащему обратный элемент к 2, расширяя область применения
Открытая реализация: Все матрицы и код доступны в библиотеке PLinOpt
Вход: Две матрицы размером 4×4: A=(aij) и B=(bij), элементы которых принадлежат кольцу R, содержащему 21 Выход: Матрица произведения C=A⋅B=(cij) Ограничения: Минимизация количества скалярных умножений с использованием только рациональных коэффициентов (исключение комплексных чисел)
После применения указанного преобразования получается разложение на 48 тензоров ранга один (уравнения 25-72), каждый имеет вид:
mi=(∑j,kαjk(i)ajk)⊗(∑j,kβjk(i)bjk)⊗(∑j,kγjk(i)cjk)
Ключевые свойства:
Все коэффициенты α,β,γ∈{−1,−21,0,21,1} (рациональные числа)
Систематизированное использование симметрий: Вместо поиска методом проб и ошибок используется теория стабилизаторов (C2×D4)⋊C2 и теоретически обоснованные предположения для нахождения изотропного преобразования
Проектирование из комплексных чисел в рациональные: Доказано, что алгоритм, найденный в высокомерном комплексном пространстве, может быть спроектирован в подпространство рациональных чисел — нетривиальный результат
Оптимизация прямолинейной программы:
Использование инструмента PLinOpt для автоматического генерирования оптимизированной прямолинейной программы
Снижение количества операций через разложение ядра (kernel decomposition)
Даже при простых коэффициентах матрицы R оптимальная SLP может требовать нетривиальных умножений
Альтернативный метод базиса: Дальнейшее упрощение через замену базиса (change of basis) сокращает операции до 336 (в сравнении с исходными 341)
Доказательство существования: Доказано, что в изотропной орбите алгоритма AlphaEvolve действительно существует рациональная точка, что не является очевидным
Простота коэффициентов: Все коэффициенты принадлежат множеству {−1,−21,0,21,1}, что облегчает реализацию
Парадокс оптимизации: Хотя матрица R содержит только коэффициенты из {−1,0,1}, оптимальная прямолинейная программа всё равно требует нетривиальных умножений (из-за разложения ядра)
Преимущество альтернативного базиса: Замена базиса позволяет снизить главную константу с 11.66 до 7.00, при этом затраты на замену базиса составляют o(n2.792)
Fawzi и др. (2022) 5: Использование обучения с подкреплением для открытия алгоритма с 47 умножениями в характеристике 2
Kaporin (2024) 8: Использование нелинейного метода наименьших квадратов для решения уравнений Брента в комплексной области
AlphaEvolve (2025) 11: Использование больших языковых моделей и эволюционных агентов для открытия алгоритма с 48 умножениями (комплексный) и 63 умножениями (3×4×7)
Заполнение важного пробела: Решена проблема ограничения комплексных коэффициентов алгоритма AlphaEvolve, имеющая практическое значение
Методологическая инновация: Систематическое применение теории изотропных групп, предоставлено теоретическое обоснование пути от комплексных чисел к рациональным
Математическая строгость: Основано на теории тензорной геометрии Ландсберга с прочной алгебро-геометрической базой
Полная реализация: Предоставлены прямолинейная программа и матрицы LRP, готовые к использованию
Открытая воспроизводимость: Все данные и код доступны в библиотеке PLinOpt
Широкая применимость: Рациональные коэффициенты позволяют использовать алгоритм на целых числах, рациональных числах, конечных полях нечётной характеристики и т.д.
Это высококачественная работа в области теоретической информатики, успешно преобразовавшая алгоритм, открытый ИИ в комплексной области, в алгоритм с рациональными коэффициентами. Работа имеет значительную теоретическую ценность и определённую практическую значимость. Основные достоинства:
Решение практической проблемы: Устранено ограничение комплексных коэффициентов AlphaEvolve
Строгая методология: Основано на зрелой теории тензорного разложения и изотропных групп
Открытие изотропного преобразования всё ещё требует ручного подбора
Отсутствует анализ практической производительности и численной стабильности
Большие константные множители ограничивают практическую применимость
Рекомендуемая оценка: ⭐⭐⭐⭐ (4/5)
Рекомендуется для ознакомления исследователям, интересующимся символьными вычислениями, тензорным разложением и быстрыми алгоритмами. Для практического применения необходимо оценить преимущества в конкретном сценарии использования.