A non-commutative algorithm for multiplying 4x4 matrices using 48 non-complex multiplications
Dumas, Pernet, Sedoglavic
The quest for non-commutative matrix multiplication algorithms in small dimensions has seen a lot of recent improvements recently. In particular, the number of scalar multiplications required to multiply two $4\times4$ matrices was first reduced in \cite{Fawzi:2022aa} from 49 (two recursion levels of Strassen's algorithm) to 47 but only in characteristic 2 or more recently to 48 in \cite{alphaevolve} but over complex numbers. We propose an algorithm in 48 multiplications with only rational coefficients, hence removing the complex number requirement. It was derived from the latter one, under the action of an isotropy which happen to project the algorithm on the field of rational numbers. We also produce a straight line program of this algorithm, reducing the leading constant in the complexity, as well as an alternative basis variant of it, leading to an algorithm running in $7 n^{2+\frac{\log_2 3}{2}} +o\left(n^{2+\frac{log_2 3}{2}}\right)$ operations over any ring containing an inverse of 2.
academic
خوارزمية غير تبديلية لضرب مصفوفات 4×4 باستخدام 48 عملية ضرب غير معقدة
تقدم هذه الورقة خوارزمية غير تبديلية لحساب ضرب مصفوفات 4×4 باستخدام 48 عملية ضرب عددية فقط، مع استخدام معاملات أعداد نسبية بحتة دون الحاجة إلى أعداد معقدة. يمثل هذا تحسناً على خوارزمية AlphaEvolve11 المقترحة في المجال المعقد، من خلال إسقاطها على المجال النسبي باستخدام تحويلات متساوية القياس (isotropy). تقدم الورقة أيضاً تنفيذ برنامج خط مستقيم (straight-line program)، وتقدم متغير أساس بديل يحقق تعقيداً حسابياً قدره 7n2+2log23+o(n2+2log23) على أي حلقة تحتوي على معكوس العدد 2.
المشكلة الأساسية: البحث عن خوارزميات غير تبديلية مثلى لضرب المصفوفات ذات الأبعاد الصغيرة، خاصة تقليل عدد عمليات الضرب العددية المطلوبة. يعتبر ضرب المصفوفات عملية أساسية في علوم الحاسوب والحساب العددي، وتؤثر كفاءتها بشكل مباشر على أداء العديد من التطبيقات.
الأهمية:
يؤثر التعقيد الزمني لضرب المصفوفات بشكل مباشر على كفاءة الحسابات الجبرية الخطية والتعلم الآلي والحساب العلمي
قدمت خوارزمية Strassen (1969) أول تحسين لتعقيد الوقت من O(n3) إلى O(n2.81)، مما فتح مجال البحث عن خوارزميات ضرب مصفوفات سريعة
يمكن تطبيق خوارزميات ضرب المصفوفات ذات الأبعاد الصغيرة بشكل تكراري على مصفوفات أكبر، مما يوفر قيمة تطبيقية عملية
قيود الطرق الموجودة:
تتطلب خوارزمية Strassen 49 عملية ضرب على مصفوفات 4×4 (تطبيقان متكرران)
حقق Fawzi وآخرون 5 47 عملية ضرب في الحقول ذات الخاصية 2
استخدمت AlphaEvolve 11 نماذج لغة كبيرة وعملاء ترميز تطوري لإيجاد خوارزمية بـ 48 عملية ضرب، لكنها تتطلب معاملات معقدة
تحد المعاملات المعقدة من تطبيق الخوارزمية على بعض الحلقات (مثل حلقة الأعداد الصحيحة والحقول المحدودة)
الدافع البحثي:
إزالة متطلبات الأعداد المعقدة، مما يجعل الخوارزمية قابلة للتطبيق على هياكل جبرية أوسع
الاستفادة من التماثلات في نظرية تحليل الموترات (تأثيرات مجموعات متساوية القياس) لتحويل الخوارزميات بشكل منهجي
توفير تنفيذ برنامج خط مستقيم عملي، مع تحسين الحدود الثابتة
المساهمة النظرية الرئيسية: إثبات وجود نقاط أعداد نسبية في مدار متساوي القياس (isotropy orbit) لخوارزمية AlphaEvolve، وتقديم خوارزمية بمعاملات أعداد نسبية بحتة بـ 48 عملية ضرب
المساهمة المنهجية: تطبيق منهجي لنظرية مجموعات متساوية القياس في تحليل الموترات، من خلال تحويلات متساوية القياس (المعادلة 24) لإسقاط خوارزمية المجال المعقد على المجال النسبي
المساهمة العملية:
توفير تنفيذ برنامج خط مستقيم كامل (القوائم 1-4)، بإجمالي 341 عملية
حد التعقيد النظري: 11.65625n2.792−10.65625n2
توفير متغير أساس بديل يتطلب فقط 6 عمليات (1+2+3)، بتعقيد 7n2.792
العمومية: تنطبق الخوارزمية على أي حلقة تحتوي على معكوس العدد 2، مما يوسع نطاق التطبيق
التنفيذ مفتوح المصدر: جميع المصفوفات والأكواد متاحة علناً في مكتبة PLinOpt
الإدخال: مصفوفتان 4×4 بحجم A=(aij) و B=(bij)، مع عناصر من حلقة R تحتوي على 21 الإخراج: مصفوفة الناتج C=A⋅B=(cij) القيود: تقليل عدد عمليات الضرب العددية، مع استخدام معاملات أعداد نسبية فقط (تجنب الأعداد المعقدة)
بعد تطبيق التحويل أعلاه، نحصل على تحليل 48 موتر برتبة واحدة (المعادلات 25-72)، كل منها بالشكل:
mi=(∑j,kαjk(i)ajk)⊗(∑j,kβjk(i)bjk)⊗(∑j,kγjk(i)cjk)
الخصائص الرئيسية:
جميع المعاملات α,β,γ∈{−1,−21,0,21,1} (أعداد نسبية)
نوع الموتر هو 16X2Y2Z2+32XYZ (16 موتر برتبة 2×2×2، و 32 موتر برتبة 1×1×1)
الاستفادة المنهجية من التماثلات: بدلاً من البحث بالمحاولة والخطأ، تم استخدام مجموعة المثبتات (C2×D4)⋊C2 والتخمين الموجه نظرياً لإيجاد التحويل متساوي القياس
إسقاط من الأعداد المعقدة إلى الأعداد النسبية: إثبات أن الخوارزمية الموجودة في الفضاء المعقد عالي الأبعاد يمكن إسقاطها على فضاء جزئي نسبي، وهذه نتيجة غير تافهة
تحسين برنامج الخط المستقيم:
استخدام أداة PLinOpt لتوليد برنامج خط مستقيم محسّن تلقائياً
تقليل عدد العمليات من خلال تحليل النواة (kernel decomposition)
حتى عندما تكون معاملات مصفوفة R بسيطة، قد يتطلب برنامج الخط المستقيم الأمثل عمليات ضرب غير تافهة
طريقة الأساس البديل: من خلال تغيير الأساس (change of basis)، يمكن تبسيط العمليات بشكل أكبر، مما يقلل العمليات إلى 336 (مقارنة بـ 341 الأصلية)
تنفيذ كامل: توفير برنامج خط مستقيم ومصفوفات LRP، قابلة للاستخدام المباشر
إمكانية إعادة الإنتاج: جميع البيانات والأكواد متاحة علناً في مكتبة PLinOpt
قابلية التطبيق الواسعة: المعاملات الأعداد النسبية تسمح باستخدام الخوارزمية على الأعداد الصحيحة والأعداد النسبية والحقول المحدودة (الخاصية الفردية) وغيرها
هذه ورقة بحثية عالية الجودة في علوم الحاسوب النظرية، تنجح في تحويل خوارزمية معقدة مكتشفة بالذكاء الاصطناعي إلى خوارزمية أعداد نسبية، بأهمية نظرية كبيرة وقيمة عملية معينة. المزايا الرئيسية للورقة هي:
حل مشكلة عملية: قيود المعاملات المعقدة في AlphaEvolve
الطريقة صارمة: بناءً على نظرية تحليل الموترات ومجموعات متساوية القياس الناضجة
التنفيذ كامل: توفير تنفيذ مفتوح المصدر قابل للإعادة
أوجه القصور الرئيسية هي:
اكتشاف التحويل متساوي القياس لا يزال يتطلب تخمينات يدوية
نقص تحليل الأداء الفعلية والاستقرار العددي
الحد الثابت الكبير يحد من القيمة العملية
مؤشر التوصية: ⭐⭐⭐⭐ (4 من 5)
موصى به للباحثين المهتمين بالحساب الرمزي وتحليل الموترات والخوارزميات السريعة. بالنسبة للتطبيقات العملية، يجب تقييم ما إذا كانت أفضل من الطرق التقليدية بناءً على السيناريو المحدد.