This paper introduces a novel collaborative neurodynamic model for computing nonnegative Canonical Polyadic Decomposition (CPD). The model relies on a system of recurrent neural networks to solve the underlying nonconvex optimization problem associated with nonnegative CPD. Additionally, a discrete-time version of the continuous neural network is developed. To enhance the chances of reaching a potential global minimum, the recurrent neural networks are allowed to communicate and exchange information through particle swarm optimization (PSO). Convergence and stability analyses of both the continuous and discrete neurodynamic models are thoroughly examined. Experimental evaluations are conducted on random and real-world datasets to demonstrate the effectiveness of the proposed approach.
- معرّف الورقة: 2411.18127
- العنوان: Nonnegative Tensor Decomposition Via Collaborative Neurodynamic Optimization
- المؤلفون: Salman Ahmadi-Asl, Valentin Leplat, Anh-Huy Phan, Andrzej Cichocki
- التصنيف: math.NA cs.NA
- تاريخ النشر: تم تقديمه إلى arXiv في 1 يناير 2025
- رابط الورقة: https://arxiv.org/abs/2411.18127
تقترح هذه الورقة نموذج ديناميكا عصبية تعاونية جديد لحساب تحلل متعدد الحدود الكنسي غير السالب (Canonical Polyadic Decomposition, CPD). يعتمد النموذج على أنظمة الشبكات العصبية المتكررة لحل مشكلة التحسين غير المحدبة الأساسية المرتبطة بـ CPD غير السالب. بالإضافة إلى ذلك، تم تطوير نسخة زمنية منفصلة من الشبكة العصبية المستمرة. لتعزيز فرص الوصول إلى الحد الأدنى العام المحتمل، يتم تحقيق التواصل وتبادل المعلومات بين الشبكات العصبية المتكررة من خلال تحسين سرب الجزيئات (PSO). تم إجراء تحليل معمق للتقارب والاستقرار لنماذج الديناميكا العصبية المستمرة والمنفصلة. تم إجراء تقييم تجريبي على مجموعات البيانات العشوائية والحقيقية، مما يثبت فعالية الطريقة المقترحة.
يعتبر تحلل الموتر أداة مهمة في التعلم الآلي وعلوم البيانات، خاصة تحلل متعدد الحدود الكنسي (CPD)، الذي يحلل موتراً عالي الرتبة إلى مجموع أقل عدد من موترات الرتبة الأولى. يحمل تحلل CPD غير السالب أهمية كبيرة في العديد من التطبيقات العملية، مثل ضغط البيانات، واستكمال المصفوفات، وتحديد Hammerstein والتجميع.
- مشكلة الحد الأدنى المحلي: تميل الخوارزميات التكرارية التقليدية مثل المربعات الصغرى البديلة الهرمية (HALS) والمربعات الصغرى البديلة (ALS) إلى الوقوع في حلول محلية مثلى
- سرعة التقارب: بالنسبة للموترات الصعبة ذات مصفوفات العوامل عالية الخطية المشتركة، تتقارب الطرق الموجودة ببطء
- تحديات التحسين العام: تحلل CPD غير السالب هو مشكلة تحسين غير محدبة، وإيجاد الحل الأمثل العام يشكل تحدياً
على الرغم من أن تحسين الديناميكا العصبية التعاونية أظهر قدرات قوية في مشاكل التحسين المحدبة وغير المحدبة، إلا أن البحث في تطبيقه على تحلل الموتر محدود جداً. تهدف هذه الورقة إلى ملء هذه الفجوة بواسطة اقتراح طريقة تحلل موتر غير سالب بناءً على الديناميكا العصبية التعاونية.
- اقتراح نموذج ديناميكا عصبية تعاونية لحساب CPD، وهو أول دراسة شاملة تمدد تحسين الديناميكا العصبية التعاونية إلى تحلل الموتر
- تطوير شبكة عصبية إسقاطية زمنية منفصلة لـ CPD غير السالب، توفير نسخة منفصلة عملية من النموذج المستمر
- تطوير نسخة معجلة من خلال استراتيجية تكييف Hessian، تحسين سرعة التقارب لنماذج الديناميكا العصبية المستمرة والمنفصلة
- توفير تحليل نظري شامل للتقارب والاستقرار، إثبات التقارب العام للخوارزمية
- إظهار أداء متفوقة على موترات البيانات عالية الخطية المشتركة، مناسبة بشكل خاص لمعالجة مشاكل تحلل الموتر الصعبة
بالنظر إلى موتر N-ترتيب X∈RI1×I2×⋯×IN، يتم تعريف مشكلة CPD غير السالب على النحو التالي:
minA(1)≥0,…,A(N)≥0∥X−[[A(1),A(2),…,A(N)]]∥F2
حيث A(n)∈RIn×R هي مصفوفة العامل النوني، و R هي رتبة الموتر.
بالنسبة للموتر ثلاثي الرتبة، يتم تعريف نظام الديناميكا العصبية على النحو التالي:
ϵ1dtdA=−A+[A−∇AF(A,B,C)PA−1]+ϵ2dtdB=−B+[B−∇BF(A,B,C)PB−1]+ϵ3dtdC=−C+[C−∇CF(A,B,C)PC−1]+
حيث:
- F(A,B,C)=21∥X−[[A,B,C]]∥F2 هي دالة الهدف
- PA=(CTC)∗(BTB) هي مصفوفة تكييف Hessian
- [⋅]+ تمثل دالة التفعيل للإسقاط على الربع غير السالب
النسخة المنفصلة من النموذج المستمر هي:
Ak+1=Ak+λk(−Ak+[A~k]+)Bk+1=Bk+λk(−Bk+[B~k]+)Ck+1=Ck+λk(−Ck+[C~k]+)
حيث A~k=Ak−∇AF(Ak,Bk,Ck).
يتم تحقيق التعاون بين شبكات عصبية متعددة من خلال تحسين سرب الجزيئات (PSO):
vn(k+1)=αvn(k)+β1γ1(pn(k)−xn(k))+β2γ2(pbest(k)−xn(k))xn(k+1)=xn(k)+vn(k+1)
حيث pn(k) هي أفضل موضع للجزيء النوني، و pbest(k) هي الموضع الأمثل العام.
- الديناميكا العصبية متعددة المقاييس الزمنية: استخدام ثوابت زمنية مختلفة ϵ1,ϵ2,ϵ3 يسمح لمصفوفات العوامل بالتحديث بسرعات مختلفة
- تكييف Hessian: تسريع التقارب من خلال مصفوفات التكييف مثل PA−1
- آلية التحوير الموجي: استخدام دوال Gabor الموجية لتعزيز القدرة البحثية عندما تكون تنوع الجزيئات منخفضاً جداً
- طريقة الحاجز اللوغاريتمي: توفير بديل لتحويل التحسين المقيد إلى تحسين غير مقيد
- مجموعات البيانات الاصطناعية:
- موترات صعبة: 9×9×9، الرتبة R=10-16
- موترات عالية الخطية المشتركة: 20×20×20، الرتبة R=10
- موترات واسعة النطاق: 70×70×70، الرتبة R=75
- مجموعات البيانات الحقيقية:
- COIL20: مجموعة بيانات صور 32×32×1440
- YALE: مجموعة بيانات وجوه 32×32×165
- ORL: مجموعة بيانات وجوه 32×32×400
- الصور فائقة الطيفية: Cuprite (120×120×180)، Urban (120×120×162)، Jasper Ridge (100×100×198)
يتم تعريف الخطأ النسبي على النحو التالي:
Relative error=∥X∥F∥X−[[A(1),A(2),A(3)]]∥F
- HALS (المربعات الصغرى البديلة الهرمية)
- MUR (قواعد التحديث الضربية)
- CCG, CGP, BFGSP, GradP وطرق تحسين أخرى
- ANLS (المربعات الصغرى البديلة غير السالبة)
- Proco-ALS
- معاملات PSO: α=0.5, β₁=β₂=0.01
- عتبة التنوع δ لتفعيل التحوير الموجي
- استخدام بحث backtracking لتحديد حجم الخطوة
- حجم السكان q=5-30 (يتم التعديل حسب احتياجات التجربة)
على موتر 9×9×9 برتبة R=10، يصل CNO-CPD إلى خطأ نسبي 10⁻⁶ في 600 تكرار، متفوقاً بشكل ملحوظ على جميع طرق الأساس. فشلت طريقة ANLS في اختبارات متعددة، بينما أظهر CNO-CPD أداءً مستقراً.
بالنسبة للموترات ذات مصفوفات العوامل عالية الخطية المشتركة (μ≥0.96):
- الحالة الأولى (مصفوفة عامل واحدة عالية الخطية المشتركة): يتقارب CNO-CPD إلى خطأ 10⁻⁶ في 200 تكرار
- الحالة الثانية (مصفوفتا عامل عالية الخطية المشتركة): يظهر CNO-CPD أداءً متفوقاً بالمثل، بينما تتقارب طرق الأساس ببطء
على موتر 70×70×70 برتبة R=75، فشلت طرق BFGSP و Proco-ALS، بينما تقارب CNO-CPD بنجاح وتفوق على الطرق الأخرى.
- COIL20, YALE, ORL: حقق CNO-CPD قيمة دالة هدف أقل على جميع مجموعات البيانات
- الصور فائقة الطيفية: على مجموعات بيانات Cuprite و Urban و Jasper Ridge، أظهر CNO-CPD سرعة تقارب أسرع
- تأثير حجم السكان: مع زيادة حجم السكان من 5 إلى 30، ينخفض الخطأ النسبي بشكل ملحوظ، مما يثبت فعالية آلية التعاون
- منفصل مقابل مستمر: تتفوق الطريقة شبه الضمنية المنفصلة على الطرق الصريحة الكاملة وطرق التنظيم المكعبة
- ODE الكلاسيكية مقابل الحاجز اللوغاريتمي: تتفوق صيغة ODE الكلاسيكية على طريقة الحاجز اللوغاريتمي
يُظهر التصور باستخدام t-SNE أن مصفوفات العوامل المستخرجة بواسطة CNO-CPD يمكن استخدامها بفعالية لمهام التجميع، مما يُظهر هياكل تجميع جيدة على مجموعات بيانات COIL20 و ORL و YALE.
على الرغم من أن تعقيد التكرار الواحد لـ CNO-CPD أعلى (بسبب إعادة التهيئة وحل ODE)، بالنسبة للموترات عالية الخطية المشتركة، يصل CNO-CPD إلى دقة 10⁻⁴ في 20 ثانية، بينما تحتاج HALS إلى 100 ثانية للوصول إلى دقة 10⁻¹.
تشمل الطرق التقليدية HALS و ALS و MUR وغيرها، وهذه الطرق تعتمد على استراتيجيات التحسين البديلة، لكنها تميل إلى الوقوع في الحد الأدنى المحلي.
تم تطبيقها على تحلل LU و تحلل Cholesky واستعادة الإشارات المتناثرة وتحلل المصفوفات غير السالبة وغيرها، لكن تطبيقها في تحلل الموتر محدود.
مقارنة بالأعمال الموجودة، تطبق هذه الورقة لأول مرة بشكل منهجي الديناميكا العصبية التعاونية على تحلل الموتر، وتوفر تحليلاً نظرياً شاملاً والتحقق التجريبي.
- يمكن لـ CNO-CPD حل مشكلة تحلل الموتر غير السالب بفعالية، وهي مناسبة بشكل خاص للموترات الصعبة ذات الخطية المشتركة العالية
- يثبت التحليل النظري التقارب العام للخوارزمية
- تتحقق نتائج التجارب من الأداء المتفوقة للطريقة على مجموعات بيانات متنوعة
- التعقيد الحسابي: بالنسبة للموترات واسعة النطاق، يتطلب نظام الديناميكا المستمر خطوات زمنية أكبر، مع تكلفة حسابية أعلى
- حساسية المعاملات: تحتاج معاملات PSO وحجم السكان إلى التعديل حسب المشكلة المحددة
- متطلبات الذاكرة: يتطلب تكييف Hessian مساحة ذاكرة O(R²)
- توسيع الديناميكا العصبية التعاونية إلى تحللات موتر أخرى (تحلل Tucker، تحلل حلقة الموتر، إلخ)
- استكشاف تحلل الموتر غير السالب بناءً على تباعد Kullback-Leibler وتباعد Alpha-Beta
- تطوير استراتيجيات متوازية للتعامل مع موترات فائقة الحجم
- الاكتمال النظري: توفير تحليل شامل للتقارب والاستقرار لنماذج منفصلة ومستمرة
- جدة الطريقة: أول تطبيق منهجي للديناميكا العصبية التعاونية على تحلل الموتر
- كفاية التجارب: التحقق التجريبي الشامل على مجموعات بيانات اصطناعية وحقيقية
- القيمة العملية: مناسبة بشكل خاص لمعالجة مشاكل تحلل الموتر الصعبة ذات الخطية المشتركة العالية
- الكفاءة الحسابية: التعقيد الحسابي لكل تكرار أعلى مقارنة بالطرق التقليدية
- ضبط المعاملات: يتطلب تعديل معاملات PSO متعددة، مما يزيد من تعقيد الاستخدام
- قابلية التوسع: تحتاج قدرة المعالجة للموترات فائقة الحجم إلى التحقق الإضافي
- المساهمة الأكاديمية: إدخال نموذج تحسين جديد لمجال تحلل الموتر
- آفاق التطبيق: لديها إمكانيات تطبيق واسعة في التعلم الآلي ومعالجة الإشارات والتنقيب عن البيانات
- قابلية الاستنساخ: يوفر المؤلفون تنفيذ الكود، مما يسهل الاستنساخ والبحث الإضافي
- تحلل الموتر لمصفوفات العوامل عالية الخطية المشتركة
- مشاكل تحلل الموتر غير السالب التي تتطلب تحسيناً عاماً
- سيناريوهات التطبيق التي تتطلب جودة تحلل عالية (مثل معالجة الصور فائقة الطيفية وتحليل التجميع)
تستشهد الورقة بـ 55 مرجعاً ذا صلة، تغطي مجالات متعددة بما في ذلك تحلل الموتر وتحسين الديناميكا العصبية وتحسين سرب الجزيئات، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الشامل: هذه ورقة أكاديمية عالية الجودة، تتمتع بأداء ممتازة في الابتكار النظري واكتمال الطريقة والتحقق التجريبي. على الرغم من وجود بعض القيود في الكفاءة الحسابية، فإن مزاياها في معالجة مشاكل تحلل الموتر الصعبة تمنحها قيمة أكاديمية وآفاق تطبيقية مهمة.