In this work, we investigate the universal representation capacity of the Matrix Product States (MPS) from the perspective of boolean functions and continuous functions. We show that MPS can accurately realize arbitrary boolean functions by providing a construction method of the corresponding MPS structure for an arbitrarily given boolean gate. Moreover, we prove that the function space of MPS with the scale-invariant sigmoidal activation is dense in the space of continuous functions defined on a compact subspace of the $n$-dimensional real coordinate space $\mathbb{R^{n}}$. We study the relation between MPS and neural networks and show that the MPS with a scale-invariant sigmoidal function is equivalent to a one-hidden-layer neural network equipped with a kernel function. We construct the equivalent neural networks for several specific MPS models and show that non-linear kernels such as the polynomial kernel which introduces the couplings between different components of the input into the model appear naturally in the equivalent neural networks. At last, we discuss the realization of the Gaussian Process (GP) with infinitely wide MPS by studying their equivalent neural networks.
- معرّف الورقة: 2103.08277
- العنوان: نظرية التمثيل لحالات منتج المصفوفات (Representation Theorem for Matrix Product States)
- المؤلفون: إيردونج جو، ديفيد درابر (جامعة كاليفورنيا، سانتا كروز)
- التصنيف: stat.ML cs.LG cs.NE quant-ph
- تاريخ النشر: 15 مارس 2021 (نسخة أولية على arXiv)
- رابط الورقة: https://arxiv.org/abs/2103.08277
تدرس هذه الورقة القدرة التمثيلية العامة لحالات منتج المصفوفات (Matrix Product States, MPS) من منظور الدوال البوليانية والدوال المستمرة. يثبت المؤلفون أن MPS يمكنها تحقيق أي دالة بوليانية بدقة، وتوفير طريقة بناء لهيكل MPS المقابل لأي بوابة بوليانية معطاة. علاوة على ذلك، يثبتون أن فضاء دوال MPS المزودة بدالة تفعيل سيجمويد ثابتة المقياس كثيفة في فضاء الدوال المستمرة المعرّفة على مجموعات جزئية مضغوطة من الفضاء الإقليدي n-البعدي. تم دراسة العلاقة بين MPS والشبكات العصبية، مما يوضح أن MPS المزودة بدوال سيجمويد ثابتة المقياس تكافئ الشبكات العصبية أحادية الطبقة المخفية المزودة بدوال نواة. وأخيراً، تم مناقشة مسألة تحقيق عمليات غاوس (GP) من خلال MPS بعرض لا نهائي من خلال دراسة الشبكات العصبية المكافئة.
- ظهور شبكات الموتر: تعمل شبكات الموتر كلغة رسومية قوية لتمثيل الأنظمة الكمية متعددة الأجسام، وقد تم تطبيقها على نطاق واسع في مجالات متعددة بما فيها المعلومات الكمية والفيزياء الحالة المكثفة والرياضيات التطبيقية وعلوم الحاسوب.
- مسألة القدرة التمثيلية لـ MPS: على الرغم من الأهمية الفيزيائية الكبيرة لـ MPS في الفيزياء الكمية، عند استخدامه كأداة جبرية في التعلم الآلي، تنشأ مسألة طبيعية: ما مدى قوة القدرة التمثيلية لـ MPS كآلة جبرية؟
- الحاجة إلى نظرية التقريب العام: على غرار نظرية التقريب العام للشبكات العصبية، يلزم إثبات نظري لحدود القدرة التمثيلية لـ MPS.
- ملء الفراغ النظري: يركز البحث الحالي بشكل أساسي على الخصائص الفيزيائية لـ MPS، مع نقص في التحليل النظري لقدرته كمقرّب دالة.
- إنشاء الصلة بين MPS والشبكات العصبية: استكشاف العلاقات المكافئة بين MPS والنماذج الكلاسيكية للتعلم الآلي (خاصة الشبكات العصبية).
- الاعتبارات العملية: في التطبيقات العملية، تكون الأساسات الكاملة عادة ذات أبعاد لا نهائية، مما يتطلب دراسة حجم فضاء الدوال الذي يمكن لـ MPS "امتداده" تحت افتراضات معتدلة.
- التمثيل الدقيق للدوال البوليانية: إثبات أن MPS يمكنها تحقيق أي دالة بوليانية بدقة، مع توفير طريقة إثبات بناءة.
- التقريب العام للدوال المستمرة: إثبات أن فضاء دوال MPS المزودة بتفعيل سيجمويد ثابت المقياس كثيف في فضاء الدوال المستمرة (فيما يتعلق بمعيار الحد الأعلى الأكيد).
- التكافؤ بين MPS والشبكات العصبية: إنشاء علاقة تكافؤ بين MPS والشبكات العصبية أحادية الطبقة المخفية، مما يكشف عن الظهور الطبيعي للدوال النواة في MPS.
- تحقيق عمليات غاوس: مناقشة مسألة تحقيق عمليات غاوس من خلال MPS بعرض لا نهائي.
يُعرّف نموذج MPS الأصلي على النحو التالي:
Ψl(x∣w,B)=∑{α,s}Aα1α2s1⋯Alαiαi+1si⋯Aαnα1snΦs1⋯sn(x)
حيث تُعرّف دالة النواة على النحو التالي:
Φs1⋯sn(x)=ϕs1(x1)⊗⋯⊗ϕsi(xi)⋯⊗ϕsn(xn)
لتحقيق التقريب العام، يقترح المؤلفون هيكل MPS معدّل:
Ψ(x∣w,B)=∑lσ(∑{α,s}Aα1α2s1⋯Alαiαi+1si⋯Aαnα1snΦs1⋯sn(x))
حيث σ(⋅) هي دالة سيجمويد ثابتة المقياس:
σ(x)→{0Cx→−∞x→+∞
تحقيق بوابة AND (النظرية 2.1):
- دالة النواة: ϕi(Xi)=[Xi,1−Xi]
- عقدة الموتر: Asi=[1,0]، بعد الرابط ∣α∣=1
تحقيق بوابة OR (النظرية 2.2):
- دالة النواة: ϕi(Xi)=[Xi,1−Xi]
- بعد رابط عقدة الموتر: ∣α∣=3
- الهيكل الموتري المحدد:
Aα1α2s1=[[1,0,1],[0,1,0]]Aα2α1s2=[[0,1,1],[1,0,0]]
تحقيق بوابة NOT (النظرية 2.3):
- دالة النواة: ϕ1(X1)=1−X1
- عقدة الموتر: As1=1
بوابة AND العامة (النظرية 2.4):
بالنسبة لـ n متغير إدخال، يمكن تحقيق:
Ψ(X1,⋯,Xn)=(⋀i=1lXi)⋀(⋀j=l+1nXj)
الدالة البوليانية التعسفية (النظرية 2.5):
من خلال تمثيل أي دالة بوليانية كصيغة فصلية من بوابات AND العامة، يمكن بناء MPS المقابل. قواعد البناء:
- كتابة الدالة البوليانية كصيغة فصلية مقابلة لجدول الحقيقة
- تعيين بعد الرابط لعدد الحدود الفصلية m
- ملء عناصر الموتر وفقاً لقواعد محددة
فضاء دوال MPS كثيف في C0(In) (فضاء الدوال المستمرة على المكعب الوحدة)، أي أنه بالنسبة لأي f(x)∈C0(In) وأي ε>0، توجد دالة MPS Ψ(x) بحيث:
supx∣Ψ(x)−f(x)∣<ε
إثبات الخطية (اللمة 3.2):
إثبات أن عائلة دوال MPS M هي فضاء جزئي خطي من C0(In):
- مغلقة تحت الضرب العددي: باستخدام ثبات المقياس
- مغلقة تحت الجمع: بناء تمثيل MPS جديد لمجموع دالتي MPS
خاصية التمييز (اللمة 3.4):
إثبات أن دالة سيجمويد ثابتة المقياس تتمتع بخاصية التمييز: إذا كانت هناك قياس موقّع محدود μ بحيث يكون تكامل جميع دوال MPS صفراً، فإن μ=0.
إثبات النظرية الرئيسية:
استخدام نظرية Hahn-Banach ونظرية تمثيل Riesz بحجة التناقض:
- افترض أن M هي مجموعة جزئية حقيقية من C0(In)
- بموجب نظرية Hahn-Banach، توجد دالة خطية غير تافهة تلغي M
- بموجب نظرية تمثيل Riesz، يقابل قياس غير تافه
- بموجب خاصية التمييز، يجب أن يكون هذا القياس صفراً، مما ينتج تناقض
MPS المزودة بتفعيل سيجمويد ثابت المقياس تكافئ الشبكات العصبية أحادية الطبقة المخفية المزودة بدوال نواة.
من خلال انكماش المؤشرات الداخلية {αi}، يمكن كتابة MPS على النحو التالي:
Ψ(x)=∑lσ(∑sWslΦs(x))
هذا هو بالضبط شكل الشبكة العصبية أحادية الطبقة المخفية، حيث:
- Wsl هي معاملات الأوزان
- Φs(x) هي دالة النواة، التي تقدم بشكل طبيعي الاقتران بين مكونات الإدخال
يتم عرض كيفية ظهور النوى غير الخطية مثل النوى متعددة الحدود بشكل طبيعي في الشبكات العصبية المكافئة من خلال أمثلة محددة، على سبيل المثال:
(Φs)T=[x1x2x3,x2x3,x1x3,x1x2,x1,x2,x3,1]
بوابة OR بـ 3 مدخلات:
التعبير البولياني: f(X1,X2,X3)=X1∨X2∨X3
تم تقديم هيكل موتر MPS المقابل بالتفصيل في قسم الطريقة.
بوابة التحقق من التكافؤ بـ 3 مدخلات:
التعبير البولياني: f(X1,X2,X3)=X1⊕X2⊕X3
أوزان الشبكة العصبية المكافئة: Ws=[1,0,0,1,0,1,1,0]
بوابة الحد Th₃²:
دالة حد تُخرج 1 عندما يكون اثنان على الأقل من المدخلات 1.
بالنسبة لبوابة بوليانية بـ n مدخل، قد يكون بعد الرابط O(2n) في الحالات القصوى، لكن يمكن تقليله إلى O(2n−1) من خلال تبسيط خريطة كارنو، مع إجمالي معاملات O(n2n−1)، وهو ما يعادل كفاءة الشبكة العصبية أحادية الطبقة المخفية.
- نظام الرموز الرسومية لحساب الموتر من Penrose (1971)
- طريقة تحليل Schmidt و DMRG من Vidal (2003, 2007)
- البحث المنهجي لخصائص MPS من Perez-Garcia وآخرين (2006)
- تطبيقات التعلم الخاضع للإشراف من Stoudenmire و Schwab (2016)
- تطبيقات شبكات الموتر المختلفة في الانحدار والتصنيف وتقدير الكثافة
- الأعمال الكلاسيكية حول التقريب العام للشبكات العصبية من Cybenko (1989) و Hornik (1991)
- تستخدم هذه الورقة تقنيات تحليل دالي مماثلة
- الاكتمال النظري: MPS تتمتع بالقدرة على تمثيل أي دالة بوليانية وتقريب أي دالة مستمرة
- كشف التكافؤ: MPS تكافئ بشكل أساسي الشبكات العصبية أحادية الطبقة المخفية المزودة بدوال نواة
- أهمية دالة النواة: دالة النواة Φs1⋯sn هي المفتاح لقدرة تمثيل MPS، وليس المؤشرات الرابطة {αi}
- مشاكل العملية: يتطلب تحقيق MPS للدوال البوليانية بعد رابط أسي
- فقدان المعنى الفيزيائي: عند استخدامه كأداة جبرية بحتة، يفقد MPS الخصائص المهمة مثل التشابك في الفيزياء الكمية
- تصميم دالة النواة: يتطلب تصميم دالة النواة بعناية للحصول على قدرة تمثيل كافية
- طرق بناء فعالة: البحث عن طرق بناء MPS أكثر كفاءة لتقليل التعقيد
- الهياكل العميقة: استكشاف هياكل MPS متعددة الطبقات، بالقياس على الشبكات العصبية العميقة
- الميزة الكمية: استكشاف المزايا الفريدة لـ MPS في بيئة الحوسبة الكمية
- مساهمة نظرية كبيرة: أول تحليل منهجي لقدرة تمثيل MPS من منظور تقريب الدوال
- إثبات صارم: استخدام أدوات تحليل دالي كلاسيكية، مع عملية إثبات دقيقة
- رؤى الاتصال: كشف العلاقة العميقة بين MPS والشبكات العصبية، مما يوفر جسراً لفهم متعدد المجالات
- إثبات بناء: لا يثبت الوجود فقط، بل يوفر طرق بناء محددة
- عملية محدودة: قد تواجه النتائج النظرية كارثة الأبعاد في التطبيقات العملية
- التحقق التجريبي غير كافٍ: نقص التجارب العددية على نطاق واسع للتحقق من النتائج النظرية
- غياب خوارزميات التحسين: لم يتم مناقشة كيفية تدريب نماذج MPS هذه بكفاءة
- تحليل المقارنة غير كافٍ: نقص التحليل المقارن المفصل مع مقرّبات عامة أخرى
- قيمة نظرية عالية: توفير أساس نظري صلب لتطبيق شبكات الموتر في التعلم الآلي
- أهمية متعددة المجالات: ربط مجالي الفيزياء الكمية والتعلم الآلي
- قوة الإلهام: توفير مرجع مهم للبحث اللاحق حول قدرة تمثيل شبكات الموتر وطرق التحسين
- البحث النظري: مناسب كأساس أدبيات لنظرية تمثيل شبكات الموتر
- الأغراض التعليمية: يمكن استخدامه لشرح العلاقة بين MPS والشبكات العصبية
- تصميم الخوارزميات: توفير إرشادات نظرية لتصميم خوارزميات التعلم الآلي القائمة على MPS
- التعلم الآلي الكمي: توفير دعم نظري لتصميم خوارزميات التعلم الآلي الكمي
تستشهد هذه الورقة بأدبيات مهمة من مجالات متعددة بما فيها شبكات الموتر والمعلومات الكمية والتعلم الآلي وتحليل دالي، بما في ذلك:
- نظرية أساسيات شبكات الموتر (Penrose, 1971; Vidal, 2007; Perez-Garcia et al., 2006)
- نظرية التقريب العام للشبكات العصبية (Cybenko, 1989; Hornik, 1991)
- تطبيقات شبكات الموتر في التعلم الآلي (Stoudenmire & Schwab, 2016; وآخرون)
- أساسيات نظرية التحليل الدالي (Folland, 2013)