2025-11-13T11:46:11.189224

Representation Theorem for Matrix Product States

Guo, Draper

In this work, we investigate the universal representation capacity of the Matrix Product States (MPS) from the perspective of boolean functions and continuous functions. We show that MPS can accurately realize arbitrary boolean functions by providing a construction method of the corresponding MPS structure for an arbitrarily given boolean gate. Moreover, we prove that the function space of MPS with the scale-invariant sigmoidal activation is dense in the space of continuous functions defined on a compact subspace of the $n$-dimensional real coordinate space $\mathbb{R^{n}}$. We study the relation between MPS and neural networks and show that the MPS with a scale-invariant sigmoidal function is equivalent to a one-hidden-layer neural network equipped with a kernel function. We construct the equivalent neural networks for several specific MPS models and show that non-linear kernels such as the polynomial kernel which introduces the couplings between different components of the input into the model appear naturally in the equivalent neural networks. At last, we discuss the realization of the Gaussian Process (GP) with infinitely wide MPS by studying their equivalent neural networks.

academic

نظرية التمثيل لحالات منتج المصفوفات

المعلومات الأساسية

معرّف الورقة: 2103.08277
العنوان: نظرية التمثيل لحالات منتج المصفوفات (Representation Theorem for Matrix Product States)
المؤلفون: إيردونج جو، ديفيد درابر (جامعة كاليفورنيا، سانتا كروز)
التصنيف: stat.ML cs.LG cs.NE quant-ph
تاريخ النشر: 15 مارس 2021 (نسخة أولية على arXiv)
رابط الورقة: https://arxiv.org/abs/2103.08277

الملخص

تدرس هذه الورقة القدرة التمثيلية العامة لحالات منتج المصفوفات (Matrix Product States, MPS) من منظور الدوال البوليانية والدوال المستمرة. يثبت المؤلفون أن MPS يمكنها تحقيق أي دالة بوليانية بدقة، وتوفير طريقة بناء لهيكل MPS المقابل لأي بوابة بوليانية معطاة. علاوة على ذلك، يثبتون أن فضاء دوال MPS المزودة بدالة تفعيل سيجمويد ثابتة المقياس كثيفة في فضاء الدوال المستمرة المعرّفة على مجموعات جزئية مضغوطة من الفضاء الإقليدي n-البعدي. تم دراسة العلاقة بين MPS والشبكات العصبية، مما يوضح أن MPS المزودة بدوال سيجمويد ثابتة المقياس تكافئ الشبكات العصبية أحادية الطبقة المخفية المزودة بدوال نواة. وأخيراً، تم مناقشة مسألة تحقيق عمليات غاوس (GP) من خلال MPS بعرض لا نهائي من خلال دراسة الشبكات العصبية المكافئة.

الخلفية البحثية والدافع

خلفية المشكلة

ظهور شبكات الموتر: تعمل شبكات الموتر كلغة رسومية قوية لتمثيل الأنظمة الكمية متعددة الأجسام، وقد تم تطبيقها على نطاق واسع في مجالات متعددة بما فيها المعلومات الكمية والفيزياء الحالة المكثفة والرياضيات التطبيقية وعلوم الحاسوب.
مسألة القدرة التمثيلية لـ MPS: على الرغم من الأهمية الفيزيائية الكبيرة لـ MPS في الفيزياء الكمية، عند استخدامه كأداة جبرية في التعلم الآلي، تنشأ مسألة طبيعية: ما مدى قوة القدرة التمثيلية لـ MPS كآلة جبرية؟
الحاجة إلى نظرية التقريب العام: على غرار نظرية التقريب العام للشبكات العصبية، يلزم إثبات نظري لحدود القدرة التمثيلية لـ MPS.

الدافع البحثي

ملء الفراغ النظري: يركز البحث الحالي بشكل أساسي على الخصائص الفيزيائية لـ MPS، مع نقص في التحليل النظري لقدرته كمقرّب دالة.
إنشاء الصلة بين MPS والشبكات العصبية: استكشاف العلاقات المكافئة بين MPS والنماذج الكلاسيكية للتعلم الآلي (خاصة الشبكات العصبية).
الاعتبارات العملية: في التطبيقات العملية، تكون الأساسات الكاملة عادة ذات أبعاد لا نهائية، مما يتطلب دراسة حجم فضاء الدوال الذي يمكن لـ MPS "امتداده" تحت افتراضات معتدلة.

المساهمات الأساسية

التمثيل الدقيق للدوال البوليانية: إثبات أن MPS يمكنها تحقيق أي دالة بوليانية بدقة، مع توفير طريقة إثبات بناءة.
التقريب العام للدوال المستمرة: إثبات أن فضاء دوال MPS المزودة بتفعيل سيجمويد ثابت المقياس كثيف في فضاء الدوال المستمرة (فيما يتعلق بمعيار الحد الأعلى الأكيد).
التكافؤ بين MPS والشبكات العصبية: إنشاء علاقة تكافؤ بين MPS والشبكات العصبية أحادية الطبقة المخفية، مما يكشف عن الظهور الطبيعي للدوال النواة في MPS.
تحقيق عمليات غاوس: مناقشة مسألة تحقيق عمليات غاوس من خلال MPS بعرض لا نهائي.

شرح الطريقة

تعريف نموذج MPS

هيكل MPS القياسي

يُعرّف نموذج MPS الأصلي على النحو التالي: $\Psi_l(x|w,B) = \sum_{\{\alpha,s\}} A^{s_1}_{\alpha_1\alpha_2} \cdots A^{s_i}_{l\alpha_i\alpha_{i+1}} \cdots A^{s_n}_{\alpha_n\alpha_1} \Phi^{s_1\cdots s_n}(x)$

حيث تُعرّف دالة النواة على النحو التالي: $\Phi^{s_1\cdots s_n}(x) = \phi^{s_1}(x_1) \otimes \cdots \otimes \phi^{s_i}(x_i) \cdots \otimes \phi^{s_n}(x_n)$

هيكل MPS المعدّل

لتحقيق التقريب العام، يقترح المؤلفون هيكل MPS معدّل: $\Psi(x|w,B) = \sum_l \sigma\left(\sum_{\{\alpha,s\}} A^{s_1}_{\alpha_1\alpha_2} \cdots A^{s_i}_{l\alpha_i\alpha_{i+1}} \cdots A^{s_n}_{\alpha_n\alpha_1} \Phi^{s_1\cdots s_n}(x)\right)$

حيث $\sigma(\cdot)$ هي دالة سيجمويد ثابتة المقياس: $\sigma(x) \to \begin{cases} 0 & x \to -\infty \\ C & x \to +\infty \end{cases}$

طريقة تمثيل الدوال البوليانية

تحقيق البوابات البوليانية الأساسية

تحقيق بوابة AND (النظرية 2.1):

دالة النواة: $\phi_i(X_i) = [X_i, 1-X_i]$
عقدة الموتر: $A^{s_i} = [1, 0]$ ، بعد الرابط $|\alpha| = 1$

تحقيق بوابة OR (النظرية 2.2):

دالة النواة: $\phi_i(X_i) = [X_i, 1-X_i]$
بعد رابط عقدة الموتر: $|\alpha| = 3$
الهيكل الموتري المحدد: $A^{s_1}_{\alpha_1\alpha_2} = [[1, 0, 1], [0, 1, 0]]$ $A^{s_2}_{\alpha_2\alpha_1} = [[0, 1, 1], [1, 0, 0]]$

تحقيق بوابة NOT (النظرية 2.3):

دالة النواة: $\phi_1(X_1) = 1-X_1$
عقدة الموتر: $A^{s_1} = 1$

بوابة AND العامة والدوال البوليانية التعسفية

بوابة AND العامة (النظرية 2.4): بالنسبة لـ $n$ متغير إدخال، يمكن تحقيق: $\Psi(X_1, \cdots, X_n) = (\bigwedge_{i=1}^l X_i) \bigwedge (\bigwedge_{j=l+1}^n \overline{X_j})$

الدالة البوليانية التعسفية (النظرية 2.5): من خلال تمثيل أي دالة بوليانية كصيغة فصلية من بوابات AND العامة، يمكن بناء MPS المقابل. قواعد البناء:

كتابة الدالة البوليانية كصيغة فصلية مقابلة لجدول الحقيقة
تعيين بعد الرابط لعدد الحدود الفصلية $m$
ملء عناصر الموتر وفقاً لقواعد محددة

نظرية تقريب الدوال المستمرة

النظرية الرئيسية (النظرية 3.1)

فضاء دوال MPS كثيف في $C_0(I^n)$ (فضاء الدوال المستمرة على المكعب الوحدة)، أي أنه بالنسبة لأي $f(x) \in C_0(I^n)$ وأي $\varepsilon > 0$ ، توجد دالة MPS $\Psi(x)$ بحيث: $\sup_x |\Psi(x) - f(x)| < \varepsilon$

تقنيات الإثبات

إثبات الخطية (اللمة 3.2): إثبات أن عائلة دوال MPS $\mathcal{M}$ هي فضاء جزئي خطي من $C_0(I^n)$ :

مغلقة تحت الضرب العددي: باستخدام ثبات المقياس
مغلقة تحت الجمع: بناء تمثيل MPS جديد لمجموع دالتي MPS

خاصية التمييز (اللمة 3.4): إثبات أن دالة سيجمويد ثابتة المقياس تتمتع بخاصية التمييز: إذا كانت هناك قياس موقّع محدود $\mu$ بحيث يكون تكامل جميع دوال MPS صفراً، فإن $\mu = 0$ .

إثبات النظرية الرئيسية: استخدام نظرية Hahn-Banach ونظرية تمثيل Riesz بحجة التناقض:

افترض أن $\overline{\mathcal{M}}$ هي مجموعة جزئية حقيقية من $C_0(I^n)$
بموجب نظرية Hahn-Banach، توجد دالة خطية غير تافهة تلغي $\overline{\mathcal{M}}$
بموجب نظرية تمثيل Riesz، يقابل قياس غير تافه
بموجب خاصية التمييز، يجب أن يكون هذا القياس صفراً، مما ينتج تناقض

التكافؤ بين MPS والشبكات العصبية

نظرية التكافؤ (النظرية 3.5)

MPS المزودة بتفعيل سيجمويد ثابت المقياس تكافئ الشبكات العصبية أحادية الطبقة المخفية المزودة بدوال نواة.

طريقة التحويل

من خلال انكماش المؤشرات الداخلية $\{\alpha_i\}$ ، يمكن كتابة MPS على النحو التالي: $\Psi(x) = \sum_l \sigma\left(\sum_s W^l_s \Phi^s(x)\right)$

هذا هو بالضبط شكل الشبكة العصبية أحادية الطبقة المخفية، حيث:

$W^l_s$ هي معاملات الأوزان
$\Phi^s(x)$ هي دالة النواة، التي تقدم بشكل طبيعي الاقتران بين مكونات الإدخال

الظهور الطبيعي لدوال النواة

يتم عرض كيفية ظهور النوى غير الخطية مثل النوى متعددة الحدود بشكل طبيعي في الشبكات العصبية المكافئة من خلال أمثلة محددة، على سبيل المثال: $(\Phi^s)^T = [x_1x_2x_3, x_2x_3, x_1x_3, x_1x_2, x_1, x_2, x_3, 1]$

النتائج التجريبية وتحليل الحالات

حالات تحقيق الدوال البوليانية

بوابة OR بـ 3 مدخلات: التعبير البولياني: $f(X_1,X_2,X_3) = X_1 \vee X_2 \vee X_3$ تم تقديم هيكل موتر MPS المقابل بالتفصيل في قسم الطريقة.

بوابة التحقق من التكافؤ بـ 3 مدخلات: التعبير البولياني: $f(X_1,X_2,X_3) = X_1 \oplus X_2 \oplus X_3$ أوزان الشبكة العصبية المكافئة: $W^s = [1, 0, 0, 1, 0, 1, 1, 0]$

بوابة الحد Th₃²: دالة حد تُخرج 1 عندما يكون اثنان على الأقل من المدخلات 1.

تحليل التعقيد

بالنسبة لبوابة بوليانية بـ $n$ مدخل، قد يكون بعد الرابط $O(2^n)$ في الحالات القصوى، لكن يمكن تقليله إلى $O(2^{n-1})$ من خلال تبسيط خريطة كارنو، مع إجمالي معاملات $O(n2^{n-1})$ ، وهو ما يعادل كفاءة الشبكة العصبية أحادية الطبقة المخفية.

الأعمال ذات الصلة

أساسيات نظرية شبكات الموتر

نظام الرموز الرسومية لحساب الموتر من Penrose (1971)
طريقة تحليل Schmidt و DMRG من Vidal (2003, 2007)
البحث المنهجي لخصائص MPS من Perez-Garcia وآخرين (2006)

شبكات الموتر في التعلم الآلي

تطبيقات التعلم الخاضع للإشراف من Stoudenmire و Schwab (2016)
تطبيقات شبكات الموتر المختلفة في الانحدار والتصنيف وتقدير الكثافة

نظرية التقريب العام

الأعمال الكلاسيكية حول التقريب العام للشبكات العصبية من Cybenko (1989) و Hornik (1991)
تستخدم هذه الورقة تقنيات تحليل دالي مماثلة

الخلاصة والمناقشة

الاستنتاجات الرئيسية

الاكتمال النظري: MPS تتمتع بالقدرة على تمثيل أي دالة بوليانية وتقريب أي دالة مستمرة
كشف التكافؤ: MPS تكافئ بشكل أساسي الشبكات العصبية أحادية الطبقة المخفية المزودة بدوال نواة
أهمية دالة النواة: دالة النواة $\Phi^{s_1\cdots s_n}$ هي المفتاح لقدرة تمثيل MPS، وليس المؤشرات الرابطة $\{\alpha_i\}$

القيود

مشاكل العملية: يتطلب تحقيق MPS للدوال البوليانية بعد رابط أسي
فقدان المعنى الفيزيائي: عند استخدامه كأداة جبرية بحتة، يفقد MPS الخصائص المهمة مثل التشابك في الفيزياء الكمية
تصميم دالة النواة: يتطلب تصميم دالة النواة بعناية للحصول على قدرة تمثيل كافية

الاتجاهات المستقبلية

طرق بناء فعالة: البحث عن طرق بناء MPS أكثر كفاءة لتقليل التعقيد
الهياكل العميقة: استكشاف هياكل MPS متعددة الطبقات، بالقياس على الشبكات العصبية العميقة
الميزة الكمية: استكشاف المزايا الفريدة لـ MPS في بيئة الحوسبة الكمية

التقييم المتعمق

المميزات

مساهمة نظرية كبيرة: أول تحليل منهجي لقدرة تمثيل MPS من منظور تقريب الدوال
إثبات صارم: استخدام أدوات تحليل دالي كلاسيكية، مع عملية إثبات دقيقة
رؤى الاتصال: كشف العلاقة العميقة بين MPS والشبكات العصبية، مما يوفر جسراً لفهم متعدد المجالات
إثبات بناء: لا يثبت الوجود فقط، بل يوفر طرق بناء محددة

أوجه القصور

عملية محدودة: قد تواجه النتائج النظرية كارثة الأبعاد في التطبيقات العملية
التحقق التجريبي غير كافٍ: نقص التجارب العددية على نطاق واسع للتحقق من النتائج النظرية
غياب خوارزميات التحسين: لم يتم مناقشة كيفية تدريب نماذج MPS هذه بكفاءة
تحليل المقارنة غير كافٍ: نقص التحليل المقارن المفصل مع مقرّبات عامة أخرى

التأثير

قيمة نظرية عالية: توفير أساس نظري صلب لتطبيق شبكات الموتر في التعلم الآلي
أهمية متعددة المجالات: ربط مجالي الفيزياء الكمية والتعلم الآلي
قوة الإلهام: توفير مرجع مهم للبحث اللاحق حول قدرة تمثيل شبكات الموتر وطرق التحسين

السيناريوهات المناسبة

البحث النظري: مناسب كأساس أدبيات لنظرية تمثيل شبكات الموتر
الأغراض التعليمية: يمكن استخدامه لشرح العلاقة بين MPS والشبكات العصبية
تصميم الخوارزميات: توفير إرشادات نظرية لتصميم خوارزميات التعلم الآلي القائمة على MPS
التعلم الآلي الكمي: توفير دعم نظري لتصميم خوارزميات التعلم الآلي الكمي

المراجع

تستشهد هذه الورقة بأدبيات مهمة من مجالات متعددة بما فيها شبكات الموتر والمعلومات الكمية والتعلم الآلي وتحليل دالي، بما في ذلك:

نظرية أساسيات شبكات الموتر (Penrose, 1971; Vidal, 2007; Perez-Garcia et al., 2006)
نظرية التقريب العام للشبكات العصبية (Cybenko, 1989; Hornik, 1991)
تطبيقات شبكات الموتر في التعلم الآلي (Stoudenmire & Schwab, 2016; وآخرون)
أساسيات نظرية التحليل الدالي (Folland, 2013)