We consider the Schr{ö}dinger bridge problem in discrete time, where the pathwise cost is replaced by a sum of quadratic functions, taking the form of a linear quadratic regulator (LQR) cost. This cost comprises potential terms that act as attractors and kinetic terms that control the diffusion of the process. When the two boundary marginals are Gaussian, we show that the LQR-Schr{ö}dinger bridge problem can be solved in closed form. We follow the dynamic programming principle, interpreting the Kantorovich potentials as cost-to-go functions. Under the LQR-Gaussian assumption, these potentials can be propagated exactly in a backward and forward passes, leading to a system of dual Riccati equations, well known in estimation and control. This system converges rapidly in practice. We then show that the optimal process is Markovian and compute its transition kernel in closed form as well as the Gaussian marginals. Through numerical experiments, we demonstrate that this approach can be used to construct complex, non-homogeneous Gaussian processes with acceleration and loops, given well-chosen attractive potentials. Moreover, this approach allows extending the Bures transport between Gaussian distributions to more complex geometries with negative curvature.
- معرّف الورقة: 2506.17273
- العنوان: جسر LQR-شرودنجر
- المؤلف: مارك لامبير (INRIA - المدرسة العليا للعلوم - جامعة PSL للبحث، DGA - وكالة الشراء الفرنسية)
- التصنيف: math.OC (التحسين والتحكم)
- تاريخ النشر: 24 نوفمبر 2025 (arXiv v2)
- رابط الورقة: https://arxiv.org/abs/2506.17273
تدرس هذه الورقة مشكلة جسر شرودنجر في الوقت المنفصل، حيث يتم استبدال تكلفة المسار بمجموع دوال تربيعية، بصيغة مشابهة لتكلفة المنظم الخطي التربيعي (LQR). تتضمن هذه التكلفة حد جهد كمجذب وحد حركي للتحكم في انتشار العملية. عندما تكون توزيعات الهامش الحدية الاثنتان توزيعات غاوسية، يثبت المؤلف أن مشكلة جسر LQR-شرودنجر قابلة للحل بصيغة مغلقة. من خلال اتباع مبدأ البرمجة الديناميكية، يتم تفسير دوال كانتوروفيتش الكامنة كدوال التكلفة المتبقية (cost-to-go)، وتحت افتراض LQR-غاوسي، يمكن نشر هذه الدوال بدقة من خلال تمريرات أمامية وخلفية، مما يؤدي إلى نظام معادلات ريكاتي ثنائي معروف على نطاق واسع في التقدير والتحكم. يتقارب هذا النظام بسرعة في الممارسة العملية. يثبت المؤلف كذلك أن العملية المثلى هي ماركوفية، ويحسب بصيغة مغلقة نواة الانتقال الخاصة بها وتوزيعات الهامش الغاوسية. من خلال التجارب الرقمية، يوضح المؤلف أن الطريقة يمكن استخدامها لبناء عمليات غاوسية غير متجانسة معقدة بخصائص التسارع والدورة، وكذلك توسيع نقل بوريس بين التوزيعات الغاوسية إلى مشاكل هندسية أكثر تعقيداً ذات انحناء سالب.
تنبع مشكلة جسر شرودنجر من العمل الرائد لشرودنجر عام 1931، والذي يهدف إلى تحديد العملية العشوائية الأكثر احتمالاً بالنظر إلى ملاحظات توزيعات الهامش في لحظتين (اللحظة الأولية p₀ واللحظة النهائية pₖ). وهي مشكلة نقل أمثل مع تنظيم الإنتروبيا.
- الأهمية النظرية: نظام شرودنجر مرتبط ارتباطاً وثيقاً بنقل الإنتروبيا المنتظم والخوارزمية سينكهورن، وهو مشكلة أساسية في نظرية النقل الأمثل الحديثة
- القيمة التطبيقية: تطبيقات واسعة في نظرية التحكم وتخطيط المسارات والتحكم في التباين المشترك
- الكفاءة الحسابية: البحث عن حالات خاصة قابلة للحل بكفاءة أمر حاسم للتطبيقات العملية
- قيود مقياس المرجع: عندما يكون مقياس المرجع حركة براونية، يمكن استخدام خوارزمية سينكهورن بكفاءة، لكن عندما يكون مقياس المرجع عملية عشوائية خطية، تصبح المشكلة أكثر تعقيداً
- التعقيد الحسابي: الطرق الموجودة مثل Chen et al. (2016) و Bakolas (2016)، على الرغم من اشتقاقها لمعادلات ريكاتي أمامية-خلفية، فإن معادلتها الأمامية تصف تطور مصفوفة التباين المشترك للنظام ذي الحلقة المغلقة، وليس تطور دالة كانتوروفيتش الكامنة
- مرونة النمذجة: نقص الطرق للتحكم المباشر في الخصائص الهندسية للعملية من خلال تكلفة المسار
تقترح هذه الورقة بديلاً: بدلاً من تحديد مقياس المرجع من خلال عملية عشوائية خطية، يتم تعريف التوزيع المشترك من خلال تكلفة LQR للمسار. لا يوفر هذا الإعداد فقط التحكم في التباين المشترك للحالة للوصول إلى القيمة النهائية، بل يمكنه أيضاً توجيهها على طول مسار أو أنبوب معين، مما يوفر إطار نمذجة أكثر مرونة.
- المساهمة النظرية: اقتراح صيغة جديدة لمشكلة جسر LQR-شرودنجر، حيث يتم تعريف مقياس المرجع من خلال تكلفة LQR للمسار (تتضمن حد جهد وحد حركي)
- الحل بصيغة مغلقة: إثبات أنه تحت افتراض توزيعات هامش غاوسية وتكلفة LQR تربيعية، يمكن نشر دوال كانتوروفيتش الكامنة بدقة، مما يؤدي إلى نظام معادلات ريكاتي جبرية منفصلة ثنائية:
- المعادلة الخلفية: Pk⊖=Qk/ε+Pk+1⊖−Pk+1⊖(Rk/ε+Pk+1⊖)−1Pk+1⊖
- المعادلة الأمامية: Pk+1⊕−1=εRk−1+Pk⊕−1−Pk⊕−1(εQk−1+Pk⊕−1)Pk⊕−1
- توصيف العملية المثلى: إثبات أن العملية المثلى هي ماركوفية، وحساب نواة الانتقال الخاصة بها وتوزيعات الهامش الغاوسية بصيغة مغلقة
- التوسع الهندسي: إظهار أن الطريقة يمكنها توسيع نقل بوريس بين التوزيعات الغاوسية إلى مشاكل هندسية أكثر تعقيداً ذات انحناء سالب
- عرض التطبيقات: التحقق من خلال التجارب الرقمية من أن الطريقة يمكنها بناء عمليات غاوسية غير متجانسة معقدة، مع تحقيق متابعة المسار والتهرب من العوائق والمسارات الدورية وغيرها
المدخلات:
- توزيعات الهامش الغاوسية الأولية والنهائية: p0=N(μ0,Σ0)، pK=N(μK,ΣK)
- معاملات تكلفة LQR: مصفوفة الجهد Qk، نقاط التحكم xk∗، مصفوفة الحركة Rk
- معامل درجة الحرارة ε>0
المخرجات:
- توزيع المسار الأمثل p∗(x0,...,xK)
- نواة الانتقال p∗(xk+1∣xk)
- توزيعات الهامش الغاوسية في الأوقات الوسيطة
القيود:
- قيود الهامش: ∫p(x0,...,xK)dx1...dxK=p0(x0)، ∫p(x0,...,xK)dx0...dxK−1=pK(xK)
يتم تعريف تكلفة المسار كمجموع حدود زوجية:
ℓ(x0,...,xK)=∑k=0K−1ℓk(xk,xk+1)
حيث تكلفة الخطوة الواحدة هي:
ℓk(xk,xk+1)=21(xk−xk∗)TQk(xk−xk∗)+21(xk+1−xk)TRk(xk+1−xk)
- حد الجهد (الحد الأيسر): يجذب العملية بالقرب من نقاط التحكم xk∗ من خلال مصفوفة العقوبة Qk
- حد الحركة (الحد الأيمن): يقيد انتشار العملية من خلال مصفوفة العقوبة Rk
الصيغة الثنائية لمشكلة جسر شرودنجر:
minp∈P(p0,pK)εKL(p∥exp(−ℓ/ε))
يأخذ الحل الأمثل شكل جيبس:
p∗(x0,...,xK)∝φ0(x0)r(x0,...,xK)φK(xK)
حيث φ0,φK هي دوال جهد جيبس، و r=exp(−ℓ/ε) هي مقياس المرجع غير المعياري.
تحت الافتراض الغاوسي، يمكن تمثيل دوال كانتوروفيتش الكامنة كأشكال تربيعية باستخدام مصفوفات متماثلة موجبة محددة:
- الجهد الأولي: φ0=N(α0,P0−1)
- الجهد النهائي: φK=N(αK,PK−1)
- جهد الانتشار الأمامي: φk⊕=N(αk⊕,Pk⊕−1)
- جهد الانتشار الخلفي: φk⊖=N(αk⊖,Pk⊖−1)
الانتشار الخلفي (المعادلة 1):
Pk⊖=Qk/ε+Pk+1⊖−Pk+1⊖(Rk/ε+Pk+1⊖)−1Pk+1⊖
مع تحديث حد الانجراف المقابل:
αk⊖=αk+1⊖+Pk⊖−1Qk/ε(xk∗−αk+1⊖)
الانتشار الأمامي (المعادلة 2):
Pk+1⊕−1=εRk−1+Pk⊕−1−Pk⊕−1(εQk−1+Pk⊕−1)Pk⊕−1
مع تحديث حد الانجراف المقابل:
αk+1⊕=(Qk/ε+Pk⊕)−1(Qk/εxk∗+Pk⊕αk⊕)
تظهر المعادلة الأمامية ثنائية مع المعادلة الخلفية: يتم تبديل أدوار R و Q. يوفر هذا تفسيراً جديداً لثنائية كالمان:
- يمكن تفسير Qk−1 كعدم اليقين في المعلومات السابقة (التباين المشترك)
- إذا كان Qk−1=0، يمكن التنبؤ بالمسار بشكل مثالي في موقع xk∗
- وإلا، يمكن فقط تقدير الحي بالقرب من xk∗
تتمتع نواة الانتقال المثلى بحل بصيغة مغلقة:
p∗(xk+1∣xk)=N(xk+1∣xk+βk+Kkxk,Sk−1)
حيث:
- Sk=Rk/ε+Pk+1⊖
- Kk=Sk−1Rk/ε (مكسب LQR)
- β_k = S_k^{-1}P_{k+1}^⊖} α_{k+1} (حد الانجراف)
- Chen et al. (2016): تصف المعادلة الأمامية تطور مصفوفة التباين المشترك للحالة في النظام ذي الحلقة المغلقة
- هذه الورقة: تصف المعادلة الأمامية تطور دالة كانتوروفيتش الكامنة الأمامية، حيث تقدم تكلفة المسار اقتراناً إضافياً
تُجرى التجارب في فضاء ثنائي الأبعاد (d=2) باستخدام بيانات توزيع غاوسي اصطناعية.
- توزيعات الهامش:
- توزيعات غاوسية أولية ونهائية N(μ0,Σ0) و N(μK,ΣK) ممثلة بأشكال بيضاوية حمراء
- تهيئة دوال الجهد كـ N(μ0,Σ0−1) و N(μK,ΣK−1)
- عدد نقاط المسار: K+1∈[15,100]، حسب احتياجات التصور
- معامل درجة الحرارة:
- درجة حرارة منخفضة: ε=0.001 (تتطلب حوالي 5 تكرارات)
- درجة حرارة عالية: ε=1 (عادة ما يتقارب في تكرار واحد)
- مصفوفات التكلفة:
- مصفوفة الانتشار: Rk=rI (ثابت قطري)
- مصفوفة الجهد: Qk=qI (ثابت قطري، أو صفر في بعض الأوقات)
تم تصميم عدة سيناريوهات نموذجية لاختبار أداء الطريقة:
- النقل الأمثل: التحقق من العلاقة مع نقل بوريس
- متابعة المسار الموجي: استخدام نقاط تحكم كثيفة
- شكل المنشار: سيناريو تجنب العوائق
- Scoubidou: مسار دوري
- العائق الملتوي: مصفوفة جهد غير متناحية
جسر براون (درجة حرارة عالية):
- المعاملات: ε=1, q=0, r=100
- النتيجة: جسر براون قياسي بين قياسين ديراك، المسار عملية عشوائية
- عندما ε→0 ينكمش إلى الجيوديسيا الإقليدية
الهندسة ذات الانحناء السالب (درجة حرارة منخفضة):
- المعاملات: ε=0.001, q=0.3, r=10
- النتيجة: نقل بين توزيعات غاوسية، بعد إضافة جهد جذب وسيط، تنحرف الجيوديسيا عن نقل بوريس، مما يظهر خصائص انحناء سالب
- يتحقق من أن الطريقة قابلة للتوسع إلى هندسة أكثر تعقيداً
سيناريو درجة الحرارة المنخفضة (ε=0.001):
- مسار موجي (r=1,q=10,K=15):
- استخدام K نقطة تحكم كثيفة للتوجيه
- العملية حتمية تقريباً، التباين المشترك يتناقص بسبب قيم الجهد العالية
- يوضح قدرة متابعة المسار الدقيقة
- شكل المنشار (r=10,q=0.1,K=100):
- استخدام نقطتي تحكم للتوجيه
- تحقيق ناجح لتجنب العوائق
- Scoubidou (r=10,q=0.2,K=100):
- استخدام 3 نقاط تحكم
- تشكيل هيكل مسار دوري
- العائق الملتوي (r=10,q=0.2,K=200):
- استخدام نقطة تحكم واحدة بمصفوفة جهد غير متناحية
- يحدث التواء في التباين المشترك للهامش الغاوسي بالقرب من الجهد
- يوضح قدرة التحكم في التباين المشترك
سيناريو درجة الحرارة العالية (ε=1):
- مع نفس المعاملات، تصبح العملية أكثر انتشاراً
- تضعف قيود نقاط التحكم
- مسار موجي لم يعد حتمياً
- يزداد الانتشار بشكل كبير في السيناريوهات الأخرى
- التقارب السريع: عادة ما يتقارب في تكرار واحد عند درجة حرارة عالية أو قيم K كبيرة؛ يتطلب حوالي 5 تكرارات عند درجة حرارة منخفضة و K صغيرة
- تأثير درجة الحرارة:
- درجة حرارة منخفضة: العملية قريبة من الحتمية، تأثير الجهد واضح، التباين المشترك يتناقص
- درجة حرارة عالية: العملية ذات انتشار قوي، قيود الجهد ضعيفة
- التحكم في الجهد:
- قيمة q عالية: قوة جذب قوية، التباين المشترك يتناقص، المسار أكثر حتمية
- قيمة q منخفضة: قيود ضعيفة، الحفاظ على عشوائية أكثر
- مصفوفة Qk غير متناحية: يمكن التحكم في شكل واتجاه التباين المشترك
- المرونة الهندسية:
- عندما Qk=0 يتم استرجاع الجيوديسيا بوريس
- تفعيل الجهد ينتج هندسة ذات انحناء سالب
- من خلال وضع نقاط الجذب والتحكم في قوة الجهد يمكن تصميم مسارات معقدة
- Schrödinger (1931): عمل رائد، اقتراح طريقة الإنتروبيا القصوى لتحديد العملية الأكثر احتمالاً بالنظر إلى توزيعات الهامش
- Léonard (2001, 2014): الصيغة الثنائية لكانتوروفيتش والأساس النظري
- Peyré & Cuturi (2019): الارتباط بين النقل الأمثل المنتظم بالإنتروبيا وخوارزمية سينكهورن
- Sinkhorn (1964), Cuturi (2013): حل فعال للنقل الأمثل المنفصل
- Levy et al. (1990): النمذجة والتقدير للعمليات الغاوسية المتبادلة المنفصلة
- Jamison (1975), Beghi (1996): تحويل دوب والعمليات الماركوفية المشروطة
- Chen et al. (2016): إثبات أن جسر شرودنجر يعادل مشكلة التحكم العشوائي بتكلفة تحكم تربيعية، اشتقاق معادلات ريكاتي أمامية-خلفية
- Bakolas (2016): التحكم الأمثل في التباين المشترك مع قيود الحالة التربيعية المتكاملة
- Bunne et al. (2022): حل بصيغة مغلقة لجسر شرودنجر بين القياسات الغاوسية
- Kalman (1960): العمل الأساسي للتحكم LQR ومعادلات ريكاتي
- Hotz & Skelton (1985): نظرية التحكم في التباين المشترك
- Okamoto & Tsiotras (2019): تخطيط مسار المركبة العشوائية باستخدام التوجيه بالتباين المشترك
- Ziebart et al. (2010): مبدأ الإنتروبيا السببية القصوى
- Haarnoja et al. (2018): خوارزمية الممثل-الناقد الناعم
- Lambert et al. (2024): البرمجة الديناميكية المتغيرة
- إطار موحد: توحيد التحكم LQR والنقل الأمثل وجسر شرودنجر في إطار واحد
- حل بصيغة مغلقة: الحصول على حل تحليلي كامل تحت افتراض غاوسي
- الكفاءة الحسابية: معادلات ريكاتي قابلة للحل بكفاءة، تقارب سريع
- مرونة النمذجة: حد الجهد يوفر درجات حرية تحكم إضافية، يمكن تصميم هندسة معقدة
- رؤى نظرية جديدة: كشف تفسير جديد لثنائية كالمان
- الإنجاز النظري: دمج ناجح لأفكار التحكم LQR في إطار النقل الأمثل، الحصول على حل تحليلي كامل تحت إعداد غاوسي-LQR
- كفاءة الخوارزمية: معادلات ريكاتي المشتقة قابلة للتحقيق بدون تقريب، تقارب سريع في الممارسة العملية
- الثراء الهندسي: إدخال حد الجهد ينتج هيكل هندسي غني، يمكن من خلال وضع جاذبات استراتيجي التحكم في أو تشويه أو تقليل التباين المشترك للتوزيعات الغاوسية
- الإمكانات التطبيقية: يمكن استخدام الطريقة لمتابعة المسار والتوجيه بالتباين المشترك وتجنب العوائق وغيرها من المشاكل العملية
- افتراض قابلية التحكم في السرعة: تقتصر النتائج الحالية على إعداد حيث تكون السرعة قابلة للتحكم المباشر (uk∝xk+1−xk)، توسيع الحالات المتحكم فيها عبر القنوات يُترك للعمل المستقبلي
- الوقت المنفصل: تُشتق النتائج فقط في حالة الوقت المنفصل، يتطلب التعميم على الوقت المستمر بحث إضافي
- افتراض غاوسي: تعتمد الطريقة على غاوسية توزيعات الهامش، التعميم على حالات غير غاوسية يشكل تحدياً
- التحقق التجريبي: تُجرى التجارب الرقمية بشكل أساسي في فضاء ثنائي الأبعاد، تتطلب الحالات عالية الأبعاد التحقق الإضافي
- توسيع التحكم: دمج المعلومات السابقة للعملية (مثل الديناميكيات السلبية المعروفة)، تقييد التحسين لاستراتيجيات التحكم p(u∣x)
- الوقت المستمر: التعميم على إعداد الوقت المستمر
- الحالات غير الغاوسية: استكشاف طرق تقريبية للتوزيعات غير الغاوسية للهامش
- تطوير التطبيقات: التطبيقات العملية في تخطيط مسار الروبوت والنمذجة المالية وغيرها
- تعميق النظرية: دراسة إضافية للهيكل الهندسي الناجم عن الجهد وخصائصه
- مساهمة نظرية كبيرة:
- اقتراح منظور جديد لمشكلة جسر شرودنجر، تعريف مقياس المرجع من خلال تكلفة LQR
- كشف الارتباط العميق لمعادلات ريكاتي الثنائية، توفير تفسير جديد لثنائية كالمان
- الحل التحليلي الكامل أنيق نظرياً وفعال حسابياً
- ابتكار منهجي:
- إدخال حد الجهد هو ابتكار رئيسي، يوفر درجات حرية تحكم إضافية
- دمج ماهر للبرمجة الديناميكية والنقل الأمثل ونظرية التحكم
- إجراء التطبيع العودي بسيط وفعال
- الصرامة الرياضية:
- عملية الاشتقاق واضحة وكاملة، تتطور تدريجياً من جسر شرودنجر العام إلى حالة غاوسي-LQR
- الاستفادة الكاملة من خصائص التوزيع الغاوسي (الضرب والالتفاف)
- تطبيق صيغة وودبوري يوضح البراعة التقنية
- تصميم التجارب جيد:
- تصميم السيناريو موجه، يعرض قدرات متنوعة للطريقة
- مقارنة معاملات درجة الحرارة توضح بوضوح أنماط السلوك المختلفة
- التصور مباشر وفعال
- جودة الكتابة عالية:
- نظام الرموز واضح (خاصة تدوين نمط نموذج الرسم البياني الاحتمالي)
- البنية المنطقية معقولة، التقدم من البسيط إلى المعقد
- مناقشة كافية للارتباط بالأعمال ذات الصلة
- قيود التجارب:
- التحقق فقط في فضاء ثنائي الأبعاد، الاستقرار العددي والكفاءة الحسابية في الحالات عالية الأبعاد غير معروفة
- نقص المقارنة الكمية مع طرق أخرى (مثل Chen et al. 2016)
- عدم توفير ضمانات نظرية للتقارب (على الرغم من التقارب السريع عملياً)
- قيود نظرية:
- افتراض قابلية التحكم في السرعة قوي، يحد من نطاق التطبيق
- إعداد الوقت المنفصل، التعميم على الوقت المستمر غير تافه
- افتراض غاوسي يحد من عمومية الطريقة
- التفاصيل التقنية:
- عدم مناقشة كافية لشروط P0⊖≺Σ0−1 في تحديث دالة الجهد
- عدم تحليل تفصيلي لمشاكل الاستقرار العددي (مثل انعكاس المصفوفة)
- عدم دراسة منهجية لتأثير استراتيجية التهيئة
- التوجيه التطبيقي:
- نقص التوجيه المنهجي لاختيار المعاملات (Q_k, R_k, ε) للتطبيقات المحددة
- عدم مناقشة كافية لمبادئ تصميم نقاط التحكم xk∗
- الحاجة إلى شرح أفضل للواجهة مع مشاكل التحكم الفعلية
- التأثير النظري:
- توفير منظور بحثي جديد لمشكلة جسر شرودنجر
- تعميق الارتباط بين النقل الأمثل ونظرية التحكم
- قد يلهم البحث عن طرق تقريبية للحالات غير الغاوسية
- تأثير الطريقة:
- توفير خوارزمية فعالة وقابلة للتنفيذ (الكود مفتوح المصدر)
- يمكن أن تكون بمثابة خط أساس أو مكون لطرق أخرى
- يمكن تطبيق طرق عددية ناضجة لمعادلات ريكاتي مباشرة
- التأثير التطبيقي:
- تخطيط مسار الروبوت: التوجيه بالتباين المشترك وتجنب العوائق
- النمذجة المالية: تشريط العمليات العشوائية
- التعلم الآلي: نماذج توليدية والاستدلال المتغير
- هندسة التحكم: تصميم الأنظمة غير المتجانسة
- إمكانية إعادة الإنتاج:
- وصف الخوارزمية واضح، سهل التنفيذ
- الكود متاح على GitHub
- إعدادات التجارب مفصلة، قابلة للتحقق
- الأنسب:
- مشاكل النقل الأمثل بين التوزيعات الغاوسية
- تخطيط المسارات الذي يتطلب التحكم في التباين المشترك
- التحكم العشوائي مع قيود المسار
- نمذجة العمليات الغاوسية غير المتجانسة
- ذات إمكانات:
- كتهيئة أو تقريب للحالات غير الغاوسية
- دمج مع طرق الجسيمات للتعامل مع التوزيعات متعددة الأنماط
- التحكم التكيفي عبر الإنترنت (من خلال التحديث التكراري)
- غير مناسبة:
- توزيعات الهامش غير الغاوسية (يتطلب توسيع)
- المشاكل التي تتطلب التحكم عبر القنوات (الإصدار الحالي)
- مشاكل عالية الأبعاد جداً (تعقيد العمليات الحسابية للمصفوفة)
- أساس جسر شرودنجر:
- Léonard, C. (2014). A survey of the Schrödinger problem and some of its connections with optimal transport.
- Chen, Y., Georgiou, T. T., & Pavon, M. (2021). Stochastic control liaisons: Richard Sinkhorn meets Gaspard Monge on a Schrödinger bridge.
- النقل الأمثل:
- Peyré, G., & Cuturi, M. (2019). Computational optimal transport: With applications to data science.
- Villani, C. (2008). Optimal Transport: Old and New.
- نظرية التحكم:
- Kalman, R. E. (1960). Contributions to the theory of optimal control.
- Lancaster, P., & Rodman, L. (2002). Algebraic Riccati Equations.
- الطرق ذات الصلة:
- Chen, Y., Georgiou, T. T., & Pavon, M. (2016). Optimal steering of a linear stochastic system to a final probability distribution.
- Bunne, C., et al. (2022). The Schrödinger bridge between Gaussian measures has a closed form.
التقييم الشامل: هذا عمل نظري عالي الجودة، يدمج بنجاح إطار التحكم LQR من نظرية التحكم مع مشكلة جسر شرودنجر للنقل الأمثل، ويحصل على حل أنيق بصيغة مغلقة تحت افتراض غاوسي. اشتقاق معادلات ريكاتي الثنائية والتفسير الجديد لثنائية كالمان لهما قيمة نظرية مهمة. على الرغم من أن التجارب الرقمية محدودة بالأبعاد المنخفضة، إلا أنها توضح بشكل فعال مرونة الطريقة وإمكانياتها. القيود الرئيسية تكمن في افتراض غاوسي وافتراض قابلية التحكم في السرعة، لكن كحالة خاصة، يوفر هذا العمل أساساً صلباً لبحث المشاكل الأكثر عمومية. يعزز الكود مفتوح المصدر قيمته العملية وإمكانية إعادة إنتاجه.