2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.

Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.

academic

نحو نماذج الاستدلال الأساسية التي تتعلم المعادلات التفاضلية العادية في السياق

المعلومات الأساسية

معرف الورقة: 2510.12650
العنوان: Towards Foundation Inference Models that Learn ODEs In-Context
المؤلفون: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
التصنيف: cs.LG (تعلم الآلة)
وقت النشر/المؤتمر: AI in Science (AIS)، 2025، كوبنهاغن، الدنمارك
رابط الورقة: https://arxiv.org/abs/2510.12650

الملخص

تصف المعادلات التفاضلية العادية (ODEs) الأنظمة الديناميكية ذات التطور الحتمي في الزمن المستمر. يعتبر النمذجة الدقيقة لأنظمة المعادلات التفاضلية العادية من منظور يعتمد على البيانات مسألة أساسية في العلوم الطبيعية، لكنها تظل تحديًا في حالات البيانات النادرة أو الضوضائية. تقدم هذه الورقة FIM-ODE (نموذج الاستدلال الأساسي للمعادلات التفاضلية العادية)، وهو نموذج عصبي مدرب مسبقًا مصمم لتقدير المعادلات التفاضلية العادية بدون عينات (أي في السياق) من الملاحظات النادرة والضوضائية. يتم تدريب النموذج على بيانات اصطناعية، مستفيدًا من عوامل عصبية مرنة للاستدلال القوي على المعادلات التفاضلية العادية، حتى على البيانات التالفة. تُظهر التحقيقات التجريبية أن FIM-ODE يوفر تقديرات دقيقة بأداء مماثلة لأحدث الطرق الشبكية العصبية، مع مقارنة نوعية لكيفية تقدير كل منها لهيكل حقل المتجهات.

خلفية البحث والدافع

تعريف المشكلة

المشكلة الأساسية التي يعالجها هذا البحث هي مشكلة تحديد نظام المعادلات التفاضلية العادية: تقدير المعادلة التفاضلية العادية (أي حقل المتجهات) التي تصف النظام بشكل أفضل من ملاحظات السلاسل الزمنية وحدها. يتمتع هذا بتطبيقات واسعة في العلوم الطبيعية، من قوانين نيوتن للحركة إلى ديناميكيات السكان في الأنظمة البيولوجية، إلى الحمل الحراري الجوي في الأرصاد الجوية.

أهمية المشكلة

التطبيق الواسع: المعادلات التفاضلية العادية هي أدوات نمذجة أساسية في الفيزياء والبيولوجيا والأرصاد الجوية وغيرها
القدرة التنبؤية: نماذج المعادلات التفاضلية العادية الدقيقة يمكنها توصيف الظواهر الكامنة (مثل النقاط الثابتة أو الحلقات الحدية) والتنبؤ بالحالات المستقبلية
الفهم العلمي: نماذج المعادلات التفاضلية العادية تساعد في فهم الآليات الداخلية والخصائص الديناميكية للنظام

قيود الطرق الموجودة

الطرق التقليدية: الطرق غير البارامترية أو الطرق القائمة على الانحدار الرمزي تؤدي أداءً سيئًا عند التعامل مع البيانات النادرة والضوضائية
قيود ODEFormer: على الرغم من كونها أحدث طريقة في الانحدار الرمزي العصبي، إلا أنها تستطيع فقط التعامل مع مسار واحد، وقد تنتج أنماطًا معقدة غير معقولة في التنبؤ بحقل المتجهات العام

دافع البحث

يستند المؤلفون إلى إطار عمل Foundation Inference Models (FIMs)، الذي أظهر نتائج جيدة في استدلال سلاسل ماركوف المستمرة والمعادلات التفاضلية العشوائية واستدلال العمليات النقطية، ويقترحون نموذج FIM-ODE متخصص لاستدلال المعادلات التفاضلية العادية.

المساهمات الأساسية

اقتراح نموذج FIM-ODE: أول نموذج استدلال مدرب مسبقًا قائم على إطار عمل Foundation Inference Models لاستدلال المعادلات التفاضلية العادية
معمارية العامل العصبي: استخدام عامل DeepONet العصبي لتحقيق تقدير مرن لحقل المتجهات
القدرة على معالجة المسارات المتعددة: القدرة على التعامل مع مسارات متعددة من نفس النظام في نفس الوقت، مما يحسن دقة الاستدلال
أداء متفوقة: تتفوق على ODEFormer على مجموعة البيانات الاصطناعية، بدقة R² بنسبة 0.90 مقابل 0.65 (مهمة إعادة البناء) و0.26 مقابل 0.19 (مهمة التعميم)
تنبؤ عام أكثر معقولية: مقارنة بـ ODEFormer، توفر تنبؤات حقل متجهات أبسط وأكثر معقولية في المناطق البعيدة عن نقاط الملاحظة

شرح الطريقة

تعريف المهمة

بالنظر إلى مجموعة ملاحظات السلاسل الزمنية $\mathcal{D} = \{y_k\}_{k=1}^K$ ، حيث كل سلسلة $y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})]$ ، الهدف هو تقدير حقل المتجهات $\hat{f}$ بحيث يمكنه وصف نظام المعادلات التفاضلية العادية الذي ينتج هذه الملاحظات:

$\frac{dx(t)}{dt} = f(t, x(t))$

معمارية النموذج

1. توليد البيانات الاصطناعية

أخذ عينات من كل مكون من مكونات حقل المتجهات من توزيع متعدد الحدود متعدد المتغيرات (أقصى درجة 3)
دعم أنظمة المعادلات التفاضلية العادية بحد أقصى 3 أبعاد
محاكاة النظام على شبكة غير منتظمة وإضافة ضوضاء لتوليد بيانات التدريب

2. معمارية العامل العصبي (DeepONet)

يستخدم FIM-ODE معمارية عامل DeepONet العصبي، والتي تتضمن ثلاثة مكونات رئيسية:

شبكة الفرع (Branch Network):

استخدام مشفر Transformer
ترميز بيانات الملاحظة $\mathcal{D}$ إلى $K(L-1)$ تمثيل بحجم $E$ وهو $\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}$
الاحتفاظ بترميز مستقل لجميع الملاحظات تقريبًا

شبكة الجذع (Trunk Network):

تعيين خطي يرمز الموضع $x \in \mathbb{R}^D$ إلى $h(x) \in \mathbb{R}^E$

شبكة الدمج (Combination Network):

سلسلة من طبقات الانتباه المتبقية، مشابهة لمفكك Transformer
استخدام $\mathcal{D}$ كمفاتيح وقيم، و $h(x)$ كاستعلام
الإسقاط الخطي النهائي للحصول على تقدير حقل المتجهات $\hat{f}(x)$

3. هدف التدريب

استخدام هدف التعلم الخاضع للإشراف: $L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2$

مطابقة حقول المتجهات المتنبأ بها والحقيقية على نقاط العينة $x$ القريبة من قيم الملاحظة.

نقاط الابتكار التقني

القدرة على التعلم في السياق: معالجة أنظمة المعادلات التفاضلية العادية الجديدة دون تدريب أو ضبط إضافي
دمج المسارات المتعددة: القدرة على التعامل مع مسارات متعددة في نفس الوقت، واستخراج ودمج جميع المعلومات المتاحة بشكل فعال
تقريب الدوال المرن: العوامل العصبية أكثر مرونة من الانحدار الرمزي عند التعامل مع البيانات النادرة والضوضائية
التوازن بين المحلي والعام: توفير تنبؤات معقدة بالقرب من نقاط الملاحظة، وتنبؤات بسيطة معقولة في المناطق البعيدة عن الملاحظات

إعداد التجربة

مجموعة البيانات

بيانات التدريب: 600000 معادلة تفاضلية عادية اصطناعية، حوالي 20 مليون معامل نموذج
بيانات الاختبار: 4000 حقل متجهات متعدد الحدود (أقصى درجة 3، بحد أقصى 3 أبعاد)
إعداد المسار: كل معادلة تفاضلية عادية تولد 9 مسارات، تُأخذ الحالات الأولية من $N(0,1)$
إعداد الملاحظة: كل مسار يحتوي على 200 نقطة ملاحظة، شبكة منتظمة، فاصل زمني $\Delta\tau = 0.05$

مؤشرات التقييم

استخدام دقة R²: نسبة الدرجات حيث R² أكبر من 0.9

طرق المقارنة

ODEFormer: طريقة انحدار رمزي عصبي مدربة مسبقًا، مدربة على 50 مليون معادلة، بـ 86 مليون معامل

مهام التجربة

مهمة إعادة البناء: قياس أداء إعادة البناء على مسارات السياق
مهمة التعميم: قياس أداء إعادة البناء على المسارات المحتفظ بها

نتائج التجربة

النتائج الرئيسية

النموذج	مهمة إعادة البناء	مهمة التعميم
ODEFormer	0.65	0.19
FIM-ODE	0.90	0.26

النتائج الرئيسية:

يتفوق FIM-ODE بشكل كبير على ODEFormer في كلا المهمتين
مهمة التعميم أكثر صعوبة من مهمة إعادة البناء، وهذا يتوافق مع الحدس
على الرغم من تدريب ODEFormer على توزيع أوسع وعدد معاملات أكبر، لا يزال FIM-ODE يؤدي أداءً أفضل

تحليل السياق متعدد المسارات

يوضح الشكل 1 تقدير حقل المتجهات بواسطة FIM-ODE مع عدد مختلف من مسارات السياق:

مسار واحد: تقدير غير دقيق في المواضع البعيدة عن الملاحظات
مسارات متعددة: مع زيادة عدد المسارات، يمكن لـ FIM-ODE تصحيح هذه التقديرات، وتغطية مساحة أكبر بشكل فعال

مقارنة التنبؤ المحلي والعام

يقارن الشكل 2 تقديرات حقل المتجهات بين FIM-ODE و ODEFormer:

FIM-ODE:
- محلي: تنبؤ أنماط معقدة عند نقاط الملاحظة لإعادة بناء المسار
- عام: تنبؤ أبسط عند البعد عن نقاط الملاحظة
ODEFormer: تنبؤ حقل متجهات أكثر تعقيدًا، مما يؤدي إلى تنبؤات أنماط عامة معقدة وتفتقر إلى دعم مسار بسيط واحد

تحليل الاختلافات الهيكلية

تنشأ الاختلافات بين النموذجين من معاملات حقول المتجهات المختلفة:

ODEFormer: مقيد بمعادلات رمزية (عقلانية) متعددة الحدود، قد لا يتخلف عن تعبيرات بسيطة افتراضيًا عند الملاحظات النادرة أو الضوضائية
FIM-ODE: يمكن للعوامل العصبية التعامل مع هذه الحالات بمرونة أكبر

الأعمال ذات الصلة

طرق استدلال المعادلات التفاضلية العادية التقليدية

الطرق غير البارامترية: مثل عمليات غاوس وغيرها
طرق الانحدار الرمزي: الانحدار الرمزي التقليدي القائم على الخوارزميات الجينية أو طرق التحسين الأخرى

إطار عمل Foundation Inference Models

FIM-CTMC: استدلال سلاسل ماركوف المستمرة
FIM-SDE: استدلال المعادلات التفاضلية العشوائية
FIM-PP: استدلال العمليات النقطية
FIM-ODE في هذه الورقة هو امتداد الإطار لاستدلال المعادلات التفاضلية العادية

الانحدار الرمزي العصبي

ODEFormer: طريقة عصبية مدربة مسبقًا تحول ملاحظات السلاسل الزمنية إلى معادلات رمزية

الخلاصة والمناقشة

الاستنتاجات الرئيسية

نجح FIM-ODE في توسيع إطار عمل Foundation Inference Models لمشكلة استدلال المعادلات التفاضلية العادية
على مجموعة البيانات الاصطناعية، يتفوق FIM-ODE بشكل كبير على أحدث طريقة موجودة وهي ODEFormer
المرونة في العوامل العصبية تمكن FIM-ODE من توفير تنبؤات حقل متجهات عامة أكثر معقولية
القدرة على معالجة المسارات المتعددة هي ميزة مهمة لـ FIM-ODE مقارنة بـ ODEFormer

القيود

قيود توزيع البيانات: حاليًا تم التحقق فقط على حقول متجهات متعددة الحدود، قد تكون الأنظمة الفعلية أكثر تعقيدًا
قيود الأبعاد: التجارب الحالية مقتصرة على أنظمة ثلاثية الأبعاد
نطاق التقييم: يتطلب التحقق على نطاق أوسع من أنظمة المعادلات التفاضلية العادية
الكفاءة الحسابية: لم تناقش الورقة بالتفصيل التعقيد الحسابي وسرعة الاستدلال

الاتجاهات المستقبلية

تقييم ODEBench: مقارنة الطرق على مجموعة بيانات معيارية تحتوي على 63 معادلة تفاضلية عادية مختارة يدويًا
اكتشاف الديناميكيات الكامنة: استكشاف استخدام FIM-ODE المدرب مسبقًا لاكتشاف الديناميكيات الكامنة
توسيع التطبيقات:
- ديناميكيات السكان العصبية
- ديناميكيات التفاعلات الكيميائية
- تطور محتوى اللغة الطبيعية

التقييم المتعمق

المميزات

ابتكار الطريقة: تطبيق أول لإطار عمل FIM على استدلال المعادلات التفاضلية العادية، تصميم معمارية معقول
المزايا التقنية:
- القدرة على معالجة المسارات المتعددة
- معمارية عامل عصبي مرن
- القدرة على التعلم في السياق
كفاية التجربة:
- مقارنة مباشرة مع خط أساس قوي
- تحليل متعدد الزوايا (إعادة البناء مقابل التعميم، محلي مقابل عام)
- تحليل التصور يعزز الفهم
قوة النتائج: تتفوق بشكل كبير على طريقة المقارنة في جميع المؤشرات

أوجه القصور

نطاق التجربة محدود:
- التحقق فقط على بيانات متعددة الحدود الاصطناعية
- نقص التحقق على بيانات العالم الحقيقي
- الأبعاد والتعقيد محدود
المقارنة غير كافية:
- مقارنة فقط مع ODEFormer، نقص المقارنة مع الطرق التقليدية الأخرى
- عدم مقارنة الكفاءة الحسابية
نقص التحليل النظري:
- نقص الضمانات النظرية للتقارب أو القدرة على التعميم
- عدم تحليل المزايا النظرية للطريقة
تفاصيل تقنية غير كافية:
- وصف تفاصيل التدريب موجز
- نقص شرح اختيار المعاملات الفائقة

التأثير

المساهمة الأكاديمية:
- توسيع نطاق تطبيق إطار عمل FIM
- توفير طريقة شبكة عصبية جديدة لاستدلال المعادلات التفاضلية العادية
القيمة العملية:
- القدرة على الاستدلال بدون عينات لها إمكانية تطبيق عملي
- معالجة المسارات المتعددة أكثر عملية في السيناريوهات الفعلية
قابلية التكرار:
- بناءً على معمارية FIM-SDE الموجودة، مسار التقنية واضح
- لكن تفتقر إلى تفاصيل التنفيذ الدقيقة

السيناريوهات المناسبة

الحسابات العلمية: نمذجة الأنظمة الديناميكية في الفيزياء والبيولوجيا والكيمياء وغيرها
التطبيقات الهندسية: أنظمة التحكم ومعالجة الإشارات وغيرها من السيناريوهات التي تتطلب تحديد النظام
سيناريوهات البيانات النادرة: مناسبة بشكل خاص للحالات التي تكون فيها بيانات الملاحظة محدودة أو ضوضائية
بيانات المسارات المتعددة: المزايا واضحة عندما يكون هناك مسارات ملاحظة متعددة لنفس النظام

المراجع

تستند هذه الورقة بشكل أساسي إلى الأعمال الرئيسية التالية:

d'Ascoli et al. (2024): الورقة الأصلية لـ ODEFormer
Seifner et al. (2025a): إطار عمل FIM-SDE
Lu et al. (2021): عامل DeepONet العصبي
Berghaus et al. (2024): العمل الأساسي لإطار عمل FIM

التقييم الإجمالي: هذه ورقة تقنية متينة، نجحت في توسيع إطار عمل Foundation Inference Models لمشكلة استدلال المعادلات التفاضلية العادية. على الرغم من أن نطاق التجربة محدود، إلا أنها تُظهر مزايا واضحة في الإعدادات المحددة. يوفر هذا العمل طريقة جديدة قيمة لمشكلة تحديد النظام في الحسابات العلمية، مع آفاق تطور جيدة.