Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
- معرف الورقة: 2510.12650
- العنوان: Towards Foundation Inference Models that Learn ODEs In-Context
- المؤلفون: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
- التصنيف: cs.LG (تعلم الآلة)
- وقت النشر/المؤتمر: AI in Science (AIS)، 2025، كوبنهاغن، الدنمارك
- رابط الورقة: https://arxiv.org/abs/2510.12650
تصف المعادلات التفاضلية العادية (ODEs) الأنظمة الديناميكية ذات التطور الحتمي في الزمن المستمر. يعتبر النمذجة الدقيقة لأنظمة المعادلات التفاضلية العادية من منظور يعتمد على البيانات مسألة أساسية في العلوم الطبيعية، لكنها تظل تحديًا في حالات البيانات النادرة أو الضوضائية. تقدم هذه الورقة FIM-ODE (نموذج الاستدلال الأساسي للمعادلات التفاضلية العادية)، وهو نموذج عصبي مدرب مسبقًا مصمم لتقدير المعادلات التفاضلية العادية بدون عينات (أي في السياق) من الملاحظات النادرة والضوضائية. يتم تدريب النموذج على بيانات اصطناعية، مستفيدًا من عوامل عصبية مرنة للاستدلال القوي على المعادلات التفاضلية العادية، حتى على البيانات التالفة. تُظهر التحقيقات التجريبية أن FIM-ODE يوفر تقديرات دقيقة بأداء مماثلة لأحدث الطرق الشبكية العصبية، مع مقارنة نوعية لكيفية تقدير كل منها لهيكل حقل المتجهات.
المشكلة الأساسية التي يعالجها هذا البحث هي مشكلة تحديد نظام المعادلات التفاضلية العادية: تقدير المعادلة التفاضلية العادية (أي حقل المتجهات) التي تصف النظام بشكل أفضل من ملاحظات السلاسل الزمنية وحدها. يتمتع هذا بتطبيقات واسعة في العلوم الطبيعية، من قوانين نيوتن للحركة إلى ديناميكيات السكان في الأنظمة البيولوجية، إلى الحمل الحراري الجوي في الأرصاد الجوية.
- التطبيق الواسع: المعادلات التفاضلية العادية هي أدوات نمذجة أساسية في الفيزياء والبيولوجيا والأرصاد الجوية وغيرها
- القدرة التنبؤية: نماذج المعادلات التفاضلية العادية الدقيقة يمكنها توصيف الظواهر الكامنة (مثل النقاط الثابتة أو الحلقات الحدية) والتنبؤ بالحالات المستقبلية
- الفهم العلمي: نماذج المعادلات التفاضلية العادية تساعد في فهم الآليات الداخلية والخصائص الديناميكية للنظام
- الطرق التقليدية: الطرق غير البارامترية أو الطرق القائمة على الانحدار الرمزي تؤدي أداءً سيئًا عند التعامل مع البيانات النادرة والضوضائية
- قيود ODEFormer: على الرغم من كونها أحدث طريقة في الانحدار الرمزي العصبي، إلا أنها تستطيع فقط التعامل مع مسار واحد، وقد تنتج أنماطًا معقدة غير معقولة في التنبؤ بحقل المتجهات العام
يستند المؤلفون إلى إطار عمل Foundation Inference Models (FIMs)، الذي أظهر نتائج جيدة في استدلال سلاسل ماركوف المستمرة والمعادلات التفاضلية العشوائية واستدلال العمليات النقطية، ويقترحون نموذج FIM-ODE متخصص لاستدلال المعادلات التفاضلية العادية.
- اقتراح نموذج FIM-ODE: أول نموذج استدلال مدرب مسبقًا قائم على إطار عمل Foundation Inference Models لاستدلال المعادلات التفاضلية العادية
- معمارية العامل العصبي: استخدام عامل DeepONet العصبي لتحقيق تقدير مرن لحقل المتجهات
- القدرة على معالجة المسارات المتعددة: القدرة على التعامل مع مسارات متعددة من نفس النظام في نفس الوقت، مما يحسن دقة الاستدلال
- أداء متفوقة: تتفوق على ODEFormer على مجموعة البيانات الاصطناعية، بدقة R² بنسبة 0.90 مقابل 0.65 (مهمة إعادة البناء) و0.26 مقابل 0.19 (مهمة التعميم)
- تنبؤ عام أكثر معقولية: مقارنة بـ ODEFormer، توفر تنبؤات حقل متجهات أبسط وأكثر معقولية في المناطق البعيدة عن نقاط الملاحظة
بالنظر إلى مجموعة ملاحظات السلاسل الزمنية D={yk}k=1K، حيث كل سلسلة yk=[(tk1,yk1),…,(tkL,ykL)]، الهدف هو تقدير حقل المتجهات f^ بحيث يمكنه وصف نظام المعادلات التفاضلية العادية الذي ينتج هذه الملاحظات:
dtdx(t)=f(t,x(t))
- أخذ عينات من كل مكون من مكونات حقل المتجهات من توزيع متعدد الحدود متعدد المتغيرات (أقصى درجة 3)
- دعم أنظمة المعادلات التفاضلية العادية بحد أقصى 3 أبعاد
- محاكاة النظام على شبكة غير منتظمة وإضافة ضوضاء لتوليد بيانات التدريب
يستخدم FIM-ODE معمارية عامل DeepONet العصبي، والتي تتضمن ثلاثة مكونات رئيسية:
شبكة الفرع (Branch Network):
- استخدام مشفر Transformer
- ترميز بيانات الملاحظة D إلى K(L−1) تمثيل بحجم E وهو D∈RE×K(L−1)
- الاحتفاظ بترميز مستقل لجميع الملاحظات تقريبًا
شبكة الجذع (Trunk Network):
- تعيين خطي يرمز الموضع x∈RD إلى h(x)∈RE
شبكة الدمج (Combination Network):
- سلسلة من طبقات الانتباه المتبقية، مشابهة لمفكك Transformer
- استخدام D كمفاتيح وقيم، و h(x) كاستعلام
- الإسقاط الخطي النهائي للحصول على تقدير حقل المتجهات f^(x)
استخدام هدف التعلم الخاضع للإشراف:
L(x,D,f)=∥f^(x)−f(x)∥2
مطابقة حقول المتجهات المتنبأ بها والحقيقية على نقاط العينة x القريبة من قيم الملاحظة.
- القدرة على التعلم في السياق: معالجة أنظمة المعادلات التفاضلية العادية الجديدة دون تدريب أو ضبط إضافي
- دمج المسارات المتعددة: القدرة على التعامل مع مسارات متعددة في نفس الوقت، واستخراج ودمج جميع المعلومات المتاحة بشكل فعال
- تقريب الدوال المرن: العوامل العصبية أكثر مرونة من الانحدار الرمزي عند التعامل مع البيانات النادرة والضوضائية
- التوازن بين المحلي والعام: توفير تنبؤات معقدة بالقرب من نقاط الملاحظة، وتنبؤات بسيطة معقولة في المناطق البعيدة عن الملاحظات
- بيانات التدريب: 600000 معادلة تفاضلية عادية اصطناعية، حوالي 20 مليون معامل نموذج
- بيانات الاختبار: 4000 حقل متجهات متعدد الحدود (أقصى درجة 3، بحد أقصى 3 أبعاد)
- إعداد المسار: كل معادلة تفاضلية عادية تولد 9 مسارات، تُأخذ الحالات الأولية من N(0,1)
- إعداد الملاحظة: كل مسار يحتوي على 200 نقطة ملاحظة، شبكة منتظمة، فاصل زمني Δτ=0.05
استخدام دقة R²: نسبة الدرجات حيث R² أكبر من 0.9
ODEFormer: طريقة انحدار رمزي عصبي مدربة مسبقًا، مدربة على 50 مليون معادلة، بـ 86 مليون معامل
- مهمة إعادة البناء: قياس أداء إعادة البناء على مسارات السياق
- مهمة التعميم: قياس أداء إعادة البناء على المسارات المحتفظ بها
| النموذج | مهمة إعادة البناء | مهمة التعميم |
|---|
| ODEFormer | 0.65 | 0.19 |
| FIM-ODE | 0.90 | 0.26 |
النتائج الرئيسية:
- يتفوق FIM-ODE بشكل كبير على ODEFormer في كلا المهمتين
- مهمة التعميم أكثر صعوبة من مهمة إعادة البناء، وهذا يتوافق مع الحدس
- على الرغم من تدريب ODEFormer على توزيع أوسع وعدد معاملات أكبر، لا يزال FIM-ODE يؤدي أداءً أفضل
يوضح الشكل 1 تقدير حقل المتجهات بواسطة FIM-ODE مع عدد مختلف من مسارات السياق:
- مسار واحد: تقدير غير دقيق في المواضع البعيدة عن الملاحظات
- مسارات متعددة: مع زيادة عدد المسارات، يمكن لـ FIM-ODE تصحيح هذه التقديرات، وتغطية مساحة أكبر بشكل فعال
يقارن الشكل 2 تقديرات حقل المتجهات بين FIM-ODE و ODEFormer:
- FIM-ODE:
- محلي: تنبؤ أنماط معقدة عند نقاط الملاحظة لإعادة بناء المسار
- عام: تنبؤ أبسط عند البعد عن نقاط الملاحظة
- ODEFormer: تنبؤ حقل متجهات أكثر تعقيدًا، مما يؤدي إلى تنبؤات أنماط عامة معقدة وتفتقر إلى دعم مسار بسيط واحد
تنشأ الاختلافات بين النموذجين من معاملات حقول المتجهات المختلفة:
- ODEFormer: مقيد بمعادلات رمزية (عقلانية) متعددة الحدود، قد لا يتخلف عن تعبيرات بسيطة افتراضيًا عند الملاحظات النادرة أو الضوضائية
- FIM-ODE: يمكن للعوامل العصبية التعامل مع هذه الحالات بمرونة أكبر
- الطرق غير البارامترية: مثل عمليات غاوس وغيرها
- طرق الانحدار الرمزي: الانحدار الرمزي التقليدي القائم على الخوارزميات الجينية أو طرق التحسين الأخرى
- FIM-CTMC: استدلال سلاسل ماركوف المستمرة
- FIM-SDE: استدلال المعادلات التفاضلية العشوائية
- FIM-PP: استدلال العمليات النقطية
- FIM-ODE في هذه الورقة هو امتداد الإطار لاستدلال المعادلات التفاضلية العادية
ODEFormer: طريقة عصبية مدربة مسبقًا تحول ملاحظات السلاسل الزمنية إلى معادلات رمزية
- نجح FIM-ODE في توسيع إطار عمل Foundation Inference Models لمشكلة استدلال المعادلات التفاضلية العادية
- على مجموعة البيانات الاصطناعية، يتفوق FIM-ODE بشكل كبير على أحدث طريقة موجودة وهي ODEFormer
- المرونة في العوامل العصبية تمكن FIM-ODE من توفير تنبؤات حقل متجهات عامة أكثر معقولية
- القدرة على معالجة المسارات المتعددة هي ميزة مهمة لـ FIM-ODE مقارنة بـ ODEFormer
- قيود توزيع البيانات: حاليًا تم التحقق فقط على حقول متجهات متعددة الحدود، قد تكون الأنظمة الفعلية أكثر تعقيدًا
- قيود الأبعاد: التجارب الحالية مقتصرة على أنظمة ثلاثية الأبعاد
- نطاق التقييم: يتطلب التحقق على نطاق أوسع من أنظمة المعادلات التفاضلية العادية
- الكفاءة الحسابية: لم تناقش الورقة بالتفصيل التعقيد الحسابي وسرعة الاستدلال
- تقييم ODEBench: مقارنة الطرق على مجموعة بيانات معيارية تحتوي على 63 معادلة تفاضلية عادية مختارة يدويًا
- اكتشاف الديناميكيات الكامنة: استكشاف استخدام FIM-ODE المدرب مسبقًا لاكتشاف الديناميكيات الكامنة
- توسيع التطبيقات:
- ديناميكيات السكان العصبية
- ديناميكيات التفاعلات الكيميائية
- تطور محتوى اللغة الطبيعية
- ابتكار الطريقة: تطبيق أول لإطار عمل FIM على استدلال المعادلات التفاضلية العادية، تصميم معمارية معقول
- المزايا التقنية:
- القدرة على معالجة المسارات المتعددة
- معمارية عامل عصبي مرن
- القدرة على التعلم في السياق
- كفاية التجربة:
- مقارنة مباشرة مع خط أساس قوي
- تحليل متعدد الزوايا (إعادة البناء مقابل التعميم، محلي مقابل عام)
- تحليل التصور يعزز الفهم
- قوة النتائج: تتفوق بشكل كبير على طريقة المقارنة في جميع المؤشرات
- نطاق التجربة محدود:
- التحقق فقط على بيانات متعددة الحدود الاصطناعية
- نقص التحقق على بيانات العالم الحقيقي
- الأبعاد والتعقيد محدود
- المقارنة غير كافية:
- مقارنة فقط مع ODEFormer، نقص المقارنة مع الطرق التقليدية الأخرى
- عدم مقارنة الكفاءة الحسابية
- نقص التحليل النظري:
- نقص الضمانات النظرية للتقارب أو القدرة على التعميم
- عدم تحليل المزايا النظرية للطريقة
- تفاصيل تقنية غير كافية:
- وصف تفاصيل التدريب موجز
- نقص شرح اختيار المعاملات الفائقة
- المساهمة الأكاديمية:
- توسيع نطاق تطبيق إطار عمل FIM
- توفير طريقة شبكة عصبية جديدة لاستدلال المعادلات التفاضلية العادية
- القيمة العملية:
- القدرة على الاستدلال بدون عينات لها إمكانية تطبيق عملي
- معالجة المسارات المتعددة أكثر عملية في السيناريوهات الفعلية
- قابلية التكرار:
- بناءً على معمارية FIM-SDE الموجودة، مسار التقنية واضح
- لكن تفتقر إلى تفاصيل التنفيذ الدقيقة
- الحسابات العلمية: نمذجة الأنظمة الديناميكية في الفيزياء والبيولوجيا والكيمياء وغيرها
- التطبيقات الهندسية: أنظمة التحكم ومعالجة الإشارات وغيرها من السيناريوهات التي تتطلب تحديد النظام
- سيناريوهات البيانات النادرة: مناسبة بشكل خاص للحالات التي تكون فيها بيانات الملاحظة محدودة أو ضوضائية
- بيانات المسارات المتعددة: المزايا واضحة عندما يكون هناك مسارات ملاحظة متعددة لنفس النظام
تستند هذه الورقة بشكل أساسي إلى الأعمال الرئيسية التالية:
- d'Ascoli et al. (2024): الورقة الأصلية لـ ODEFormer
- Seifner et al. (2025a): إطار عمل FIM-SDE
- Lu et al. (2021): عامل DeepONet العصبي
- Berghaus et al. (2024): العمل الأساسي لإطار عمل FIM
التقييم الإجمالي: هذه ورقة تقنية متينة، نجحت في توسيع إطار عمل Foundation Inference Models لمشكلة استدلال المعادلات التفاضلية العادية. على الرغم من أن نطاق التجربة محدود، إلا أنها تُظهر مزايا واضحة في الإعدادات المحددة. يوفر هذا العمل طريقة جديدة قيمة لمشكلة تحديد النظام في الحسابات العلمية، مع آفاق تطور جيدة.