Do Large Language Models Speak Scientific Workflows?
Yildiz, Peterka
With the advent of large language models (LLMs), there is a growing interest in applying LLMs to scientific tasks. In this work, we conduct an experimental study to explore applicability of LLMs for configuring, annotating, translating, explaining, and generating scientific workflows. We use 5 different workflow specific experiments and evaluate several open- and closed-source language models using state-of-the-art workflow systems. Our studies reveal that LLMs often struggle with workflow related tasks due to their lack of knowledge of scientific workflows. We further observe that the performance of LLMs varies across experiments and workflow systems. Our findings can help workflow developers and users in understanding LLMs capabilities in scientific workflows, and motivate further research applying LLMs to workflows.
academic
هل تتحدث نماذج اللغة الكبيرة لغة سير العمل العلمية؟
مع ظهور نماذج اللغة الكبيرة (LLMs)، يتزايد الاهتمام بتطبيق هذه النماذج على المهام العلمية. تستكشف هذه الدراسة من خلال التجارب تطبيق نماذج اللغة الكبيرة في تكوين وتعليق وترجمة سير العمل العلمية. استخدمت الدراسة ثلاث تجارب مختلفة خاصة بسير العمل، وقيّمت أداء عدة نماذج لغوية مفتوحة المصدر ومغلقة المصدر على أنظمة سير العمل الحديثة. وجدت الدراسة أن نماذج اللغة الكبيرة تواجه صعوبات متكررة بسبب نقص بيانات التدريب الخاصة بسير العمل العلمية، وأن أدائها يختلف عبر التجارب المختلفة وأنظمة سير العمل.
تلعب سير العمل العلمية دوراً مهماً في بيئات الحوسبة عالية الأداء (HPC)، حيث تتكون من سلسلة من المهام المتعاونة التي تعمل بشكل متزامن في الجدولة والاتصالات. ومع ذلك، يجد العديد من العلماء أن أنظمة سير العمل صعبة الاستخدام، ويختارون غالباً تشغيل المهام يدوياً أو تطوير حلول سير عمل خاصة بهم.
يقدم المستخدم وصفاً باللغة الطبيعية، وتولد نماذج اللغة الكبيرة ملف التكوين المقابل. على سبيل المثال:
موجه المستخدم: أريد سير عمل بـ 3 عقد، يتضمن مهمة منتج واثنتي مهام مستهلك،
المنتج ينتج مجموعات شبكة وبيانات جزيئات، consumer1 يقرأ الشبكة،
consumer2 يقرأ بيانات الجزيئات. يحتاج المنتج إلى 3 عمليات،
كل مستهلك يعمل على عملية واحدة. يرجى توفير ملف تكوين سير العمل لنظام Wilkins.
يستشهد هذا البحث بـ 33 مرجعاً ذا صلة، يغطي أعمالاً مهمة في مجالات متعددة بما فيها سير العمل العلمية ونماذج اللغة الكبيرة و HPC، مما يوفر أساساً نظرياً متيناً للبحث.
الملخص: هذه ورقة بحثية رائدة تقيّم بشكل منهجي لأول مرة قدرات نماذج اللغة الكبيرة في مجال سير العمل العلمية. يكتشف البحث قيوداً كبيرة لنماذج اللغة الكبيرة، بينما يُظهر أيضاً إمكانية تحسين الأداء من خلال تقنيات مناسبة (مثل few-shot prompting)، مما يضع أساساً متيناً للبحث المستقبلي في هذا المجال المهم.