Rethinking deep learning: linear regression remains a key benchmark in predicting terrestrial water storage
Nie, Kumar, Chen et al.
Recent advances in machine learning such as Long Short-Term Memory (LSTM) models and Transformers have been widely adopted in hydrological applications, demonstrating impressive performance amongst deep learning models and outperforming physical models in various tasks. However, their superiority in predicting land surface states such as terrestrial water storage (TWS) that are dominated by many factors such as natural variability and human driven modifications remains unclear. Here, using the open-access, globally representative HydroGlobe dataset - comprising a baseline version derived solely from a land surface model simulation and an advanced version incorporating multi-source remote sensing data assimilation - we show that linear regression is a robust benchmark, outperforming the more complex LSTM and Temporal Fusion Transformer for TWS prediction. Our findings highlight the importance of including traditional statistical models as benchmarks when developing and evaluating deep learning models. Additionally, we emphasize the critical need to establish globally representative benchmark datasets that capture the combined impact of natural variability and human interventions.
academic
إعادة التفكير في التعلم العميق: الانحدار الخطي يبقى معيارًا رئيسيًا في التنبؤ بتخزين المياه الأرضية
في السنوات الأخيرة، تم اعتماد تقنيات التعلم الآلي على نطاق واسع مثل شبكات الذاكرة قصيرة الأجل طويلة الأجل (LSTM) و Transformer في التطبيقات الهيدرولوجية، حيث أظهرت أداءً متفوقًا في نماذج التعلم العميق وتجاوزت النماذج الفيزيائية في مختلف المهام. ومع ذلك، فإن تفوق هذه الطرق في التنبؤ بحالة السطح الأرضي (مثل تخزين المياه الأرضية TWS) التي تهيمن عليها عوامل متعددة مثل التباين الطبيعي والتغيرات المدفوعة بالعامل البشري لا يزال غير واضح. تستخدم هذه الدراسة مجموعة بيانات HydroGlobe العالمية ذات الوصول المفتوح والممثلة عالميًا - والتي تتضمن نسخة أساسية تعتمد فقط على محاكاة نموذج السطح الأرضي ونسخة متقدمة تدمج استيعاب البيانات من مصادر الاستشعار عن بعد المتعددة - لإظهار أن الانحدار الخطي هو معيار قوي يتفوق على نماذج LSTM والمحول الزمني الأكثر تعقيدًا في مهام التنبؤ بـ TWS. تؤكد النتائج على أهمية استخدام النماذج الإحصائية التقليدية كمعايير عند تطوير وتقييم نماذج التعلم العميق، وتؤكد على الحاجة الحتمية لإنشاء مجموعات بيانات أساسية عالمية الممثلية قادرة على التقاط التأثيرات المدمجة للتباين الطبيعي والتدخل البشري.
تخزين المياه الأرضية (TWS) هو مؤشر رئيسي لتوفر المياه العذبة العالمية، ويشمل جميع أشكال المياه الأرضية بما في ذلك رطوبة التربة والمياه الجوفية والمياه السطحية والثلج. يعتبر التقدير الدقيق لـ TWS حاسمًا لحماية النظم البيئية ودعم الزراعة وضمان أمن المياه والغذاء.
شيوع التعلم العميق في الهيدرولوجيا: أصبحت نماذج التعلم العميق مثل LSTM و Transformer شائعة بشكل متزايد في التطبيقات الهيدرولوجية، خاصة في مهام مثل نمذجة تحويل الأمطار إلى جريان
تحديات عدم الاستقرار: يتأثر TWS بالتفاعلات المعقدة بين تباين المناخ والأنشطة البشرية (مثل استخراج المياه الجوفية وتغيير استخدام الأراضي وتشغيل الخزانات)، مما يظهر عدم استقرار قوي
مشكلة اختيار المعيار: غالبًا ما تقارن الدراسات الموجودة بين نماذج التعلم العميق فقط، وتفتقر إلى المقارنة مع الطرق الإحصائية البسيطة
قيود مجموعة البيانات: نقص مجموعات بيانات أساسية عالمية تعكس بشكل شامل التأثيرات الطبيعية والبشرية
الإدخال: ميزات شهرية من الاثني عشر شهرًا الماضية (الهطول والحرارة ومؤشر مساحة الأوراق LAI ورطوبة التربة السطحية SSMC) بالإضافة إلى ميزات ثابتة (الارتفاع والانحدار وملمس التربة وغطاء الأراضي وغيرها)
الإخراج: تخزين المياه الأرضية (TWS) للشهر الحالي
القيود: عدم استخدام القيم التاريخية لـ TWS كميزات إدخال، محاكاة سيناريو التنبؤ الفعلي
تتضمن الورقة مراجع غنية تغطي أعمالًا مهمة في مجالات متعددة مثل التعلم العميق والهيدرولوجيا والاستشعار عن بعد، مما يوفر أساسًا شاملاً للأدبيات للأبحاث ذات الصلة.
التقييم الإجمالي: هذه ورقة بحثية عالية الجودة متعددة التخصصات، تطعن من خلال تصميم تجريبي دقيق وتحليل متعمق في الافتراضات السائدة حول تطبيقات التعلم العميق في الهيدرولوجيا، وتؤكد على قيمة الطرق الإحصائية التقليدية وأهمية اختيار المعايير المناسبة. تتمتع نتائج البحث بأهمية منهجية كبيرة لكل من مجتمع الهيدرولوجيا والتعلم الآلي.