AquaCluster: Using Satellite Images And Self-supervised Machine Learning Networks To Detect Water Hidden Under Vegetation
Iakovidis, Kalantari, Payberah et al.
In recent years, the wide availability of high-resolution radar satellite images has enabled the remote monitoring of wetland surface areas. Machine learning models have achieved state-of-the-art results in segmenting wetlands from satellite images. However, these models require large amounts of manually annotated satellite images, which are slow and expensive to produce. The need for annotated training data makes it difficult to adapt these models to changes such as different climates or sensors. To address this issue, we employed self-supervised training methods to develop a model, AquaCluster, which segments radar satellite images into water and land areas without manual annotations. Our final model outperformed other radar-based water detection techniques that do not require annotated data in our test dataset, having achieved a 0.08 improvement in the Intersection over Union metric. Our results demonstrate that it is possible to train machine learning models to detect vegetated water from radar images without the use of annotated data, which can make the retraining of these models to account for changes much easier.
academic
AquaCluster: استخدام صور الأقمار الصناعية وشبكات التعلم الآلي ذاتية الإشراف للكشف عن المياه المخفية تحت الغطاء النباتي
في السنوات الأخيرة، أتاحت توفر صور الأقمار الصناعية الرادارية عالية الدقة إمكانية المراقبة عن بعد لمساحات الأراضي الرطبة. حققت نماذج التعلم الآلي نتائج متقدمة في مهام تقسيم الأراضي الرطبة من صور الأقمار الصناعية. ومع ذلك، تتطلب هذه النماذج كميات كبيرة من صور الأقمار الصناعية المعلّمة يدويًا، وهي مكلفة وتستغرق وقتًا طويلاً. يجعل الطلب على بيانات التدريب المعلّمة هذه النماذج صعبة التكيف مع التغييرات المختلفة مثل المناخ أو أجهزة الاستشعار. لمعالجة هذه المشكلة، تطور هذه الدراسة نموذج AquaCluster باستخدام طرق التدريب ذاتية الإشراف، والذي يمكنه تقسيم صور الأقمار الصناعية الرادارية إلى مناطق مائية وأرضية دون الحاجة إلى تعليقات يدوية. على مجموعة البيانات الاختبارية، يحقق النموذج أفضل أداء في تقنيات الكشف عن المياه الرادارية التي لا تتطلب بيانات معلّمة، محققًا تحسنًا بمقدار 0.08 في مقياس تقاطع الاتحاد (IoU). تُظهر نتائج البحث أنه يمكن تدريب نماذج التعلم الآلي للكشف عن المياه المغطاة بالنبات من الصور الرادارية دون استخدام بيانات معلّمة، مما يجعل إعادة تدريب النموذج للتكيف مع التغييرات أسهل بكثير.
أهمية مراقبة الأراضي الرطبة: على الرغم من أن الأراضي الرطبة تشغل جزءًا صغيرًا فقط من سطح الأرض، إلا أنها تلعب دورًا حاسمًا في حماية البيئة والدفاع عن تأثيرات المناخ، بما في ذلك تنقية جودة المياه وتقليل مخاطر الفيضانات وتخزين كميات كبيرة من الكربون. ومع ذلك، تختفي الأراضي الرطبة بمعدل مذهل بسبب تغير المناخ والأنشطة البشرية.
تحديات الكشف عن المياه المغطاة بالنبات: تعمل صور الأقمار الصناعية البصرية التقليدية بشكل جيد في الكشف عن المسطحات المائية المفتوحة، لكنها تواجه صعوبات في الكشف عن مياه الأراضي الرطبة المغطاة جزئيًا أو كليًا بالنبات، لأن أجهزة الاستشعار البصرية لا يمكنها اختراق الغطاء النباتي. على الرغم من أن أجهزة الاستشعار الرادارية يمكنها اختراق النبات للكشف عن المياه الموجودة تحته، إلا أن الصور الرادارية تحتوي على ضوضاء (مثل ضوضاء البقع)، مما يجعل التمييز بين المياه والأرض صعبًا.
قيود الطرق الموجودة:
على الرغم من أن نماذج التعلم العميق مثل CNN تحقق أداءً ممتازًا في مهام تقسيم الأراضي الرطبة، إلا أنها تتطلب كميات كبيرة من البيانات المعلّمة
تكلفة إنشاء البيانات المعلّمة عالية وتستغرق وقتًا طويلاً، خاصة في مجال الاستشعار عن بعد الذي يتطلب معرفة متخصصة
يصعب على النموذج التكيف مع ظروف مناخية مختلفة أو تغييرات أجهزة الاستشعار
الاعتماد على مجموعات البيانات العالمية أو الوطنية، مع تكرار تحديث منخفض، مما لا يلبي احتياجات مراقبة المسطحات المائية الموسمية
يكمن الدافع الأساسي لهذا البحث في تطوير إطار عمل تعلم آلي ذاتي الإشراف بالكامل، يستخدم فقط صور الأقمار الصناعية الرادارية لتحقيق تقسيم الأراضي الرطبة بين المياه والأرض، وحل مشكلة الاعتماد على البيانات المعلّمة، وتحسين قابلية التوسع والتكيف للنموذج.
اقتراح إطار عمل AquaCluster: إطار عمل تعلم آلي ذاتي الإشراف بالكامل، يستخدم فقط صور الأقمار الصناعية الرادارية لتقسيم الأراضي الرطبة دلاليًا، مما يحل تحدي الكشف عن المياه تحت الغطاء النباتي بدون بيانات معلّمة.
إدخال نسخة نموذج متكاملة: لتحسين الدقة والاستقرار، تم اقتراح نسخة متكاملة تجمع نتائج التنبؤ من عدة شبكات مدربة بشكل مستقل.
التحقق من فعالية التدريب بدون تعليقات: إثبات أن نموذج AquaCluster المتكامل يتفوق على طرق الخط الأساسي الإحصائية Otsu وطرق Dynamic World القائمة على البيانات البصرية على نفس مجموعة البيانات.
توفير تطبيق مفتوح المصدر: جميع أكواد المصدر ومجموعات البيانات الاختبارية والنماذج المدربة مسبقًا متاحة على GitHub، مما يعزز إعادة إنتاج البحث والتطبيق العملي.
الإدخال: صور الأقمار الصناعية الرادارية (Sentinel-1 نطاق C)
الإخراج: خريطة تقسيم ثنائية التصنيف على مستوى البكسل (مياه/أرض)
القيود: تدريب غير موجه بالكامل، بدون استخدام أي بيانات معلّمة يدويًا
تستشهد الورقة بـ 60 مرجعًا ذا صلة، تغطي مجالات متعددة بما في ذلك علم البيئة للأراضي الرطبة والاستشعار عن بعد والتعلم العميق والتعلم ذاتي الإشراف، مما يوفر أساسًا نظريًا قويًا للبحث.
التقييم الإجمالي: هذه ورقة بحثية عالية الجودة موجهة نحو التطبيق، تقترح حلاً مبتكرًا لمشكلة عملية، مع مساهمة تقنية معينة وقيمة عملية عالية. على الرغم من وجود نقص في التحليل النظري وحجم مجموعة البيانات، فإن مساهمتها مفتوحة المصدر وقيمتها العملية تجعلها عملاً مهمًا في هذا المجال.