2025-11-12T19:28:10.441432

AquaCluster: Using Satellite Images And Self-supervised Machine Learning Networks To Detect Water Hidden Under Vegetation

Iakovidis, Kalantari, Payberah et al.
In recent years, the wide availability of high-resolution radar satellite images has enabled the remote monitoring of wetland surface areas. Machine learning models have achieved state-of-the-art results in segmenting wetlands from satellite images. However, these models require large amounts of manually annotated satellite images, which are slow and expensive to produce. The need for annotated training data makes it difficult to adapt these models to changes such as different climates or sensors. To address this issue, we employed self-supervised training methods to develop a model, AquaCluster, which segments radar satellite images into water and land areas without manual annotations. Our final model outperformed other radar-based water detection techniques that do not require annotated data in our test dataset, having achieved a 0.08 improvement in the Intersection over Union metric. Our results demonstrate that it is possible to train machine learning models to detect vegetated water from radar images without the use of annotated data, which can make the retraining of these models to account for changes much easier.
academic

AquaCluster: استخدام صور الأقمار الصناعية وشبكات التعلم الآلي ذاتية الإشراف للكشف عن المياه المخفية تحت الغطاء النباتي

المعلومات الأساسية

  • معرّف الورقة: 2506.08214
  • العنوان: AquaCluster: استخدام صور الأقمار الصناعية وشبكات التعلم الآلي ذاتية الإشراف للكشف عن المياه المخفية تحت الغطاء النباتي
  • المؤلفون: Ioannis Iakovidis, Zahra Kalantari, Amir H. Payberah, Fernando Jaramillo, Francisco J. Peña
  • التصنيف: cs.CV (رؤية الحاسوب)
  • تاريخ النشر: 16 أكتوبر 2025 (نسخة أولية)
  • رابط الورقة: https://arxiv.org/abs/2506.08214v3

الملخص

في السنوات الأخيرة، أتاحت توفر صور الأقمار الصناعية الرادارية عالية الدقة إمكانية المراقبة عن بعد لمساحات الأراضي الرطبة. حققت نماذج التعلم الآلي نتائج متقدمة في مهام تقسيم الأراضي الرطبة من صور الأقمار الصناعية. ومع ذلك، تتطلب هذه النماذج كميات كبيرة من صور الأقمار الصناعية المعلّمة يدويًا، وهي مكلفة وتستغرق وقتًا طويلاً. يجعل الطلب على بيانات التدريب المعلّمة هذه النماذج صعبة التكيف مع التغييرات المختلفة مثل المناخ أو أجهزة الاستشعار. لمعالجة هذه المشكلة، تطور هذه الدراسة نموذج AquaCluster باستخدام طرق التدريب ذاتية الإشراف، والذي يمكنه تقسيم صور الأقمار الصناعية الرادارية إلى مناطق مائية وأرضية دون الحاجة إلى تعليقات يدوية. على مجموعة البيانات الاختبارية، يحقق النموذج أفضل أداء في تقنيات الكشف عن المياه الرادارية التي لا تتطلب بيانات معلّمة، محققًا تحسنًا بمقدار 0.08 في مقياس تقاطع الاتحاد (IoU). تُظهر نتائج البحث أنه يمكن تدريب نماذج التعلم الآلي للكشف عن المياه المغطاة بالنبات من الصور الرادارية دون استخدام بيانات معلّمة، مما يجعل إعادة تدريب النموذج للتكيف مع التغييرات أسهل بكثير.

خلفية البحث والدافع

خلفية المشكلة

  1. أهمية مراقبة الأراضي الرطبة: على الرغم من أن الأراضي الرطبة تشغل جزءًا صغيرًا فقط من سطح الأرض، إلا أنها تلعب دورًا حاسمًا في حماية البيئة والدفاع عن تأثيرات المناخ، بما في ذلك تنقية جودة المياه وتقليل مخاطر الفيضانات وتخزين كميات كبيرة من الكربون. ومع ذلك، تختفي الأراضي الرطبة بمعدل مذهل بسبب تغير المناخ والأنشطة البشرية.
  2. تحديات الكشف عن المياه المغطاة بالنبات: تعمل صور الأقمار الصناعية البصرية التقليدية بشكل جيد في الكشف عن المسطحات المائية المفتوحة، لكنها تواجه صعوبات في الكشف عن مياه الأراضي الرطبة المغطاة جزئيًا أو كليًا بالنبات، لأن أجهزة الاستشعار البصرية لا يمكنها اختراق الغطاء النباتي. على الرغم من أن أجهزة الاستشعار الرادارية يمكنها اختراق النبات للكشف عن المياه الموجودة تحته، إلا أن الصور الرادارية تحتوي على ضوضاء (مثل ضوضاء البقع)، مما يجعل التمييز بين المياه والأرض صعبًا.
  3. قيود الطرق الموجودة:
    • على الرغم من أن نماذج التعلم العميق مثل CNN تحقق أداءً ممتازًا في مهام تقسيم الأراضي الرطبة، إلا أنها تتطلب كميات كبيرة من البيانات المعلّمة
    • تكلفة إنشاء البيانات المعلّمة عالية وتستغرق وقتًا طويلاً، خاصة في مجال الاستشعار عن بعد الذي يتطلب معرفة متخصصة
    • يصعب على النموذج التكيف مع ظروف مناخية مختلفة أو تغييرات أجهزة الاستشعار
    • الاعتماد على مجموعات البيانات العالمية أو الوطنية، مع تكرار تحديث منخفض، مما لا يلبي احتياجات مراقبة المسطحات المائية الموسمية

دافع البحث

يكمن الدافع الأساسي لهذا البحث في تطوير إطار عمل تعلم آلي ذاتي الإشراف بالكامل، يستخدم فقط صور الأقمار الصناعية الرادارية لتحقيق تقسيم الأراضي الرطبة بين المياه والأرض، وحل مشكلة الاعتماد على البيانات المعلّمة، وتحسين قابلية التوسع والتكيف للنموذج.

المساهمات الأساسية

  1. اقتراح إطار عمل AquaCluster: إطار عمل تعلم آلي ذاتي الإشراف بالكامل، يستخدم فقط صور الأقمار الصناعية الرادارية لتقسيم الأراضي الرطبة دلاليًا، مما يحل تحدي الكشف عن المياه تحت الغطاء النباتي بدون بيانات معلّمة.
  2. إدخال نسخة نموذج متكاملة: لتحسين الدقة والاستقرار، تم اقتراح نسخة متكاملة تجمع نتائج التنبؤ من عدة شبكات مدربة بشكل مستقل.
  3. التحقق من فعالية التدريب بدون تعليقات: إثبات أن نموذج AquaCluster المتكامل يتفوق على طرق الخط الأساسي الإحصائية Otsu وطرق Dynamic World القائمة على البيانات البصرية على نفس مجموعة البيانات.
  4. توفير تطبيق مفتوح المصدر: جميع أكواد المصدر ومجموعات البيانات الاختبارية والنماذج المدربة مسبقًا متاحة على GitHub، مما يعزز إعادة إنتاج البحث والتطبيق العملي.

شرح الطريقة

تعريف المهمة

الإدخال: صور الأقمار الصناعية الرادارية (Sentinel-1 نطاق C) الإخراج: خريطة تقسيم ثنائية التصنيف على مستوى البكسل (مياه/أرض) القيود: تدريب غير موجه بالكامل، بدون استخدام أي بيانات معلّمة يدويًا

معمارية النموذج

يعتمد AquaCluster على استراتيجية تدريب ذاتية الإشراف تجمع بين التجميع العميق وأخذ العينات السلبية، وتتضمن المكونات الرئيسية التالية:

1. نموذج الترميز الفرعي (Encoding Sub-model)

  • بناءً على معمارية U-Net المحسّنة
  • يتضمن مسار الانكماش ومسار التوسع
  • استبدال طبقات الالتفاف المنقول بطبقات أخذ العينات البسيطة لتجنب القطع الأثرية على شكل رقعة الشطرنج
  • توليد متجهات ترميز لكل بكسل

2. نموذج التنبؤ الفرعي (Prediction Sub-model)

  • معمارية CNN بطبقة واحدة
  • تحويل الترميز على مستوى البكسل إلى احتمالات الفئة
  • إخراج عدد الفئات (N_class=10) أكبر من عدد الفئات الحقيقية (2)

3. ثلاث مسارات تدريب

  • مسار التدريب القياسي: معالجة كتل الصور الأصلية
  • مسار التدريب المحسّن: معالجة كتل الصور المحسّنة بالتمويه الغاوسي
  • مسار التدريب المحسّن المختلط: معالجة كتل الصور المحسّنة والمختلطة

خوارزمية التدريب

تتضمن عملية التدريب 11 خطوة، والفكرة الأساسية هي الجمع بين التجميع العميق وأخذ العينات السلبية:

خسارة التجميع العميق

L_c = Σ weighted_cross_entropy(pseudo_labels, predictions)
L̂_c = Σ weighted_cross_entropy(augmented_pseudo_labels, augmented_predictions)

خسارة الاتساق المكاني

  • خسارة العينات الموجبة: L_p = Σ|P_original - P_augmented|
  • خسارة العينات السلبية: L_n = -Σ|P_original - P_shuffled|

دالة الخسارة الكلية

L = α_c × (L_c + L̂_c) + α_p × L_p + α_n × L_n

نقاط الابتكار التقني

  1. استخدام المعلومات المكانية: إنشاء عينات موجبة من خلال التمويه الغاوسي، واستخدام الاستمرارية المكانية لصور الأقمار الصناعية
  2. استراتيجية الإخراج متعدد الفئات: استخدام 10 فئات نموذج بدلاً من فئتين حقيقيتين، لتحسين دقة التقسيم
  3. تعيين ما بعد المعالجة: تعيين فئات النموذج إلى الفئات الحقيقية (مياه/أرض) من خلال مقياس IoU
  4. التعلم المتكامل: تقليل عدم استقرار النموذج الفردي من خلال التصويت متعدد النماذج

إعداد التجربة

مجموعات البيانات

مجموعة بيانات التدريب

  • مجموعة بيانات Örebro الرادارية: صور الأقمار الصناعية الرادارية للأراضي الرطبة في مقاطعة Örebro بالسويد
  • وقت الجمع: 4 يوليو 2018
  • الدقة: دقة 10 أمتار لكل بكسل
  • تقسيم البيانات: 639 كتلة صورة بحجم 512×512 بكسل، 80% للتدريب و20% للتحقق
  • نسبة البكسل المائي: 9.42%

مجموعة بيانات الاختبار

  • مجموعة بيانات Swedish Wetlands الرادارية: 39 صورة رادارية من ثلاث أراضٍ رطبة سويدية
  • أسماء الأراضي الرطبة: Hjalstaviken, Hornborgarsjon, Svartadalen
  • نطاق الوقت: 2018-2019 (باستثناء ديسمبر إلى مارس لتجنب تأثير الثلج)
  • حجم الصور: من 266×669 إلى 1049×1667 بكسل
  • نسبة البكسل المائي: 22.27%

مقاييس التقييم

  1. الدقة (Accuracy): (TP+TN)/(TP+TN+FP+FN)
  2. الدقة (Precision): TP/(TP+FP)
  3. الاستدعاء (Recall): TP/(TP+FN)
  4. درجة F1: 2×(Precision×Recall)/(Precision+Recall)
  5. تقاطع الاتحاد (IoU): (A_pred ∩ A_gt + ε)/(A_pred ∪ A_gt + ε)

طرق المقارنة

  1. تقسيم عتبة Otsu: طريقة غير موجهة قائمة على الإحصائيات، تقلل التباين داخل الفئة
  2. Dynamic World: مجموعة بيانات تغطية الأراضي للتعلم الآلي القائمة على الصور البصرية

تفاصيل التطبيق

  • تدريب 10 نماذج AquaCluster مستقلة
  • طريقة التكامل تستخدم التصويت البسيط بالأغلبية على مستوى البكسل
  • استخدام معمارية نموذج خفيفة الوزن لضمان الكفاءة
  • أوزان الخسارة: α_c, α_p, α_n تحتاج إلى ضبط

نتائج التجربة

النتائج الرئيسية

النموذجالدقةالدقةالاستدعاءدرجة F1IoU
Otsu0.960.900.890.890.81
Dynamic World0.940.870.820.840.73
AquaCluster0.970.880.950.910.85
AquaCluster المتكامل0.980.920.960.940.89

النتائج الرئيسية

  1. النموذج المتكامل هو الأفضل: نسخة AquaCluster المتكاملة تحقق أفضل أداء في جميع المقاييس
  2. تحسن كبير في الاستدعاء: مقارنة بطريقة Otsu، يحقق AquaCluster تحسنًا ملحوظًا في الاستدعاء و IoU
  3. تفوق على الطرق البصرية: Dynamic World يحقق أسوأ أداء في جميع المقاييس، مما يدل على مزايا بيانات الرادار في الكشف عن المياه المغطاة بالنبات
  4. استقرار النموذج: يتقلب أداء نموذج AquaCluster الفردي بشكل كبير (IoU من 0.7 إلى 0.9)، وطريقة التكامل تحسن الاستقرار بشكل فعال

تحليل الحالات

من نتائج التصور يمكن ملاحظة:

  • طريقة Otsu: تنتج تعليقات بضوضاء أكثر، يصعب التعامل مع ضوضاء الصور الرادارية
  • Dynamic World: تحقق أداءً أسوأ في مناطق حدود المياه والأرض
  • نموذج AquaCluster الفردي: جودة تقسيم جيدة لكن قد يصنف بعض مناطق التربة الأغمق كمياه بالخطأ
  • AquaCluster المتكامل: يقلل بشكل ملحوظ من مشاكل تصنيف الأرض بالخطأ

الأعمال ذات الصلة

تطبيقات التعلم الآلي في كشف الأراضي الرطبة

  1. الطرق التقليدية: تطبيق الغابات العشوائية والآلات الموجهة بالمتجهات وغيرها على تصنيف البكسل الفردي
  2. طرق CNN: كان Mahdianpari وآخرون أول من طبق CNN على رسم خرائط الأراضي الرطبة، مما أثبت تفوق CNN على الطرق التقليدية
  3. المعماريات المعقدة: CNN ثنائي المسار وآليات الانتباه و U-Net المحسّن وغيرها لتحسين الأداء
  4. دمج البيانات متعددة الأنماط: الجمع بين البيانات البصرية والرادارية للاستفادة من مزايا كل منهما

التعلم ذاتي الإشراف في الاستشعار عن بعد

  1. التعلم المتناقض: طرق مثل SimCLR تم تكييفها لتصنيف الأقمار الصناعية متعدد التسميات
  2. استخدام البيانات الزمنية: استخدام صور المنطقة نفسها في فصول مختلفة لإنشاء عينات موجبة
  3. طرق التجميع: خوارزميات تقسيم الصور غير الموجهة لإنشاء عينات موجبة وسلبية

تتمثل مزايا هذه الورقة مقارنة بالأعمال الموجودة في: التصميم المتخصص لصور الرادار، بدون الحاجة إلى البيانات البصرية، تدريب ذاتي الإشراف بالكامل.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. الجدوى التقنية: إثبات جدوى تقسيم الأراضي الرطبة ذاتي الإشراف بالكامل باستخدام صور الرادار فقط
  2. تفوق الأداء: تحسن بمقدار 0.08 في مقياس IoU مقارنة بطرق الخط الأساسي، محققًا أداءً عالية بقيمة 0.89
  3. القيمة العملية: القضاء على الاعتماد على البيانات المعلّمة والصور البصرية، تحسين قابلية التكيف والتوسع للنموذج

القيود

  1. القيود الجغرافية: تم الاختبار فقط على الأراضي الرطبة السويدية، وقدرة التعميم تحتاج إلى التحقق
  2. قيود موسمية: تم استبعاد بيانات الشتاء، وقدرة التعامل مع المناطق المغطاة بالثلج غير معروفة
  3. عدم استقرار النموذج: تقلب أداء النموذج الفردي كبير، يتطلب طريقة التكامل لتحسين الاستقرار
  4. الاعتماد على ما بعد المعالجة: يتطلب خطوات ما بعد المعالجة لتعيين فئات النموذج إلى الفئات الحقيقية

الاتجاهات المستقبلية

  1. التحقق عبر المناطق: اختبار قدرة تعميم النموذج في ظروف مناخية وجغرافية مختلفة
  2. دمج أجهزة استشعار متعددة: استكشاف الجمع مع بيانات أجهزة استشعار أخرى
  3. النمذجة الزمنية: استخدام بيانات متعددة الفترات الزمنية لتحسين دقة الكشف
  4. التحسين من طرف إلى طرف: تقليل خطوات ما بعد المعالجة، تحقيق تدريب أكثر مباشرة

التقييم المتعمق

المميزات

  1. قوة استهداف المشكلة: استهداف مشكلة محددة وهامة وهي الكشف عن المياه المغطاة بالنبات
  2. ابتكار الطريقة: الجمع بين التجميع العميق وأخذ العينات السلبية، الاستفادة الكاملة من خصائص صور الرادار
  3. تصميم التجربة المعقول: اختيار طرق المقارنة مناسب، مقاييس التقييم شاملة
  4. المساهمة مفتوحة المصدر: توفير أكواد وبيانات كاملة، تعزيز إعادة إنتاج البحث
  5. قيمة عملية عالية: حل مشكلة ندرة البيانات المعلّمة في التطبيقات العملية

أوجه القصور

  1. قيود حجم مجموعة البيانات: مجموعة البيانات الاختبارية نسبيًا صغيرة (39 صورة)، قد تؤثر على عمومية الاستنتاجات
  2. تعقيد الطريقة: يتطلب تدريب نماذج متعددة والقيام بالتكامل، تكلفة حسابية أعلى
  3. حساسية المعاملات الفائقة: اختيار أوزان دالة الخسارة وغيرها من المعاملات الفائقة يفتقر إلى تحليل تفصيلي
  4. نقص التحليل النظري: نقص التحليل لتقارب الطريقة والضمانات النظرية

التأثير

  1. المساهمة الأكاديمية: توفير أفكار جديدة لتحليل الصور الاستشعار عن بعد ذاتي الإشراف
  2. القيمة العملية: تطبيق مهم لمراقبة الأراضي الرطبة وحماية البيئة
  3. نشر التكنولوجيا: يساعد التطبيق مفتوح المصدر على التطبيق الواسع والتحسين
  4. التأثير متعدد التخصصات: ربط مجالات رؤية الحاسوب والاستشعار عن بعد وعلوم البيئة

السيناريوهات القابلة للتطبيق

  1. مراقبة الأراضي الرطبة: مراقبة الأراضي الرطبة الموسمية الديناميكية
  2. التقييم البيئي: تقييم صحة النظام البيئي
  3. أبحاث المناخ: تقييم مخزون الكربون وتحليل تأثيرات تغير المناخ
  4. إدارة الموارد: إدارة وحماية موارد المياه والتخطيط
  5. مراقبة الكوارث: مراقبة الفيضانات وتقييم المخاطر

المراجع

تستشهد الورقة بـ 60 مرجعًا ذا صلة، تغطي مجالات متعددة بما في ذلك علم البيئة للأراضي الرطبة والاستشعار عن بعد والتعلم العميق والتعلم ذاتي الإشراف، مما يوفر أساسًا نظريًا قويًا للبحث.


التقييم الإجمالي: هذه ورقة بحثية عالية الجودة موجهة نحو التطبيق، تقترح حلاً مبتكرًا لمشكلة عملية، مع مساهمة تقنية معينة وقيمة عملية عالية. على الرغم من وجود نقص في التحليل النظري وحجم مجموعة البيانات، فإن مساهمتها مفتوحة المصدر وقيمتها العملية تجعلها عملاً مهمًا في هذا المجال.