AquaCluster: Using Satellite Images And Self-supervised Machine Learning Networks To Detect Water Hidden Under Vegetation
Iakovidis, Kalantari, Payberah et al.
In recent years, the wide availability of high-resolution radar satellite images has enabled the remote monitoring of wetland surface areas. Machine learning models have achieved state-of-the-art results in segmenting wetlands from satellite images. However, these models require large amounts of manually annotated satellite images, which are slow and expensive to produce. The need for annotated training data makes it difficult to adapt these models to changes such as different climates or sensors. To address this issue, we employed self-supervised training methods to develop a model, AquaCluster, which segments radar satellite images into water and land areas without manual annotations. Our final model outperformed other radar-based water detection techniques that do not require annotated data in our test dataset, having achieved a 0.08 improvement in the Intersection over Union metric. Our results demonstrate that it is possible to train machine learning models to detect vegetated water from radar images without the use of annotated data, which can make the retraining of these models to account for changes much easier.
academic
AquaCluster: उपग्रह छवियों और स्व-निरीक्षित मशीन लर्निंग नेटवर्क का उपयोग करके वनस्पति के तहत छिपे हुए जल का पता लगाना
हाल के वर्षों में, उच्च-रिज़ॉल्यूशन रडार उपग्रह छवियों की व्यापक उपलब्धता ने आर्द्रभूमि सतह क्षेत्र की दूरस्थ निगरानी को संभव बनाया है। मशीन लर्निंग मॉडल उपग्रह छवि आर्द्रभूमि विभाजन कार्य पर अत्याधुनिक परिणाम प्राप्त कर चुके हैं। हालांकि, इन मॉडलों को बड़ी मात्रा में मैन्युअल रूप से एनोटेट की गई उपग्रह छवियों की आवश्यकता होती है, जिनके निर्माण में उच्च लागत और समय व्यय होता है। एनोटेट किए गए प्रशिक्षण डेटा की आवश्यकता इन मॉडलों को विभिन्न जलवायु या सेंसर जैसे परिवर्तनों के अनुकूल बनाना कठिन बनाती है। इस समस्या को हल करने के लिए, यह अनुसंधान स्व-निरीक्षित प्रशिक्षण विधि का उपयोग करके AquaCluster मॉडल विकसित करता है, जो बिना मैन्युअल एनोटेशन के रडार उपग्रह छवियों को जल और स्थल क्षेत्रों में विभाजित कर सकता है। परीक्षण डेटासेट पर, यह मॉडल बिना एनोटेट किए गए डेटा के रडार जल निकाय पहचान तकनीक में सर्वश्रेष्ठ प्रदर्शन करता है, इंटरसेक्शन ओवर यूनियन (IoU) मेट्रिक पर 0.08 की वृद्धि प्राप्त करता है। अनुसंधान परिणाम दर्शाते हैं कि एनोटेट किए गए डेटा का उपयोग किए बिना मशीन लर्निंग मॉडल को रडार छवियों से वनस्पति-आच्छादित जल निकायों का पता लगाने के लिए प्रशिक्षित किया जा सकता है, जिससे परिवर्तनों के अनुकूल होने के लिए मॉडल को पुनः प्रशिक्षित करना आसान हो जाता है।
आर्द्रभूमि निगरानी का महत्व: आर्द्रभूमि पृथ्वी की सतह का केवल एक छोटा सा हिस्सा है, लेकिन पर्यावरण संरक्षण और जलवायु प्रभाव सुरक्षा में महत्वपूर्ण भूमिका निभाती है, जिसमें जल शुद्धिकरण, बाढ़ जोखिम में कमी, बड़ी मात्रा में कार्बन भंडारण शामिल है। हालांकि, जलवायु परिवर्तन और मानव गतिविधियों के कारण, आर्द्रभूमि तेजी से गायब हो रही है।
वनस्पति-आच्छादित जल निकाय पहचान की चुनौतियां: पारंपरिक ऑप्टिकल उपग्रह छवियां खुले जल निकायों का पता लगाने में अच्छी तरह काम करती हैं, लेकिन आंशिक या पूरी तरह वनस्पति से ढकी आर्द्रभूमि जल निकायों का पता लगाना कठिन है, क्योंकि ऑप्टिकल सेंसर वनस्पति को भेद नहीं सकते। रडार सेंसर वनस्पति को भेदकर नीचे के जल निकायों का पता लगा सकते हैं, लेकिन रडार छवियों में शोर (जैसे स्पेकल शोर) होता है, जिससे जल और स्थल को अलग करना कठिन हो जाता है।
मौजूदा विधियों की सीमाएं:
CNN जैसे गहन शिक्षण मॉडल आर्द्रभूमि विभाजन कार्य पर उत्कृष्ट प्रदर्शन करते हैं, लेकिन बड़ी मात्रा में एनोटेट किए गए डेटा की आवश्यकता होती है
एनोटेट किए गए डेटा का निर्माण महंगा, समय लेने वाला है, विशेष रूप से दूरसंवेदन क्षेत्र में जहां विशेषज्ञ ज्ञान की आवश्यकता होती है
मॉडल विभिन्न जलवायु परिस्थितियों या सेंसर परिवर्तनों के अनुकूल होना कठिन है
वैश्विक या राष्ट्रीय स्तर के डेटासेट पर निर्भरता, कम अपडेट आवृत्ति, मौसमी जल निकाय निगरानी की आवश्यकता को पूरा नहीं कर सकते
इस अनुसंधान की मूल प्रेरणा एक पूरी तरह से स्व-निरीक्षित मशीन लर्निंग ढांचा विकसित करना है जो केवल रडार उपग्रह छवियों का उपयोग करके आर्द्रभूमि जल-स्थल विभाजन को प्राप्त कर सके, एनोटेट किए गए डेटा पर निर्भरता को हल करे, और मॉडल की स्केलेबिलिटी और अनुकूलनशीलता में सुधार करे।
AquaCluster ढांचा प्रस्तावित किया: एक पूरी तरह से स्व-निरीक्षित मशीन लर्निंग ढांचा जो केवल रडार उपग्रह छवियों का उपयोग करके आर्द्रभूमि शब्दार्थ विभाजन करता है, बिना एनोटेट किए गए डेटा के वनस्पति के तहत जल निकायों का पता लगाने की चुनौती को हल करता है।
एकीकृत मॉडल संस्करण पेश किया: सटीकता और स्थिरता में सुधार के लिए, एकीकृत संस्करण मॉडल प्रस्तावित किया गया है, जो कई स्वतंत्र रूप से प्रशिक्षित नेटवर्क के पूर्वानुमान परिणामों को जोड़ता है।
बिना एनोटेशन प्रशिक्षण की प्रभावशीलता को सत्यापित किया: एकीकृत AquaCluster मॉडल समान डेटासेट पर आधारभूत सांख्यिकीय विधि Otsu और ऑप्टिकल-आधारित Dynamic World मॉडल से बेहतर है, यह साबित करता है।
ओपन सोर्स कार्यान्वयन प्रदान किया: सभी स्रोत कोड, परीक्षण डेटासेट और पूर्व-प्रशिक्षित मॉडल GitHub पर ओपन सोर्स हैं, अनुसंधान पुनरुत्पादन और अनुप्रयोग प्रचार को बढ़ावा देते हैं।
इनपुट: रडार उपग्रह छवियां (Sentinel-1 C-बैंड)
आउटपुट: पिक्सल-स्तरीय जल-स्थल द्विआधारी वर्गीकरण विभाजन मानचित्र
बाधा: पूरी तरह से बिना निरीक्षण प्रशिक्षण, किसी भी मैन्युअल एनोटेशन डेटा का उपयोग नहीं
एकीकृत मॉडल सर्वश्रेष्ठ: AquaCluster एकीकृत संस्करण सभी मेट्रिक्स पर सर्वश्रेष्ठ प्रदर्शन करता है
रिकॉल में उल्लेखनीय सुधार: Otsu विधि की तुलना में, AquaCluster रिकॉल और IoU में उल्लेखनीय सुधार दिखाता है
ऑप्टिकल विधि से बेहतर: Dynamic World सभी मेट्रिक्स पर सबसे खराब प्रदर्शन करता है, जो वनस्पति-आच्छादित जल निकाय पहचान में रडार डेटा के लाभ को दर्शाता है
मॉडल स्थिरता: एकल AquaCluster मॉडल प्रदर्शन में अधिक उतार-चढ़ाव (IoU 0.7 से 0.9 तक), एकीकृत विधि प्रभावी रूप से स्थिरता में सुधार करती है
विपरीत शिक्षण: SimCLR आदि विधियां उपग्रह छवि बहु-लेबल वर्गीकरण के लिए अनुकूलित
समय-श्रृंखला डेटा उपयोग: समान क्षेत्र की विभिन्न मौसमी छवियों का उपयोग करके सकारात्मक नमूना जोड़ी बनाता है
क्लस्टरिंग विधियां: बिना निरीक्षण छवि विभाजन एल्गोरिथ्म सकारात्मक-नकारात्मक नमूना जोड़ी उत्पन्न करते हैं
इस पेपर की मौजूदा कार्य पर श्रेष्ठता यह है कि: रडार छवियों के लिए विशेष रूप से डिज़ाइन किया गया, ऑप्टिकल डेटा की आवश्यकता नहीं, पूरी तरह से स्व-निरीक्षित प्रशिक्षण।
पेपर ने 60 संबंधित संदर्भों का हवाला दिया है, जिसमें आर्द्रभूमि पारिस्थितिकी, दूरसंवेदन तकनीक, गहन शिक्षण और स्व-निरीक्षित शिक्षण आदि कई क्षेत्रों के महत्वपूर्ण कार्य शामिल हैं, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं।
समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला अनुप्रयोग-केंद्रित अनुसंधान पेपर है, जो व्यावहारिक समस्याओं के लिए नवीन समाधान प्रस्तावित करता है, तकनीकी रूप से कुछ योगदान है, व्यावहारिक मूल्य अधिक है। हालांकि सैद्धांतिक विश्लेषण और डेटासेट आकार के पहलुओं में कुछ कमी है, लेकिन इसका ओपन सोर्स योगदान और व्यावहारिक अनुप्रयोग मूल्य इसे इस क्षेत्र का एक महत्वपूर्ण कार्य बनाता है।