2025-11-12T19:28:10.441432

AquaCluster: Using Satellite Images And Self-supervised Machine Learning Networks To Detect Water Hidden Under Vegetation

Iakovidis, Kalantari, Payberah et al.
In recent years, the wide availability of high-resolution radar satellite images has enabled the remote monitoring of wetland surface areas. Machine learning models have achieved state-of-the-art results in segmenting wetlands from satellite images. However, these models require large amounts of manually annotated satellite images, which are slow and expensive to produce. The need for annotated training data makes it difficult to adapt these models to changes such as different climates or sensors. To address this issue, we employed self-supervised training methods to develop a model, AquaCluster, which segments radar satellite images into water and land areas without manual annotations. Our final model outperformed other radar-based water detection techniques that do not require annotated data in our test dataset, having achieved a 0.08 improvement in the Intersection over Union metric. Our results demonstrate that it is possible to train machine learning models to detect vegetated water from radar images without the use of annotated data, which can make the retraining of these models to account for changes much easier.
academic

AquaCluster: Использование спутниковых снимков и самообучающихся сетей машинного обучения для обнаружения воды под растительностью

Основная информация

  • ID статьи: 2506.08214
  • Название: AquaCluster: Using Satellite Images And Self-supervised Machine Learning Networks To Detect Water Hidden Under Vegetation
  • Авторы: Ioannis Iakovidis, Zahra Kalantari, Amir H. Payberah, Fernando Jaramillo, Francisco J. Peña
  • Категория: cs.CV (Компьютерное зрение)
  • Дата публикации: 16 октября 2025 г. (Препринт)
  • Ссылка на статью: https://arxiv.org/abs/2506.08214v3

Аннотация

В последние годы широкая доступность высокоразрешающих радиолокационных спутниковых снимков сделала возможным дистанционный мониторинг площади поверхности водно-болотных угодий. Модели машинного обучения достигли передовых результатов в задаче сегментации водно-болотных угодий на спутниковых снимках. Однако эти модели требуют большого количества вручную аннотированных спутниковых снимков, которые дорогостоящи и трудозатратны в создании. Потребность в аннотированных данных обучения затрудняет адаптацию этих моделей к различиям в климате или датчиках. Для решения этой проблемы в данном исследовании использован метод самообучения для разработки модели AquaCluster, которая может сегментировать радиолокационные спутниковые снимки на водные и наземные области без ручной аннотации. На тестовом наборе данных модель показала лучший результат среди методов обнаружения воды на радиолокационных снимках без аннотированных данных, достигнув улучшения на 0,08 по метрике пересечения над объединением (IoU). Результаты исследования показывают, что возможно обучить модели машинного обучения обнаруживать водные объекты под растительностью на радиолокационных снимках без использования аннотированных данных, что облегчает переобучение моделей для адаптации к изменениям.

Предпосылки и мотивация исследования

Контекст проблемы

  1. Важность мониторинга водно-болотных угодий: Хотя водно-болотные угодья занимают небольшую часть земной поверхности, они играют ключевую роль в охране окружающей среды и защите от климатических воздействий, включая очистку воды, снижение риска наводнений и накопление больших объемов углерода. Однако из-за изменения климата и деятельности человека водно-болотные угодья исчезают с угрожающей скоростью.
  2. Вызовы обнаружения водных объектов под растительностью: Традиционные оптические спутниковые снимки хорошо работают при обнаружении открытых водных объектов, но испытывают трудности при обнаружении водно-болотных угодий, частично или полностью покрытых растительностью, поскольку оптические датчики не могут проникать сквозь растительность. Хотя радиолокационные датчики могут проникать сквозь растительность и обнаруживать воду под ней, радиолокационные снимки содержат шум (такой как пятнистый шум), что затрудняет различие между водой и сушей.
  3. Ограничения существующих методов:
    • Модели глубокого обучения, такие как CNN, хотя и показывают отличные результаты в задачах сегментации водно-болотных угодий, требуют больших объемов аннотированных данных
    • Создание аннотированных данных дорогостояще и трудозатратно, особенно в области дистанционного зондирования, требующей специальных знаний
    • Модели сложно адаптировать к различиям в климатических условиях или датчиках
    • Зависимость от глобальных или национальных наборов данных с низкой частотой обновления не может удовлетворить потребности мониторинга сезонных водных объектов

Мотивация исследования

Основная мотивация данного исследования заключается в разработке полностью самообучающейся системы машинного обучения, которая использует только радиолокационные спутниковые снимки для сегментации водно-болотных угодий, решая проблему зависимости от аннотированных данных и повышая масштабируемость и адаптивность модели.

Основные вклады

  1. Предложена структура AquaCluster: Полностью самообучающаяся система машинного обучения, использующая только радиолокационные спутниковые снимки для семантической сегментации водно-болотных угодий, решающая задачу обнаружения воды под растительностью без аннотированных данных.
  2. Введена версия ансамблевой модели: Для повышения точности и стабильности предложена ансамблевая версия модели, объединяющая прогнозы нескольких независимо обученных сетей.
  3. Подтверждена эффективность обучения без аннотаций: Доказано, что ансамблевая модель AquaCluster превосходит базовые статистические методы Otsu и модель Dynamic World на основе оптических данных на одном и том же наборе данных.
  4. Предоставлена реализация с открытым исходным кодом: Весь исходный код, тестовые наборы данных и предварительно обученные модели доступны в открытом доступе на GitHub, способствуя воспроизведению исследований и распространению приложений.

Подробное описание метода

Определение задачи

Входные данные: Радиолокационные спутниковые снимки (Sentinel-1 C-диапазон) Выходные данные: Пиксельная двоичная классификация вода-суша Ограничение: Полностью неконтролируемое обучение без использования каких-либо вручную аннотированных данных

Архитектура модели

AquaCluster использует стратегию самообучения, объединяющую глубокую кластеризацию и отрицательную выборку, включающую следующие компоненты:

1. Подмодель кодирования (Encoding Sub-model)

  • На основе улучшенной архитектуры U-Net
  • Содержит пути сжатия и расширения
  • Заменяет слои транспонированной свертки на простые слои повышающей дискретизации для избежания артефактов шахматной доски
  • Генерирует вектор кодирования для каждого пикселя

2. Подмодель предсказания (Prediction Sub-model)

  • Архитектура однослойной CNN
  • Преобразует пиксельное кодирование в вероятности класса
  • Выходное количество классов (N_class=10) больше количества реальных классов (2)

3. Три пути обучения

  • Стандартный путь обучения: Обработка исходных блоков изображения
  • Путь обучения с увеличением: Обработка блоков изображения с гауссовым размытием
  • Путь обучения с увеличением и перемешиванием: Обработка перемешанных блоков увеличенного изображения

Алгоритм обучения

Процесс обучения включает 11 шагов, основная идея которых заключается в объединении глубокой кластеризации и отрицательной выборки:

Потеря глубокой кластеризации

L_c = Σ weighted_cross_entropy(pseudo_labels, predictions)
L̂_c = Σ weighted_cross_entropy(augmented_pseudo_labels, augmented_predictions)

Потеря пространственной согласованности

  • Потеря положительных пар: L_p = Σ|P_original - P_augmented|
  • Потеря отрицательных пар: L_n = -Σ|P_original - P_shuffled|

Общая функция потерь

L = α_c × (L_c + L̂_c) + α_p × L_p + α_n × L_n

Технические инновации

  1. Использование пространственной информации: Создание положительных пар через гауссово размытие, использование пространственной непрерывности спутниковых снимков
  2. Стратегия многоклассового выхода: Использование 10 классов модели вместо 2 реальных классов для повышения детализации сегментации
  3. Постобработка и отображение: Отображение классов модели на реальные классы вода-суша через метрику IoU
  4. Ансамблевое обучение: Использование голосования нескольких моделей для снижения нестабильности отдельной модели

Экспериментальная установка

Наборы данных

Набор данных обучения

  • Набор радиолокационных данных Örebro: Радиолокационные спутниковые снимки водно-болотных угодий округа Örebro, Швеция
  • Время сбора: 4 июля 2018 г.
  • Разрешение: Разрешение пикселя 10 метров
  • Разделение данных: 639 блоков размером 512×512 пикселей, 80% для обучения, 20% для валидации
  • Доля водяных пикселей: 9,42%

Набор тестовых данных

  • Набор радиолокационных данных Swedish Wetlands: 39 радиолокационных снимков трех шведских водно-болотных угодий
  • Названия водно-болотных угодий: Hjalstaviken, Hornborgarsjon, Svartadalen
  • Временной диапазон: 2018-2019 гг. (исключены декабрь-март для избежания помех от снега)
  • Размер изображения: От 266×669 до 1049×1667 пикселей
  • Доля водяных пикселей: 22,27%

Метрики оценки

  1. Точность (Accuracy): (TP+TN)/(TP+TN+FP+FN)
  2. Полнота (Precision): TP/(TP+FP)
  3. Чувствительность (Recall): TP/(TP+FN)
  4. F1-мера: 2×(Precision×Recall)/(Precision+Recall)
  5. Пересечение над объединением (IoU): (A_pred ∩ A_gt + ε)/(A_pred ∪ A_gt + ε)

Методы сравнения

  1. Пороговая обработка Otsu: Неконтролируемый метод на основе статистики, минимизирующий внутриклассовую дисперсию
  2. Dynamic World: Набор данных о земном покрове машинного обучения на основе оптических изображений

Детали реализации

  • Обучение 10 независимых моделей AquaCluster
  • Ансамблевый метод использует простое большинственное голосование на уровне пикселей
  • Использование легкой архитектуры модели для обеспечения эффективности
  • Веса потерь: α_c, α_p, α_n требуют настройки

Результаты экспериментов

Основные результаты

МодельAccuracyPrecisionRecallF1-ScoreIoU
Otsu0,960,900,890,890,81
Dynamic World0,940,870,820,840,73
AquaCluster0,970,880,950,910,85
Ансамбль AquaCluster0,980,920,960,940,89

Ключевые находки

  1. Оптимальность ансамблевой модели: Ансамблевая версия AquaCluster показывает лучший результат по всем метрикам
  2. Значительное улучшение чувствительности: По сравнению с методом Otsu, AquaCluster показывает значительное улучшение в чувствительности и IoU
  3. Превосходство над оптическими методами: Dynamic World показывает худший результат по всем метрикам, демонстрируя преимущества радиолокационных данных при обнаружении воды под растительностью
  4. Стабильность модели: Отдельные модели AquaCluster показывают большую волатильность производительности (IoU от 0,7 до 0,9), ансамблевый метод эффективно повышает стабильность

Анализ примеров

Из результатов визуализации видно:

  • Метод Otsu: Производит аннотации с большим количеством шума, с трудом обрабатывает шум радиолокационных снимков
  • Dynamic World: Показывает плохие результаты в областях границы вода-суша
  • Отдельная модель AquaCluster: Хорошее качество сегментации, но ошибочно классифицирует некоторые более темные области почвы как воду
  • Ансамбль AquaCluster: Значительно снижает проблему неправильной классификации суши

Связанные работы

Применение машинного обучения при обнаружении водно-болотных угодий

  1. Традиционные методы: Применение случайных лесов, машин опорных векторов и других методов к пиксельной классификации
  2. Методы CNN: Mahdianpari и др. впервые применили CNN к картографированию водно-болотных угодий, доказав превосходство CNN над традиционными методами
  3. Сложные архитектуры: Двухпутевые CNN, механизмы внимания, улучшенные U-Net и другие для повышения производительности
  4. Мультимодальное слияние: Объединение оптических и радиолокационных данных для использования преимуществ каждого

Самообучение в дистанционном зондировании

  1. Контрастивное обучение: Адаптация методов, таких как SimCLR, к многолабельной классификации спутниковых снимков
  2. Использование временных данных: Использование снимков одного района в разные сезоны для создания положительных пар
  3. Методы кластеризации: Алгоритмы неконтролируемой сегментации изображений для генерации положительных и отрицательных пар

Преимущество данной работы по сравнению с существующими исследованиями заключается в специальной разработке для радиолокационных снимков, отсутствии необходимости в оптических данных и полностью самообучающемся обучении.

Выводы и обсуждение

Основные выводы

  1. Техническая осуществимость: Доказана осуществимость полностью самообучающейся сегментации водно-болотных угодий с использованием только радиолокационных снимков
  2. Превосходство производительности: Улучшение на 0,08 по метрике IoU по сравнению с базовыми методами, достигнув высокой производительности 0,89
  3. Практическая ценность: Устранение зависимости от аннотированных данных и оптических снимков, повышение адаптивности и масштабируемости модели

Ограничения

  1. Географические ограничения: Тестирование проводилось только на шведских водно-болотных угодьях, способность к обобщению требует проверки
  2. Сезонные ограничения: Исключены зимние данные, способность обработки снежных покрытых областей неизвестна
  3. Нестабильность модели: Отдельные модели показывают большую волатильность производительности, требуя ансамблевого метода для повышения стабильности
  4. Зависимость от постобработки: Требуется этап постобработки для отображения классов модели на реальные классы

Направления будущих исследований

  1. Кросс-региональная валидация: Тестирование обобщающей способности модели в различных климатических и географических условиях
  2. Слияние мультисенсорных данных: Исследование объединения с данными других датчиков
  3. Временное моделирование: Использование многовременных данных для повышения точности обнаружения
  4. Сквозная оптимизация: Сокращение этапов постобработки для более прямого обучения

Глубокая оценка

Преимущества

  1. Высокая специфичность проблемы: Направлена на конкретную и важную задачу обнаружения водных объектов под растительностью
  2. Инновационность метода: Объединение глубокой кластеризации и отрицательной выборки, полное использование особенностей радиолокационных снимков
  3. Разумный дизайн экспериментов: Надлежащий выбор методов сравнения, полный набор метрик оценки
  4. Вклад в открытый исходный код: Предоставление полного кода и данных способствует воспроизведению исследований
  5. Высокая практическая ценность: Решение проблемы дефицита аннотированных данных в практических приложениях

Недостатки

  1. Ограничение размера набора данных: Относительно небольшой набор тестовых данных (39 изображений) может влиять на универсальность выводов
  2. Сложность метода: Требует обучения нескольких моделей и их ансамблирования, высокие вычислительные затраты
  3. Недостаточный анализ чувствительности: Отсутствует подробный анализ выбора гиперпараметров, таких как веса функции потерь
  4. Недостаток теоретического анализа: Отсутствует анализ сходимости метода и теоретические гарантии

Влияние

  1. Академический вклад: Предоставляет новые идеи для самообучающегося анализа спутниковых снимков
  2. Практическая ценность: Имеет важное прикладное значение для мониторинга водно-болотных угодий и охраны окружающей среды
  3. Распространение технологии: Реализация с открытым исходным кодом способствует широкому применению и улучшению метода
  4. Междисциплинарное влияние: Связывает области компьютерного зрения, дистанционного зондирования и наук об окружающей среде

Применимые сценарии

  1. Мониторинг водно-болотных угодий: Мониторинг динамики сезонных водно-болотных угодий
  2. Оценка окружающей среды: Оценка здоровья экосистемы
  3. Климатические исследования: Оценка запасов углерода и анализ влияния изменения климата
  4. Управление ресурсами: Управление водными ресурсами и планирование защиты
  5. Мониторинг стихийных бедствий: Мониторинг наводнений и оценка рисков

Библиография

Статья ссылается на 60 соответствующих источников, охватывающих важные работы в области экологии водно-болотных угодий, технологии дистанционного зондирования, глубокого обучения и самообучения, обеспечивая прочную теоретическую основу для исследования.


Общая оценка: Это высококачественная прикладная исследовательская работа, предлагающая инновационное решение практической проблемы с определенным техническим вкладом и высокой практической ценностью. Хотя она имеет некоторые недостатки в теоретическом анализе и размере набора данных, ее вклад в открытый исходный код и практическая ценность делают ее важной работой в данной области.