Rethinking deep learning: linear regression remains a key benchmark in predicting terrestrial water storage
Nie, Kumar, Chen et al.
Recent advances in machine learning such as Long Short-Term Memory (LSTM) models and Transformers have been widely adopted in hydrological applications, demonstrating impressive performance amongst deep learning models and outperforming physical models in various tasks. However, their superiority in predicting land surface states such as terrestrial water storage (TWS) that are dominated by many factors such as natural variability and human driven modifications remains unclear. Here, using the open-access, globally representative HydroGlobe dataset - comprising a baseline version derived solely from a land surface model simulation and an advanced version incorporating multi-source remote sensing data assimilation - we show that linear regression is a robust benchmark, outperforming the more complex LSTM and Temporal Fusion Transformer for TWS prediction. Our findings highlight the importance of including traditional statistical models as benchmarks when developing and evaluating deep learning models. Additionally, we emphasize the critical need to establish globally representative benchmark datasets that capture the combined impact of natural variability and human interventions.
academic
Переосмысление глубокого обучения: линейная регрессия остается ключевым эталоном при прогнозировании запасов наземной воды
В последние годы методы машинного обучения, такие как долгосрочная краткосрочная память (LSTM) и Transformer, широко применяются в гидрологических приложениях, демонстрируя превосходные результаты в моделях глубокого обучения и превосходя физические модели в различных задачах. Однако их превосходство при прогнозировании состояния земной поверхности (например, запасов наземной воды TWS), на которые влияют множество факторов, включая естественную изменчивость и антропогенные изменения, остается неясным. В данном исследовании используется открытый глобальный репрезентативный набор данных HydroGlobe, включающий базовую версию, основанную исключительно на моделировании земной поверхности, и расширенную версию с ассимиляцией многоисточниковых данных дистанционного зондирования. Результаты показывают, что линейная регрессия является надежным эталоном, превосходящим более сложные модели LSTM и временной Transformer при прогнозировании TWS. Исследование подчеркивает важность использования традиционных статистических моделей в качестве эталонов при разработке и оценке моделей глубокого обучения и подчеркивает критическую необходимость создания глобально репрезентативных наборов данных, способных отражать комплексное воздействие естественной изменчивости и антропогенного вмешательства.
Запасы наземной воды (TWS) являются ключевым показателем глобальной доступности пресной воды, включая все формы наземных водных ресурсов: почвенную влагу, грунтовые воды, поверхностные воды и снежный покров. Точная оценка TWS имеет решающее значение для защиты экосистем, поддержки сельского хозяйства, а также обеспечения водной и продовольственной безопасности.
Популярность глубокого обучения в гидрологии: модели глубокого обучения, такие как LSTM и Transformer, становятся все более популярными в гидрологических приложениях, особенно показывая превосходные результаты в задачах моделирования осадков и стока
Вызовы нестационарности: TWS подвергается сложному взаимодействию климатической изменчивости и деятельности человека (таких как откачка грунтовых вод, изменение землепользования, управление водохранилищами), проявляя сильную нестационарность
Проблема выбора эталона: существующие исследования часто проводят сравнения только между моделями глубокого обучения, не сравнивая их с простыми статистическими методами
Ограничения наборов данных: отсутствие глобальных эталонных наборов данных, комплексно отражающих естественное и антропогенное воздействие
Ограничения LSTM: вычислительно дорогостоящие на длинных входных последовательностях, ограниченная способность захватывать долгосрочные зависимости при обучении на более коротких последовательностях
Вызовы Transformer: механизм самовнимания по своей природе инвариантен к перестановкам, что может привести к потере временной информации
Предвзятость оценки: отсутствие систематического сравнения с традиционными статистическими методами
Систематическое сравнение эталонов: первое систематическое сравнение производительности линейной регрессии, LSTM и временного Transformer (TFT) в задаче глобального прогнозирования TWS
Применение набора данных HydroGlobe: использование глобального гидрологического набора данных с двумя версиями: естественной изменчивости (OL) и антропогенного воздействия (DA)
Доказательство превосходства линейной регрессии: демонстрация того, что простая модель линейной регрессии последовательно превосходит сложные модели глубокого обучения при прогнозировании TWS
Анализ нестационарности: углубленный анализ различий в производительности различных моделей при работе в нестационарной среде
Подчеркивание важности эталонов: акцент на важность включения традиционных статистических эталонов при оценке моделей глубокого обучения
Входные данные: ежемесячные характеристики за последние 12 месяцев (осадки, температура, индекс листовой поверхности LAI, влажность поверхностного слоя почвы SSMC) и статические характеристики (высота, уклон, текстура почвы, тип земного покрова и т.д.)
Выходные данные: запасы наземной воды (TWS) в текущем месяце
Ограничение: исторические значения TWS не используются в качестве входных признаков, что моделирует реальный сценарий прогнозирования
Преимущества LSTM: последовательно превосходят физические модели при моделировании осадков и стока, обладают способностью обрабатывать последовательные данные и обобщаться между водосборами
Развитие Transformer: введены в гидрологию после успеха в обработке естественного языка, но эффективность при работе с временными рядами остается спорной
Проблема эталонов: существующие исследования часто проводят сравнения только между моделями глубокого обучения, не сравнивая с простыми методами
Специфичность задачи: выводы могут быть специфичны для задачи прогнозирования TWS и не обязательно применимы к другим гидрологическим приложениям
Ограничение признаков: отсутствие явных признаков антропогенного вмешательства (таких как объемы ирригационного водозабора) может ограничить преимущества моделей глубокого обучения
Временной диапазон: 18 лет данных может быть недостаточно для полной оценки долгосрочных зависимостей
Пространственный масштаб: агрегирование на уровне водосбора может скрывать сложность подсеточного масштаба
Статья содержит богатую библиографию, охватывающую важные работы в области глубокого обучения, гидрологии, дистанционного зондирования и других областей, предоставляя комплексную основу для связанных исследований.
Общая оценка: Это высококачественная междисциплинарная исследовательская статья, которая посредством строгого экспериментального дизайна и углубленного анализа оспаривает общепринятые предположения о применении глубокого обучения в гидрологии, подчеркивая ценность традиционных статистических методов и важность надлежащего выбора эталонов. Результаты исследования имеют важное методологическое значение для сообществ гидрологии и машинного обучения.