2025-11-15T03:10:19.291336

Rethinking deep learning: linear regression remains a key benchmark in predicting terrestrial water storage

Nie, Kumar, Chen et al.

Recent advances in machine learning such as Long Short-Term Memory (LSTM) models and Transformers have been widely adopted in hydrological applications, demonstrating impressive performance amongst deep learning models and outperforming physical models in various tasks. However, their superiority in predicting land surface states such as terrestrial water storage (TWS) that are dominated by many factors such as natural variability and human driven modifications remains unclear. Here, using the open-access, globally representative HydroGlobe dataset - comprising a baseline version derived solely from a land surface model simulation and an advanced version incorporating multi-source remote sensing data assimilation - we show that linear regression is a robust benchmark, outperforming the more complex LSTM and Temporal Fusion Transformer for TWS prediction. Our findings highlight the importance of including traditional statistical models as benchmarks when developing and evaluating deep learning models. Additionally, we emphasize the critical need to establish globally representative benchmark datasets that capture the combined impact of natural variability and human interventions.

academic

深層学習の再考：陸地水貯蔵量予測における線形回帰の重要なベンチマーク

基本情報

論文ID: 2510.10799
タイトル: Rethinking deep learning: linear regression remains a key benchmark in predicting terrestrial water storage
著者: Wanshu Nie, Sujay V. Kumar, Junyu Chen, Long Zhao, Olya Skulovich, Jinwoong Yoo, Justin Pflug, Shahryar Khalique Ahmad, Goutam Konapala
分類: cs.LG physics.ao-ph physics.geo-ph
所属機関: NASA ゴダード宇宙飛行センター、ジョンズ・ホプキンス大学など
論文リンク: https://arxiv.org/abs/2510.10799

要旨

近年、長短期記憶ネットワーク(LSTM)およびTransformerなどの機械学習技術が水文学的応用で広く採用され、深層学習モデルで優れた性能を示し、様々なタスクで物理モデルを上回っています。しかし、自然変動性と人為的駆動変化など複数の要因に支配される陸地表面状態（陸地水貯蔵量TWS）の予測において、これらの手法の優位性は依然として不明確です。本研究は、オープンアクセスの全球代表的なHydroGlobeデータセット（陸面モデルシミュレーションのみに基づくベースラインバージョンと、複数の遠隔センシングデータ同化を融合した高度なバージョンを含む）を使用して、線形回帰がTWS予測タスクにおいてより複雑なLSTMおよび時間融合Transformerを上回る堅牢なベンチマークであることを示しています。研究結果は、深層学習モデルの開発と評価において従来の統計モデルをベンチマークとして使用することの重要性を強調し、自然変動性と人為的介入の複合的影響を捉えることができる全球代表的なベンチマークデータセット構築の重要な必要性を強調しています。

研究背景と動機

問題定義

陸地水貯蔵量(TWS)は全球淡水利用可能性の重要な指標であり、土壌水分、地下水、地表水、積雪など、すべての形態の陸地水体を含みます。正確なTWS推定は、生態系保全、農業支援、および水と食糧安全保障に不可欠です。

研究動機

水文学における深層学習の普及：LSTMおよびTransformerなどの深層学習モデルが水文学的応用でますます人気が高まっており、特に降雨流出モデリングなどのタスクで優れた性能を示しています
非定常性の課題：TWSは気候変動性と人間活動（地下水採取、土地利用変化、貯水池運用など）の複雑な相互作用の影響を受け、強い非定常性を示しています
ベンチマーク選択の問題：既存研究は深層学習モデル間の比較に焦点を当てることが多く、単純な統計手法との比較が不足しています
データセットの制限：自然および人為的影響を総合的に反映する全球ベンチマークデータセットが不足しています

既存手法の限界

LSTMの限界：長い入力シーケンスでの計算が高コストであり、短いシーケンスでの訓練時に長期依存性を捉える能力が限定されています
Transformerの課題：自己注意メカニズムは本質的に順列不変であり、時間情報の喪失につながる可能性があります
評価バイアス：従来の統計手法との体系的な比較が不足しています

核心的貢献

体系的なベンチマーク比較：線形回帰、LSTM、および時間融合Transformer(TFT)の全球規模のTWS予測タスクにおける性能を初めて体系的に比較しました
HydroGlobeデータセットの応用：自然変動性(OL)と人為的影響(DA)の両バージョンを含む全球水文データセットを使用しました
線形回帰の優位性の実証：単純な線形回帰モデルがTWS予測タスクにおいて複雑な深層学習モデルを一貫して上回ることを実証しました
非定常性分析：非定常環境における異なるモデルの性能差を詳細に分析しました
ベンチマークの重要性の強調：深層学習モデル評価における従来の統計ベンチマークの包含の重要性を強調しました