2025-11-20T07:19:14.926764

STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging

Bhowmick, Ramanathan, Aakur

Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.

academic

STaTS: 統計的ウィンドウマージングによる構造認識時系列要約

基本情報

論文ID: 2510.09593
タイトル: STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
著者: Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
分類: cs.LG（機械学習）、cs.CV（コンピュータビジョン）
発表時期: 2025年10月
論文リンク: https://arxiv.org/abs/2510.09593

要約

時系列データは通常、局所定常状態間の遷移、反復パターン、変動性バースト等の潜在的な時間構造を含んでいますが、これらの構造は標準的な表現学習パイプラインではほとんど活用されていません。既存モデルは通常、生データまたは固定ウィンドウ列を処理し、すべての時間ステップを同等に重要視するため、長系列またはノイズ系列において効率性の低下、ロバスト性の欠如、スケーラビリティの制限といった問題が生じます。本論文ではSTaTSを提案します。これは構造認識時系列要約のための軽量な教師なしフレームワークであり、単変量および多変量時系列を適応的にコンパクトで情報保持型のトークン列に圧縮できます。

研究背景と動機

問題定義

時系列データは金融、IoT、医療等の分野に広く存在し、センサ技術の進歩に伴い、記録される時系列の長さと複雑性が急速に増加しており、機械学習ベースの系列理解フレームワークに対して膨大な計算需要をもたらしています。

既存手法の限界

従来手法：PAA（区分集約近似）、SAX（記号集約近似）、DTW（動的時間規整）等は効果的な要約を実現していますが、均一なウィンドウ化または厳密な記号符号化に依存しており、信号複雑性の動的変化を無視しています
深層学習手法：TS2Vec、TS-TCCなどは完全な系列を処理するか、スライディングウィンドウを適用しますが、意味的変化を考慮せず、冗長性、計算オーバーヘッド、およびモデルのトークン化と信号の真の遷移間のミスアライメントをもたらします

研究動機

既存手法には以下の問題があります：

固定ウィンドウ戦略は安定領域を過度に分割する可能性がある一方、複雑領域は分割不足である
ノイズ条件下では、均一な処理入力は虚偽パターンを増幅し、汎化能力を低下させる傾向がある
構造認識の欠如は効率性の低下とエラー伝播をもたらす

核心的貢献

STaTSフレームワークの提案：BICベースの変化検出基準に基づき、複数の時間スケールで統計的に一貫した区間を識別する構造認識トークン化フレームワーク
モジュール化された軽量要約パイプライン：顕著なパターンを保持しながら時系列を30倍以上圧縮し、効率的な下流モデリングを実現
モデル非依存の教師なし手法：アーキテクチャ変更または勾配ベースの微調整を必要とせず、既存の時系列エンコーダ（TS2Vecなど）と直接互換性がある
統一インターフェース：分類、予測、ロバスト性タスクに適用可能であり、汎用的な時系列要約前処理ツールとして機能

方法の詳細

タスク定義

多変量時系列 $X \in \mathbb{R}^{T \times d}$ （ $T$ は時間ステップ数、 $d$ は次元数）が与えられたとき、目標は $X$ をより短い系列 $\tilde{X} \in \mathbb{R}^{T' \times d}$ に変換することです。ここで $T' \ll T$ であり、下流タスクに必要な基礎構造を保持します。

モデルアーキテクチャ

1. 分割段階（トークン化）

マルチスケール一貫性検出：

BIC（ベイズ情報量基準）を使用して隣接する時間ウィンドウの統計的類似性を評価
隣接ウィンドウ $x_1, x_2 \in \mathbb{R}^{\delta \times d}$ に対して以下を計算：

$\Delta BIC = -2(\ell_{joint} - \ell_{sep}) + k \log(2\delta)$

ここで：

$\ell_{sep} = -\frac{\delta}{2}(\log|\Sigma_1| + \log|\Sigma_2|)$
$\ell_{joint} = -\delta \log|\Sigma_{12}|$
$k = d + \frac{d(d+1)}{2}$ （全共分散モデルの自由パラメータ数）

グローバル目的関数： $L_{BIC}(\{S_i\}) = \sum_{i=1}^{T'} \left(-\frac{|S_i|}{2}\log|\Sigma_i| + \frac{k}{2}\log|S_i|\right)$

マルチスケール評価：

予定された範囲内の各 $\delta$ 値で統計的一貫性を評価
適応的閾値 $\mu_\delta + \alpha \cdot \sigma_\delta$ を使用して候補分割点を識別
非最大値抑制により冗長検出を排除

2. 要約段階（サマリゼーション）

要約関数： $\phi(S_i) = \frac{1}{|S_i|} \sum_{t=\tau_{i-1}}^{\tau_i-1} x_t$

デフォルト要約操作として平均プーリングを使用し、区間の一次統計特性をキャプチャします。

技術的革新点

適応的分割：固定ウィンドウ手法と異なり、STaTSは局所統計変化に基づいて動的に区間境界を調整
多変量拡張：全共分散行列を通じて多変量時系列に自然に拡張
マルチスケール検出：異なる時間解像度で変化を検出し、短期的な急変と長期的な漸進的変化をキャプチャ
統計的有効性：多変量ガウス仮定下では、区間平均は十分統計量である

実験設定

データセット

単変量分類：UCR-128（128データセット）およびUCR-85（85データセット）
多変量分類：UEA-30（30データセット）
多変量予測：ETTh1、ETTh2、ETTm1、Electricity

評価指標

分類タスク：平均精度および平均ランキング
予測タスク：正規化平均二乗誤差（nMSE）

比較手法

分類ベースライン：T-Loss、TNC、TS-TCC、TST、DTW、TS2Vec
圧縮変種：TS2Vec（均一）、TS2Vec（GMM）
予測ベースライン：Informer、TCN

実装詳細

ウィンドウサイズ範囲： $\delta \in \{5, 10, ..., 500\}$
閾値パラメータ： $\alpha = 2$
最小分離距離： $s_{min} = 20$
数値安定性：共分散正則化 $\epsilon = 10^{-6}$

実験結果

主要結果

単変量分類性能

モデル	UCR-85精度	UCR-85ランク	UCR-128精度	UCR-128ランク	平均長
TS2Vec（元）	0.829	1.99	0.829	2.02	424.4/534.5
TS2Vec（平均）	0.739	4.82	0.741	4.39	12.1/12.9
TS2Vec（均一）	0.621	8.21	0.616	8.10	12.1/12.9
TS2Vec（GMM）	0.655	7.35	0.664	6.92	60.7/73.2