2025-11-20T07:19:14.926764

STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging

Bhowmick, Ramanathan, Aakur

Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.

academic

STaTS : Résumé de Séquences Temporelles Conscient de la Structure via Fusion de Fenêtres Statistiques

Informations de Base

ID de l'article : 2510.09593
Titre : STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
Auteurs : Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
Classification : cs.LG (Apprentissage Automatique), cs.CV (Vision par Ordinateur)
Date de Publication : Octobre 2025
Lien de l'article : https://arxiv.org/abs/2510.09593

Résumé

Les données de séries temporelles contiennent généralement des structures temporelles latentes, telles que les transitions entre états localement stationnaires, les motifs répétitifs et les rafales de variabilité, mais ces structures sont rarement exploitées dans les pipelines d'apprentissage de représentation standard. Les modèles existants traitent généralement des séquences brutes ou à fenêtres fixes, considérant tous les pas de temps comme également importants, ce qui entraîne une inefficacité, une robustesse insuffisante et une scalabilité limitée sur les séquences longues ou bruitées. Cet article propose STaTS, un cadre léger et non supervisé pour le résumé de séries temporelles conscient de la structure, capable de compresser de manière adaptative les séries temporelles univariées et multivariées en séquences de tokens compactes et préservant l'information.

Contexte de Recherche et Motivation

Définition du Problème

Les données de séries temporelles sont largement présentes dans les domaines financier, de l'Internet des Objets, médical et autres. Avec les progrès de la technologie des capteurs, la longueur et la complexité des séries temporelles enregistrées augmentent rapidement, imposant des exigences de calcul massives aux cadres d'apprentissage automatique pour la compréhension des séquences.

Limitations des Méthodes Existantes

Méthodes traditionnelles : Telles que PAA (Piecewise Aggregate Approximation), SAX (Symbolic Aggregate approXimation), DTW (Dynamic Time Warping), qui réalisent un résumé efficace mais dépendent de fenêtrage uniforme ou d'encodage symbolique rigide, ignorant les variations dynamiques de la complexité du signal
Méthodes d'apprentissage profond : Comme TS2Vec, TS-TCC qui traitent des séquences complètes ou appliquent des fenêtres glissantes, sans tenir compte des changements sémantiques, entraînant de la redondance, une surcharge de calcul et un désalignement entre la tokenisation du modèle et les transitions réelles du signal

Motivation de la Recherche

Les méthodes existantes présentent les problèmes suivants :

Les stratégies de fenêtres fixes peuvent sur-segmenter les régions stables tout en sous-segmentant les régions complexes
Dans les conditions bruitées, le traitement unifié des entrées tend à amplifier les faux motifs et à réduire la capacité de généralisation
L'absence de conscience structurelle entraîne une inefficacité et une propagation d'erreurs

Contributions Principales

Proposition du cadre STaTS : Cadre de tokenisation conscient de la structure basé sur le critère de détection de changements BIC, identifiant les segments statistiquement cohérents sur plusieurs échelles temporelles
Pipeline de résumé modulaire et léger : Compresse les séries temporelles de plus de 30 fois tout en préservant les motifs significatifs, permettant une modélisation efficace en aval
Méthode non supervisée et indépendante du modèle : Sans modification d'architecture ni optimisation basée sur les gradients, compatible directement avec les encodeurs de séries temporelles existants (comme TS2Vec)
Interface unifiée : Applicable aux tâches de classification, prédiction et robustesse, servant d'outil de prétraitement universel pour le résumé de séries temporelles

Détails de la Méthode

Définition de la Tâche

Étant donné une série temporelle multivariée $X \in \mathbb{R}^{T \times d}$ (où $T$ est le nombre de pas de temps et $d$ est la dimensionnalité), l'objectif est de transformer $X$ en une séquence plus courte $\tilde{X} \in \mathbb{R}^{T' \times d}$ , où $T' \ll T$ , tout en préservant la structure sous-jacente requise pour les tâches en aval.

Architecture du Modèle

1. Phase de Segmentation (Tokenization)

Détection de Cohérence Multi-Échelle :

Utilise le BIC (Critère d'Information Bayésien) pour évaluer la similarité statistique des fenêtres temporelles adjacentes
Pour les fenêtres adjacentes $x_1, x_2 \in \mathbb{R}^{\delta \times d}$ , calcule :

$\Delta BIC = -2(\ell_{joint} - \ell_{sep}) + k \log(2\delta)$

où :

$\ell_{sep} = -\frac{\delta}{2}(\log|\Sigma_1| + \log|\Sigma_2|)$
$\ell_{joint} = -\delta \log|\Sigma_{12}|$
$k = d + \frac{d(d+1)}{2}$ (nombre de paramètres libres du modèle de covariance complète)

Fonction Objective Globale : $L_{BIC}(\{S_i\}) = \sum_{i=1}^{T'} \left(-\frac{|S_i|}{2}\log|\Sigma_i| + \frac{k}{2}\log|S_i|\right)$

Évaluation Multi-Échelle :

Évalue la cohérence statistique pour chaque valeur de $\delta$ dans une plage prédéfinie
Utilise un seuil adaptatif $\mu_\delta + \alpha \cdot \sigma_\delta$ pour identifier les points de segmentation candidats
Élimine les détections redondantes par suppression non-maximale

2. Phase de Résumé (Summarization)

Fonction de Résumé : $\phi(S_i) = \frac{1}{|S_i|} \sum_{t=\tau_{i-1}}^{\tau_i-1} x_t$

Utilise le pooling moyen comme opération de résumé par défaut, capturant les propriétés statistiques du premier ordre du segment.

Points d'Innovation Technique

Segmentation Adaptative : Contrairement aux méthodes de fenêtres fixes, STaTS ajuste dynamiquement les limites des segments en fonction des variations statistiques locales
Extension Multivariée : S'étend naturellement aux séries temporelles multivariées via la matrice de covariance complète
Détection Multi-Échelle : Détecte les changements à différentes résolutions temporelles, capturant les mutations à court terme et les changements graduels à long terme
Validité Statistique : Sous l'hypothèse gaussienne multivariée, la moyenne du segment est une statistique suffisante

Configuration Expérimentale

Ensembles de Données

Classification univariée : UCR-128 (128 ensembles de données) et UCR-85 (85 ensembles de données)
Classification multivariée : UEA-30 (30 ensembles de données)
Prédiction multivariée : ETTh1, ETTh2, ETTm1, Electricity

Métriques d'Évaluation

Tâches de classification : Précision moyenne et classement moyen
Tâches de prédiction : Erreur quadratique moyenne normalisée (nMSE)

Méthodes de Comparaison

Lignes de base de classification : T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
Variantes compressées : TS2Vec (uniforme), TS2Vec (GMM)
Lignes de base de prédiction : Informer, TCN

Détails d'Implémentation

Plage de taille de fenêtre : $\delta \in \{5, 10, ..., 500\}$
Paramètre de seuil : $\alpha = 2$
Distance de séparation minimale : $s_{min} = 20$
Stabilité numérique : Régularisation de covariance $\epsilon = 10^{-6}$

Résultats Expérimentaux

Résultats Principaux

Performance de Classification Univariée

Modèle	Précision UCR-85	Classement UCR-85	Précision UCR-128	Classement UCR-128	Longueur Moyenne
TS2Vec (ori)	0.829	1.99	0.829	2.02	424.4/534.5
TS2Vec (mean)	0.739	4.82	0.741	4.39	12.1/12.9
TS2Vec (uniforme)	0.621	8.21	0.616	8.10	12.1/12.9
TS2Vec (GMM)	0.655	7.35	0.664	6.92	60.7/73.2

Découvertes Clés :

STaTS réalise une compression de 33 fois, maintenant environ 90% de la performance originale
Surpasse significativement les lignes de base de segmentation uniforme et GMM

Robustesse au Bruit

Modèle	UCR-85 (Bruit)	UCR-128 (Bruit)
TS2Vec (ori)	0.336	0.412
TS2Vec (mean)	0.581	0.603
TS2Vec (uniforme)	0.475	0.485
TS2Vec (GMM)	0.505	0.522

Découverte Importante : Dans les conditions bruitées, STaTS non seulement maintient un avantage compétitif, mais surpasse également significativement le modèle à résolution complète.

Classification Multivariée

TS2Vec (mean) : Précision 0.622, Classement 4.70, Compression 20 fois
Surpasse toutes les variantes compressées, maintenant une performance compétitive avec le modèle original

Prédiction de Séries Temporelles

Dans la prédiction à long terme (H=720), STaTS correspond ou surpasse le TS2Vec original sur plusieurs ensembles de données, tout en réalisant une compression de 15 fois.

Études d'Ablation

Comparaison des Stratégies de Segmentation : Segmentation statistique > Segmentation GMM > Segmentation uniforme
Évaluation Multi-Échelle : La détection multi-échelle surpasse la détection à échelle unique
Fonction de Résumé : Le pooling moyen offre les meilleures performances sur la plupart des tâches

Analyse de Cas

L'analyse qualitative montre que STaTS suit mieux les tendances du signal réel dans la prédiction à long terme, réduisant les artefacts d'oscillation, en particulier dans les plages de prédiction ultra-longues (H=720).

Travaux Connexes

Classification de Séries Temporelles

Méthodes classiques : shapelets, méthodes basées sur BOSS et symboles
Apprentissage profond : FCN, ResNet, InceptionTime
Méthodes d'ensemble : HIVE-COTE

Prédiction de Séries Temporelles

Percées précoces : LSTM séquence à séquence
Méthodes modernes : DeepAR, N-BEATS, Temporal Fusion Transformer
Mécanismes d'attention : Informer et autres méthodes d'attention clairsemée

Résumé de Séries Temporelles

Méthodes traditionnelles : PAA, SAX (limitées aux univariées, longueur fixe)
Méthodes modernes : TICC (coûteux en calcul, nécessite une résolution d'optimisation)
Avantages de STaTS : Léger, indépendant du modèle, support multivariable

Conclusion et Discussion

Conclusions Principales

STaTS réalise une compression efficace de séries temporelles consciente de la structure, réalisant une compression de 30 fois tout en maintenant 85-90% de la performance
Montre d'excellentes performances dans les conditions bruitées, fournissant un effet de débruitage implicite
En tant que préprocesseur indépendant du modèle, peut s'intégrer de manière transparente dans les cadres existants

Limitations

Hypothèses Statistiques : Suppose la cohérence statistique locale au sein des segments, peut fonctionner mal sur les mutations dynamiques ou les systèmes chaotiques
Non Bout-à-Bout : N'utilise pas de rétroaction basée sur les gradients pour adapter la stratégie de compression
Sensibilité aux Paramètres : Nécessite l'ajustement de la plage de taille de fenêtre et des paramètres de seuil

Directions Futures

Paramètres En Ligne/Flux : Extension au résumé en temps réel et au déploiement sur les appareils périphériques
Données Multimodales : Intégration aux réseaux de capteurs ou aux données hiérarchiques comme les vidéos
Apprentissage Adaptatif : Systèmes d'apprentissage adaptatif bout-à-bout sous décalage de distribution ou dérive conceptuelle

Évaluation Approfondie

Points Forts

Innovation Méthodologique : Première application du critère BIC multi-échelle à la segmentation adaptative de séries temporelles multivariées
Exhaustivité Expérimentale : Évaluation étendue sur 150+ ensembles de données, couvrant les tâches de classification et prédiction
Valeur Pratique : Amélioration significative de l'efficacité de calcul (compression 30 fois) avec perte de performance minimale
Robustesse : Les performances exceptionnelles dans les conditions bruitées démontrent l'applicabilité pratique de la méthode

Insuffisances

Analyse Théorique Insuffisante : Manque de garanties théoriques sur quand et pourquoi STaTS surpasse les autres méthodes
Sélection de Paramètres : Manque de directives systématiques pour le choix des multiples hyperparamètres
Limitations de Scénarios Applicables : L'applicabilité aux séries temporelles hautement irrégulières ou non-stationnaires n'a pas été suffisamment vérifiée
Analyse de Complexité de Calcul : Manque d'analyse détaillée de la complexité temporelle

Impact

Contribution Académique : Fournit une nouvelle perspective statistique pour la compression de séries temporelles
Valeur Pratique : Peut être directement appliquée aux environnements à ressources limitées et au traitement de séries temporelles à grande échelle
Reproductibilité : Description de méthode claire, détails d'implémentation suffisants

Scénarios Applicables

Traitement de Séquences Longues : Particulièrement adapté aux séries temporelles de longueur irrégulière
Environnements Bruités : Performance exceptionnelle dans les scénarios à bruit élevé
Ressources Limitées : Adapté aux appareils périphériques ou systèmes en temps réel avec ressources informatiques limitées
Outil de Prétraitement : Préprocesseur universel pour les modèles de séries temporelles existants

Références

L'article cite des travaux importants dans les domaines de l'analyse de séries temporelles, de l'apprentissage de représentation et du traitement du signal statistique, notamment :

Méthodes classiques de séries temporelles : PAA, SAX, DTW
Méthodes d'apprentissage profond : TS2Vec, TS-TCC, InceptionTime
Méthodes de segmentation statistique : BIC, TICC
Modèles de prédiction : Informer, N-BEATS, Temporal Fusion Transformer

Évaluation Globale : Cet article est un travail de haute qualité sur le traitement des séries temporelles, avec la méthode STaTS proposée montrant d'excellentes performances en termes de fondement théorique, vérification expérimentale et valeur pratique. Cette méthode comble un vide important dans la compression de séries temporelles consciente de la structure et apporte une contribution significative au domaine de l'analyse des séries temporelles.