Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.
- ID de l'article : 2510.09593
- Titre : STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
- Auteurs : Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
- Classification : cs.LG (Apprentissage Automatique), cs.CV (Vision par Ordinateur)
- Date de Publication : Octobre 2025
- Lien de l'article : https://arxiv.org/abs/2510.09593
Les données de séries temporelles contiennent généralement des structures temporelles latentes, telles que les transitions entre états localement stationnaires, les motifs répétitifs et les rafales de variabilité, mais ces structures sont rarement exploitées dans les pipelines d'apprentissage de représentation standard. Les modèles existants traitent généralement des séquences brutes ou à fenêtres fixes, considérant tous les pas de temps comme également importants, ce qui entraîne une inefficacité, une robustesse insuffisante et une scalabilité limitée sur les séquences longues ou bruitées. Cet article propose STaTS, un cadre léger et non supervisé pour le résumé de séries temporelles conscient de la structure, capable de compresser de manière adaptative les séries temporelles univariées et multivariées en séquences de tokens compactes et préservant l'information.
Les données de séries temporelles sont largement présentes dans les domaines financier, de l'Internet des Objets, médical et autres. Avec les progrès de la technologie des capteurs, la longueur et la complexité des séries temporelles enregistrées augmentent rapidement, imposant des exigences de calcul massives aux cadres d'apprentissage automatique pour la compréhension des séquences.
- Méthodes traditionnelles : Telles que PAA (Piecewise Aggregate Approximation), SAX (Symbolic Aggregate approXimation), DTW (Dynamic Time Warping), qui réalisent un résumé efficace mais dépendent de fenêtrage uniforme ou d'encodage symbolique rigide, ignorant les variations dynamiques de la complexité du signal
- Méthodes d'apprentissage profond : Comme TS2Vec, TS-TCC qui traitent des séquences complètes ou appliquent des fenêtres glissantes, sans tenir compte des changements sémantiques, entraînant de la redondance, une surcharge de calcul et un désalignement entre la tokenisation du modèle et les transitions réelles du signal
Les méthodes existantes présentent les problèmes suivants :
- Les stratégies de fenêtres fixes peuvent sur-segmenter les régions stables tout en sous-segmentant les régions complexes
- Dans les conditions bruitées, le traitement unifié des entrées tend à amplifier les faux motifs et à réduire la capacité de généralisation
- L'absence de conscience structurelle entraîne une inefficacité et une propagation d'erreurs
- Proposition du cadre STaTS : Cadre de tokenisation conscient de la structure basé sur le critère de détection de changements BIC, identifiant les segments statistiquement cohérents sur plusieurs échelles temporelles
- Pipeline de résumé modulaire et léger : Compresse les séries temporelles de plus de 30 fois tout en préservant les motifs significatifs, permettant une modélisation efficace en aval
- Méthode non supervisée et indépendante du modèle : Sans modification d'architecture ni optimisation basée sur les gradients, compatible directement avec les encodeurs de séries temporelles existants (comme TS2Vec)
- Interface unifiée : Applicable aux tâches de classification, prédiction et robustesse, servant d'outil de prétraitement universel pour le résumé de séries temporelles
Étant donné une série temporelle multivariée X∈RT×d (où T est le nombre de pas de temps et d est la dimensionnalité), l'objectif est de transformer X en une séquence plus courte X~∈RT′×d, où T′≪T, tout en préservant la structure sous-jacente requise pour les tâches en aval.
Détection de Cohérence Multi-Échelle :
- Utilise le BIC (Critère d'Information Bayésien) pour évaluer la similarité statistique des fenêtres temporelles adjacentes
- Pour les fenêtres adjacentes x1,x2∈Rδ×d, calcule :
ΔBIC=−2(ℓjoint−ℓsep)+klog(2δ)
où :
- ℓsep=−2δ(log∣Σ1∣+log∣Σ2∣)
- ℓjoint=−δlog∣Σ12∣
- k=d+2d(d+1) (nombre de paramètres libres du modèle de covariance complète)
Fonction Objective Globale :
LBIC({Si})=∑i=1T′(−2∣Si∣log∣Σi∣+2klog∣Si∣)
Évaluation Multi-Échelle :
- Évalue la cohérence statistique pour chaque valeur de δ dans une plage prédéfinie
- Utilise un seuil adaptatif μδ+α⋅σδ pour identifier les points de segmentation candidats
- Élimine les détections redondantes par suppression non-maximale
Fonction de Résumé :
ϕ(Si)=∣Si∣1∑t=τi−1τi−1xt
Utilise le pooling moyen comme opération de résumé par défaut, capturant les propriétés statistiques du premier ordre du segment.
- Segmentation Adaptative : Contrairement aux méthodes de fenêtres fixes, STaTS ajuste dynamiquement les limites des segments en fonction des variations statistiques locales
- Extension Multivariée : S'étend naturellement aux séries temporelles multivariées via la matrice de covariance complète
- Détection Multi-Échelle : Détecte les changements à différentes résolutions temporelles, capturant les mutations à court terme et les changements graduels à long terme
- Validité Statistique : Sous l'hypothèse gaussienne multivariée, la moyenne du segment est une statistique suffisante
- Classification univariée : UCR-128 (128 ensembles de données) et UCR-85 (85 ensembles de données)
- Classification multivariée : UEA-30 (30 ensembles de données)
- Prédiction multivariée : ETTh1, ETTh2, ETTm1, Electricity
- Tâches de classification : Précision moyenne et classement moyen
- Tâches de prédiction : Erreur quadratique moyenne normalisée (nMSE)
- Lignes de base de classification : T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
- Variantes compressées : TS2Vec (uniforme), TS2Vec (GMM)
- Lignes de base de prédiction : Informer, TCN
- Plage de taille de fenêtre : δ∈{5,10,...,500}
- Paramètre de seuil : α=2
- Distance de séparation minimale : smin=20
- Stabilité numérique : Régularisation de covariance ϵ=10−6
| Modèle | Précision UCR-85 | Classement UCR-85 | Précision UCR-128 | Classement UCR-128 | Longueur Moyenne |
|---|
| TS2Vec (ori) | 0.829 | 1.99 | 0.829 | 2.02 | 424.4/534.5 |
| TS2Vec (mean) | 0.739 | 4.82 | 0.741 | 4.39 | 12.1/12.9 |
| TS2Vec (uniforme) | 0.621 | 8.21 | 0.616 | 8.10 | 12.1/12.9 |
| TS2Vec (GMM) | 0.655 | 7.35 | 0.664 | 6.92 | 60.7/73.2 |
Découvertes Clés :
- STaTS réalise une compression de 33 fois, maintenant environ 90% de la performance originale
- Surpasse significativement les lignes de base de segmentation uniforme et GMM
| Modèle | UCR-85 (Bruit) | UCR-128 (Bruit) |
|---|
| TS2Vec (ori) | 0.336 | 0.412 |
| TS2Vec (mean) | 0.581 | 0.603 |
| TS2Vec (uniforme) | 0.475 | 0.485 |
| TS2Vec (GMM) | 0.505 | 0.522 |
Découverte Importante : Dans les conditions bruitées, STaTS non seulement maintient un avantage compétitif, mais surpasse également significativement le modèle à résolution complète.
- TS2Vec (mean) : Précision 0.622, Classement 4.70, Compression 20 fois
- Surpasse toutes les variantes compressées, maintenant une performance compétitive avec le modèle original
Dans la prédiction à long terme (H=720), STaTS correspond ou surpasse le TS2Vec original sur plusieurs ensembles de données, tout en réalisant une compression de 15 fois.
- Comparaison des Stratégies de Segmentation : Segmentation statistique > Segmentation GMM > Segmentation uniforme
- Évaluation Multi-Échelle : La détection multi-échelle surpasse la détection à échelle unique
- Fonction de Résumé : Le pooling moyen offre les meilleures performances sur la plupart des tâches
L'analyse qualitative montre que STaTS suit mieux les tendances du signal réel dans la prédiction à long terme, réduisant les artefacts d'oscillation, en particulier dans les plages de prédiction ultra-longues (H=720).
- Méthodes classiques : shapelets, méthodes basées sur BOSS et symboles
- Apprentissage profond : FCN, ResNet, InceptionTime
- Méthodes d'ensemble : HIVE-COTE
- Percées précoces : LSTM séquence à séquence
- Méthodes modernes : DeepAR, N-BEATS, Temporal Fusion Transformer
- Mécanismes d'attention : Informer et autres méthodes d'attention clairsemée
- Méthodes traditionnelles : PAA, SAX (limitées aux univariées, longueur fixe)
- Méthodes modernes : TICC (coûteux en calcul, nécessite une résolution d'optimisation)
- Avantages de STaTS : Léger, indépendant du modèle, support multivariable
- STaTS réalise une compression efficace de séries temporelles consciente de la structure, réalisant une compression de 30 fois tout en maintenant 85-90% de la performance
- Montre d'excellentes performances dans les conditions bruitées, fournissant un effet de débruitage implicite
- En tant que préprocesseur indépendant du modèle, peut s'intégrer de manière transparente dans les cadres existants
- Hypothèses Statistiques : Suppose la cohérence statistique locale au sein des segments, peut fonctionner mal sur les mutations dynamiques ou les systèmes chaotiques
- Non Bout-à-Bout : N'utilise pas de rétroaction basée sur les gradients pour adapter la stratégie de compression
- Sensibilité aux Paramètres : Nécessite l'ajustement de la plage de taille de fenêtre et des paramètres de seuil
- Paramètres En Ligne/Flux : Extension au résumé en temps réel et au déploiement sur les appareils périphériques
- Données Multimodales : Intégration aux réseaux de capteurs ou aux données hiérarchiques comme les vidéos
- Apprentissage Adaptatif : Systèmes d'apprentissage adaptatif bout-à-bout sous décalage de distribution ou dérive conceptuelle
- Innovation Méthodologique : Première application du critère BIC multi-échelle à la segmentation adaptative de séries temporelles multivariées
- Exhaustivité Expérimentale : Évaluation étendue sur 150+ ensembles de données, couvrant les tâches de classification et prédiction
- Valeur Pratique : Amélioration significative de l'efficacité de calcul (compression 30 fois) avec perte de performance minimale
- Robustesse : Les performances exceptionnelles dans les conditions bruitées démontrent l'applicabilité pratique de la méthode
- Analyse Théorique Insuffisante : Manque de garanties théoriques sur quand et pourquoi STaTS surpasse les autres méthodes
- Sélection de Paramètres : Manque de directives systématiques pour le choix des multiples hyperparamètres
- Limitations de Scénarios Applicables : L'applicabilité aux séries temporelles hautement irrégulières ou non-stationnaires n'a pas été suffisamment vérifiée
- Analyse de Complexité de Calcul : Manque d'analyse détaillée de la complexité temporelle
- Contribution Académique : Fournit une nouvelle perspective statistique pour la compression de séries temporelles
- Valeur Pratique : Peut être directement appliquée aux environnements à ressources limitées et au traitement de séries temporelles à grande échelle
- Reproductibilité : Description de méthode claire, détails d'implémentation suffisants
- Traitement de Séquences Longues : Particulièrement adapté aux séries temporelles de longueur irrégulière
- Environnements Bruités : Performance exceptionnelle dans les scénarios à bruit élevé
- Ressources Limitées : Adapté aux appareils périphériques ou systèmes en temps réel avec ressources informatiques limitées
- Outil de Prétraitement : Préprocesseur universel pour les modèles de séries temporelles existants
L'article cite des travaux importants dans les domaines de l'analyse de séries temporelles, de l'apprentissage de représentation et du traitement du signal statistique, notamment :
- Méthodes classiques de séries temporelles : PAA, SAX, DTW
- Méthodes d'apprentissage profond : TS2Vec, TS-TCC, InceptionTime
- Méthodes de segmentation statistique : BIC, TICC
- Modèles de prédiction : Informer, N-BEATS, Temporal Fusion Transformer
Évaluation Globale : Cet article est un travail de haute qualité sur le traitement des séries temporelles, avec la méthode STaTS proposée montrant d'excellentes performances en termes de fondement théorique, vérification expérimentale et valeur pratique. Cette méthode comble un vide important dans la compression de séries temporelles consciente de la structure et apporte une contribution significative au domaine de l'analyse des séries temporelles.