2025-11-20T07:19:14.926764

STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging

Bhowmick, Ramanathan, Aakur

Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.

academic

STaTS: Структурно-ориентированное временное резюмирование последовательностей посредством статистического объединения окон

Основная информация

ID статьи: 2510.09593
Название: STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
Авторы: Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
Классификация: cs.LG (машинное обучение), cs.CV (компьютерное зрение)
Дата публикации: октябрь 2025
Ссылка на статью: https://arxiv.org/abs/2510.09593

Аннотация

Временные ряды обычно содержат скрытую временную структуру, такую как переходы между локально стационарными состояниями, повторяющиеся паттерны и всплески изменчивости, однако эта структура редко используется в стандартных процессах обучения представлениям. Существующие модели обычно обрабатывают исходные или фиксированные оконные последовательности, рассматривая все временные шаги как одинаково важные, что приводит к неэффективности, низкой робастности и ограниченной масштабируемости на длинных или зашумленных последовательностях. В данной работе предлагается STaTS — легковесный неконтролируемый фреймворк для структурно-ориентированного резюмирования временных рядов, способный адаптивно сжимать одномерные и многомерные временные ряды в компактные последовательности токенов, сохраняющие информацию.

Исследовательский контекст и мотивация

Определение проблемы

Данные временных рядов широко распространены в финансах, интернете вещей, здравоохранении и других областях. С развитием сенсорных технологий длина и сложность записываемых временных рядов быстро растут, создавая огромные вычислительные требования для фреймворков машинного обучения, предназначенных для понимания последовательностей.

Ограничения существующих методов

Традиционные методы: такие как PAA (кусочно-агрегированное приближение), SAX (символьное агрегированное приближение), DTW (динамическое выравнивание времени) обеспечивают эффективное резюмирование, но полагаются на унифицированное окнирование или жесткое символьное кодирование, игнорируя динамические изменения сложности сигнала
Методы глубокого обучения: такие как TS2Vec, TS-TCC обрабатывают полные последовательности или применяют скользящие окна без учета семантических изменений, что приводит к избыточности, вычислительным затратам и несоответствию между токенизацией модели и реальными переходами сигнала

Исследовательская мотивация

Существующие методы имеют следующие проблемы:

Стратегия фиксированного окна может чрезмерно разбивать стабильные области, в то время как недостаточно разбивает сложные области
В условиях шума унифицированная обработка входных данных имеет тенденцию усиливать ложные паттерны и снижать способность к обобщению
Отсутствие структурной ориентированности приводит к неэффективности и распространению ошибок

Основные вклады

Предложение фреймворка STaTS: структурно-ориентированный фреймворк токенизации, основанный на критерии обнаружения изменений BIC, для идентификации статистически когерентных сегментов на нескольких временных масштабах
Модульный легковесный конвейер резюмирования: сжатие временных рядов более чем в 33 раза при сохранении значительных паттернов, обеспечивающее эффективное моделирование на нижних уровнях
Модель-агностичный неконтролируемый метод: без необходимости изменения архитектуры или оптимизации на основе градиентов, прямо совместимый с существующими кодировщиками временных рядов, такими как TS2Vec
Унифицированный интерфейс: применимый к задачам классификации, прогнозирования и робастности, служащий универсальным инструментом предварительной обработки для резюмирования временных рядов

Подробное описание методологии

Определение задачи

Для многомерного временного ряда $X \in \mathbb{R}^{T \times d}$ (где $T$ — количество временных шагов, $d$ — размерность) целью является преобразование $X$ в более короткую последовательность $\tilde{X} \in \mathbb{R}^{T' \times d}$ , где $T' \ll T$ , при сохранении базовой структуры, необходимой для нижних задач.

Архитектура модели

1. Этап сегментации (токенизация)

Многомасштабное обнаружение когерентности:

Использование BIC (байесовского информационного критерия) для оценки статистической сходства соседних временных окон
Для соседних окон $x_1, x_2 \in \mathbb{R}^{\delta \times d}$ вычисляется:

$\Delta BIC = -2(\ell_{joint} - \ell_{sep}) + k \log(2\delta)$

где:

$\ell_{sep} = -\frac{\delta}{2}(\log|\Sigma_1| + \log|\Sigma_2|)$
$\ell_{joint} = -\delta \log|\Sigma_{12}|$
$k = d + \frac{d(d+1)}{2}$ (количество свободных параметров модели полной ковариации)

Глобальная целевая функция: $L_{BIC}(\{S_i\}) = \sum_{i=1}^{T'} \left(-\frac{|S_i|}{2}\log|\Sigma_i| + \frac{k}{2}\log|S_i|\right)$

Многомасштабная оценка:

Оценка статистической когерентности для каждого значения $\delta$ в предопределенном диапазоне
Использование адаптивного порога $\mu_\delta + \alpha \cdot \sigma_\delta$ для идентификации кандидатов на точки разделения
Устранение избыточных обнаружений посредством подавления немаксимума

2. Этап резюмирования (суммаризация)

Функция резюмирования: $\phi(S_i) = \frac{1}{|S_i|} \sum_{t=\tau_{i-1}}^{\tau_i-1} x_t$

Использование усреднения пула в качестве операции резюмирования по умолчанию для захвата статистики первого порядка сегмента.

Технические инновации

Адаптивная сегментация: в отличие от методов с фиксированным окном, STaTS динамически регулирует границы сегментов в соответствии с локальными статистическими изменениями
Расширение на многомерный случай: естественное расширение на многомерные временные ряды через матрицу полной ковариации
Многомасштабное обнаружение: обнаружение изменений на различных временных разрешениях для захвата как краткосрочных скачков, так и долгосрочных постепенных изменений
Статистическая валидность: при предположении многомерного гауссова распределения среднее значение сегмента является достаточной статистикой

Экспериментальная установка

Наборы данных

Одномерная классификация: UCR-128 (128 наборов данных) и UCR-85 (85 наборов данных)
Многомерная классификация: UEA-30 (30 наборов данных)
Многомерное прогнозирование: ETTh1, ETTh2, ETTm1, Electricity

Метрики оценки

Задачи классификации: средняя точность и средний рейтинг
Задачи прогнозирования: нормализованная среднеквадратичная ошибка (nMSE)

Методы сравнения

Базовые модели классификации: T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
Варианты сжатия: TS2Vec (uniform), TS2Vec (GMM)
Базовые модели прогнозирования: Informer, TCN

Детали реализации

Диапазон размера окна: $\delta \in \{5, 10, ..., 500\}$
Параметр порога: $\alpha = 2$
Минимальное расстояние разделения: $s_{min} = 20$
Численная стабильность: регуляризация ковариации $\epsilon = 10^{-6}$

Результаты экспериментов

Основные результаты

Производительность одномерной классификации

Модель	Точность UCR-85	Рейтинг UCR-85	Точность UCR-128	Рейтинг UCR-128	Средняя длина
TS2Vec (ori)	0.829	1.99	0.829	2.02	424.4/534.5
TS2Vec (mean)	0.739	4.82	0.741	4.39	12.1/12.9
TS2Vec (uniform)	0.621	8.21	0.616	8.10	12.1/12.9
TS2Vec (GMM)	0.655	7.35	0.664	6.92	60.7/73.2

Ключевые выводы:

STaTS достигает 33-кратного сжатия, сохраняя примерно 90% исходной производительности
Значительно превосходит базовые методы унифицированного разделения и GMM

Робастность к шуму

Модель	UCR-85 (шум)	UCR-128 (шум)
TS2Vec (ori)	0.336	0.412
TS2Vec (mean)	0.581	0.603
TS2Vec (uniform)	0.475	0.485
TS2Vec (GMM)	0.505	0.522

Важные выводы: в условиях шума STaTS не только сохраняет конкурентное преимущество, но и значительно превосходит модели с полным разрешением.

Многомерная классификация

TS2Vec (mean): точность 0.622, рейтинг 4.70, 20-кратное сжатие
Превосходит все варианты сжатия, сохраняя конкурентную производительность с исходной моделью

Прогнозирование временных рядов

При долгосрочном прогнозировании (H=720) STaTS соответствует или превосходит исходный TS2Vec на нескольких наборах данных, одновременно достигая 15-кратного сжатия.

Абляционные исследования

Сравнение стратегий сегментации: статистическая сегментация > сегментация GMM > унифицированная сегментация
Многомасштабная оценка: многомасштабное обнаружение превосходит одномасштабное
Функции резюмирования: усреднение пула показывает лучшие результаты в большинстве задач

Анализ конкретных случаев

Качественный анализ показывает, что STaTS лучше отслеживает тренды реального сигнала при долгосрочном прогнозировании, снижает артефакты колебаний, особенно при очень длинных диапазонах прогнозирования (H=720).

Связанные работы

Классификация временных рядов

Классические методы: shapelets, методы на основе символов, такие как BOSS
Глубокое обучение: FCN, ResNet, InceptionTime
Ансамблевые методы: HIVE-COTE

Прогнозирование временных рядов

Ранние прорывы: последовательность-в-последовательность LSTM
Современные методы: DeepAR, N-BEATS, Temporal Fusion Transformer
Механизмы внимания: Informer и другие методы с разреженным вниманием

Резюмирование временных рядов

Традиционные методы: PAA, SAX (ограничены одномерным случаем и фиксированной длиной)
Современные методы: TICC (вычислительно дорогостоящий, требует решения оптимизационной задачи)
Преимущества STaTS: легковесность, модель-агностичность, поддержка многомерности

Заключение и обсуждение

Основные выводы

STaTS достигает эффективного структурно-ориентированного сжатия временных рядов, обеспечивая 30-кратное сжатие при сохранении 85-90% исходной производительности
Демонстрирует отличную производительность в условиях шума, обеспечивая неявный эффект шумоподавления
Как модель-агностичный предпроцессор может быть беспрепятственно интегрирован в существующие фреймворки

Ограничения

Статистические предположения: предполагает локальную статистическую когерентность внутри сегментов, может показывать плохую производительность на динамических скачках или хаотических системах
Не конец-в-конец: не использует обратную связь на основе градиентов для адаптации стратегии сжатия
Чувствительность параметров: требует настройки диапазона размера окна и параметров порога

Будущие направления

Онлайн/потоковые установки: расширение на резюмирование в реальном времени и развертывание на граничных устройствах
Мультимодальные данные: интеграция в сенсорные сети или иерархические данные, такие как видео
Адаптивное обучение: системы адаптивного обучения конец-в-конец при распределительном сдвиге или дрейфе концепций

Глубокая оценка

Преимущества

Методологическая новизна: первое применение многомасштабного критерия BIC для адаптивной сегментации многомерных временных рядов
Полнота экспериментов: обширная оценка на 150+ наборах данных, охватывающая задачи классификации и прогнозирования
Практическая ценность: значительное повышение вычислительной эффективности (33-кратное сжатие) с минимальной потерей производительности
Робастность: отличная производительность в условиях шума подтверждает практическую применимость метода

Недостатки

Недостаток теоретического анализа: отсутствие теоретических гарантий относительно того, когда и почему STaTS превосходит другие методы
Выбор параметров: отсутствие систематического руководства по выбору нескольких гиперпараметров
Ограничения применимости: недостаточная проверка применимости к высокоирегулярным или нестационарным временным рядам
Анализ вычислительной сложности: отсутствие подробного анализа временной сложности

Влияние

Академический вклад: предоставляет новую статистическую перспективу на сжатие временных рядов
Практическая ценность: может быть непосредственно применен в средах с ограниченными ресурсами и при обработке крупномасштабных временных рядов
Воспроизводимость: четкое описание метода и достаточные детали реализации

Сценарии применения

Обработка длинных последовательностей: особенно подходит для временных рядов неправильной длины
Зашумленные среды: показывает отличную производительность в сценариях с высоким уровнем шума
Ресурсоограниченные системы: подходит для граничных устройств или систем реального времени с ограниченными вычислительными ресурсами
Инструмент предварительной обработки: служит универсальным предпроцессором для существующих моделей временных рядов

Библиография

Статья ссылается на важные работы в области анализа временных рядов, обучения представлениям и статистической обработки сигналов, включая:

Классические методы временных рядов: PAA, SAX, DTW
Методы глубокого обучения: TS2Vec, TS-TCC, InceptionTime
Методы статистической сегментации: BIC, TICC
Модели прогнозирования: Informer, N-BEATS, Temporal Fusion Transformer

Общая оценка: это высококачественная статья по обработке временных рядов, предложенный метод STaTS демонстрирует отличные результаты с точки зрения теоретического обоснования, экспериментальной проверки и практической ценности. Данный метод заполняет важный пробел в структурно-ориентированном сжатии временных рядов и вносит значительный вклад в область анализа временных рядов.