Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.
- ID статьи: 2510.09593
- Название: STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
- Авторы: Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
- Классификация: cs.LG (машинное обучение), cs.CV (компьютерное зрение)
- Дата публикации: октябрь 2025
- Ссылка на статью: https://arxiv.org/abs/2510.09593
Временные ряды обычно содержат скрытую временную структуру, такую как переходы между локально стационарными состояниями, повторяющиеся паттерны и всплески изменчивости, однако эта структура редко используется в стандартных процессах обучения представлениям. Существующие модели обычно обрабатывают исходные или фиксированные оконные последовательности, рассматривая все временные шаги как одинаково важные, что приводит к неэффективности, низкой робастности и ограниченной масштабируемости на длинных или зашумленных последовательностях. В данной работе предлагается STaTS — легковесный неконтролируемый фреймворк для структурно-ориентированного резюмирования временных рядов, способный адаптивно сжимать одномерные и многомерные временные ряды в компактные последовательности токенов, сохраняющие информацию.
Данные временных рядов широко распространены в финансах, интернете вещей, здравоохранении и других областях. С развитием сенсорных технологий длина и сложность записываемых временных рядов быстро растут, создавая огромные вычислительные требования для фреймворков машинного обучения, предназначенных для понимания последовательностей.
- Традиционные методы: такие как PAA (кусочно-агрегированное приближение), SAX (символьное агрегированное приближение), DTW (динамическое выравнивание времени) обеспечивают эффективное резюмирование, но полагаются на унифицированное окнирование или жесткое символьное кодирование, игнорируя динамические изменения сложности сигнала
- Методы глубокого обучения: такие как TS2Vec, TS-TCC обрабатывают полные последовательности или применяют скользящие окна без учета семантических изменений, что приводит к избыточности, вычислительным затратам и несоответствию между токенизацией модели и реальными переходами сигнала
Существующие методы имеют следующие проблемы:
- Стратегия фиксированного окна может чрезмерно разбивать стабильные области, в то время как недостаточно разбивает сложные области
- В условиях шума унифицированная обработка входных данных имеет тенденцию усиливать ложные паттерны и снижать способность к обобщению
- Отсутствие структурной ориентированности приводит к неэффективности и распространению ошибок
- Предложение фреймворка STaTS: структурно-ориентированный фреймворк токенизации, основанный на критерии обнаружения изменений BIC, для идентификации статистически когерентных сегментов на нескольких временных масштабах
- Модульный легковесный конвейер резюмирования: сжатие временных рядов более чем в 33 раза при сохранении значительных паттернов, обеспечивающее эффективное моделирование на нижних уровнях
- Модель-агностичный неконтролируемый метод: без необходимости изменения архитектуры или оптимизации на основе градиентов, прямо совместимый с существующими кодировщиками временных рядов, такими как TS2Vec
- Унифицированный интерфейс: применимый к задачам классификации, прогнозирования и робастности, служащий универсальным инструментом предварительной обработки для резюмирования временных рядов
Для многомерного временного ряда X∈RT×d (где T — количество временных шагов, d — размерность) целью является преобразование X в более короткую последовательность X~∈RT′×d, где T′≪T, при сохранении базовой структуры, необходимой для нижних задач.
Многомасштабное обнаружение когерентности:
- Использование BIC (байесовского информационного критерия) для оценки статистической сходства соседних временных окон
- Для соседних окон x1,x2∈Rδ×d вычисляется:
ΔBIC=−2(ℓjoint−ℓsep)+klog(2δ)
где:
- ℓsep=−2δ(log∣Σ1∣+log∣Σ2∣)
- ℓjoint=−δlog∣Σ12∣
- k=d+2d(d+1) (количество свободных параметров модели полной ковариации)
Глобальная целевая функция:
LBIC({Si})=∑i=1T′(−2∣Si∣log∣Σi∣+2klog∣Si∣)
Многомасштабная оценка:
- Оценка статистической когерентности для каждого значения δ в предопределенном диапазоне
- Использование адаптивного порога μδ+α⋅σδ для идентификации кандидатов на точки разделения
- Устранение избыточных обнаружений посредством подавления немаксимума
Функция резюмирования:
ϕ(Si)=∣Si∣1∑t=τi−1τi−1xt
Использование усреднения пула в качестве операции резюмирования по умолчанию для захвата статистики первого порядка сегмента.
- Адаптивная сегментация: в отличие от методов с фиксированным окном, STaTS динамически регулирует границы сегментов в соответствии с локальными статистическими изменениями
- Расширение на многомерный случай: естественное расширение на многомерные временные ряды через матрицу полной ковариации
- Многомасштабное обнаружение: обнаружение изменений на различных временных разрешениях для захвата как краткосрочных скачков, так и долгосрочных постепенных изменений
- Статистическая валидность: при предположении многомерного гауссова распределения среднее значение сегмента является достаточной статистикой
- Одномерная классификация: UCR-128 (128 наборов данных) и UCR-85 (85 наборов данных)
- Многомерная классификация: UEA-30 (30 наборов данных)
- Многомерное прогнозирование: ETTh1, ETTh2, ETTm1, Electricity
- Задачи классификации: средняя точность и средний рейтинг
- Задачи прогнозирования: нормализованная среднеквадратичная ошибка (nMSE)
- Базовые модели классификации: T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
- Варианты сжатия: TS2Vec (uniform), TS2Vec (GMM)
- Базовые модели прогнозирования: Informer, TCN
- Диапазон размера окна: δ∈{5,10,...,500}
- Параметр порога: α=2
- Минимальное расстояние разделения: smin=20
- Численная стабильность: регуляризация ковариации ϵ=10−6
| Модель | Точность UCR-85 | Рейтинг UCR-85 | Точность UCR-128 | Рейтинг UCR-128 | Средняя длина |
|---|
| TS2Vec (ori) | 0.829 | 1.99 | 0.829 | 2.02 | 424.4/534.5 |
| TS2Vec (mean) | 0.739 | 4.82 | 0.741 | 4.39 | 12.1/12.9 |
| TS2Vec (uniform) | 0.621 | 8.21 | 0.616 | 8.10 | 12.1/12.9 |
| TS2Vec (GMM) | 0.655 | 7.35 | 0.664 | 6.92 | 60.7/73.2 |
Ключевые выводы:
- STaTS достигает 33-кратного сжатия, сохраняя примерно 90% исходной производительности
- Значительно превосходит базовые методы унифицированного разделения и GMM
| Модель | UCR-85 (шум) | UCR-128 (шум) |
|---|
| TS2Vec (ori) | 0.336 | 0.412 |
| TS2Vec (mean) | 0.581 | 0.603 |
| TS2Vec (uniform) | 0.475 | 0.485 |
| TS2Vec (GMM) | 0.505 | 0.522 |
Важные выводы: в условиях шума STaTS не только сохраняет конкурентное преимущество, но и значительно превосходит модели с полным разрешением.
- TS2Vec (mean): точность 0.622, рейтинг 4.70, 20-кратное сжатие
- Превосходит все варианты сжатия, сохраняя конкурентную производительность с исходной моделью
При долгосрочном прогнозировании (H=720) STaTS соответствует или превосходит исходный TS2Vec на нескольких наборах данных, одновременно достигая 15-кратного сжатия.
- Сравнение стратегий сегментации: статистическая сегментация > сегментация GMM > унифицированная сегментация
- Многомасштабная оценка: многомасштабное обнаружение превосходит одномасштабное
- Функции резюмирования: усреднение пула показывает лучшие результаты в большинстве задач
Качественный анализ показывает, что STaTS лучше отслеживает тренды реального сигнала при долгосрочном прогнозировании, снижает артефакты колебаний, особенно при очень длинных диапазонах прогнозирования (H=720).
- Классические методы: shapelets, методы на основе символов, такие как BOSS
- Глубокое обучение: FCN, ResNet, InceptionTime
- Ансамблевые методы: HIVE-COTE
- Ранние прорывы: последовательность-в-последовательность LSTM
- Современные методы: DeepAR, N-BEATS, Temporal Fusion Transformer
- Механизмы внимания: Informer и другие методы с разреженным вниманием
- Традиционные методы: PAA, SAX (ограничены одномерным случаем и фиксированной длиной)
- Современные методы: TICC (вычислительно дорогостоящий, требует решения оптимизационной задачи)
- Преимущества STaTS: легковесность, модель-агностичность, поддержка многомерности
- STaTS достигает эффективного структурно-ориентированного сжатия временных рядов, обеспечивая 30-кратное сжатие при сохранении 85-90% исходной производительности
- Демонстрирует отличную производительность в условиях шума, обеспечивая неявный эффект шумоподавления
- Как модель-агностичный предпроцессор может быть беспрепятственно интегрирован в существующие фреймворки
- Статистические предположения: предполагает локальную статистическую когерентность внутри сегментов, может показывать плохую производительность на динамических скачках или хаотических системах
- Не конец-в-конец: не использует обратную связь на основе градиентов для адаптации стратегии сжатия
- Чувствительность параметров: требует настройки диапазона размера окна и параметров порога
- Онлайн/потоковые установки: расширение на резюмирование в реальном времени и развертывание на граничных устройствах
- Мультимодальные данные: интеграция в сенсорные сети или иерархические данные, такие как видео
- Адаптивное обучение: системы адаптивного обучения конец-в-конец при распределительном сдвиге или дрейфе концепций
- Методологическая новизна: первое применение многомасштабного критерия BIC для адаптивной сегментации многомерных временных рядов
- Полнота экспериментов: обширная оценка на 150+ наборах данных, охватывающая задачи классификации и прогнозирования
- Практическая ценность: значительное повышение вычислительной эффективности (33-кратное сжатие) с минимальной потерей производительности
- Робастность: отличная производительность в условиях шума подтверждает практическую применимость метода
- Недостаток теоретического анализа: отсутствие теоретических гарантий относительно того, когда и почему STaTS превосходит другие методы
- Выбор параметров: отсутствие систематического руководства по выбору нескольких гиперпараметров
- Ограничения применимости: недостаточная проверка применимости к высокоирегулярным или нестационарным временным рядам
- Анализ вычислительной сложности: отсутствие подробного анализа временной сложности
- Академический вклад: предоставляет новую статистическую перспективу на сжатие временных рядов
- Практическая ценность: может быть непосредственно применен в средах с ограниченными ресурсами и при обработке крупномасштабных временных рядов
- Воспроизводимость: четкое описание метода и достаточные детали реализации
- Обработка длинных последовательностей: особенно подходит для временных рядов неправильной длины
- Зашумленные среды: показывает отличную производительность в сценариях с высоким уровнем шума
- Ресурсоограниченные системы: подходит для граничных устройств или систем реального времени с ограниченными вычислительными ресурсами
- Инструмент предварительной обработки: служит универсальным предпроцессором для существующих моделей временных рядов
Статья ссылается на важные работы в области анализа временных рядов, обучения представлениям и статистической обработки сигналов, включая:
- Классические методы временных рядов: PAA, SAX, DTW
- Методы глубокого обучения: TS2Vec, TS-TCC, InceptionTime
- Методы статистической сегментации: BIC, TICC
- Модели прогнозирования: Informer, N-BEATS, Temporal Fusion Transformer
Общая оценка: это высококачественная статья по обработке временных рядов, предложенный метод STaTS демонстрирует отличные результаты с точки зрения теоретического обоснования, экспериментальной проверки и практической ценности. Данный метод заполняет важный пробел в структурно-ориентированном сжатии временных рядов и вносит значительный вклад в область анализа временных рядов.