Time domain simulation, i.e., modeling the system's evolution over time, is a crucial tool for studying and enhancing power system stability and dynamic performance. However, these simulations become computationally intractable for renewable-penetrated grids, due to the small simulation time step required to capture renewable energy resources' ultra-fast dynamic phenomena in the range of 1-50 microseconds. This creates a critical need for solutions that are both fast and scalable, posing a major barrier for the stable integration of renewable energy resources and thus climate change mitigation. This paper explores operator learning, a family of machine learning methods that learn mappings between functions, as a surrogate model for these costly simulations. The paper investigates, for the first time, the fundamental concept of simulation time step-invariance, which enables models trained on coarse time steps to generalize to fine-resolution dynamics. Three operator learning methods are benchmarked on a simple test system that, while not incorporating practical complexities of renewable-penetrated grids, serves as a first proof-of-concept to demonstrate the viability of time step-invariance. Models are evaluated on (i) zero-shot super-resolution, where training is performed on a coarse simulation time step and inference is performed at super-resolution, and (ii) generalization between stable and unstable dynamic regimes. This work addresses a key challenge in the integration of renewable energy for the mitigation of climate change by benchmarking operator learning methods to model physical systems.
- ID статьи: 2510.09704
- Название: Operator Learning for Power Systems Simulation
- Авторы: Matthew Schlegel (University of Calgary), Matthew E. Taylor (University of Alberta), Mostafa Farrokhabadi (University of Calgary)
- Категория: cs.LG
- Дата публикации/Конференция: NeurIPS 2025 Workshop on Tackling Climate Change with Machine Learning
- Ссылка на статью: https://arxiv.org/abs/2510.09704
Временное моделирование (то есть моделирование эволюции системы во времени) является важным инструментом для исследования и повышения устойчивости и динамических характеристик энергосистем. Однако для сетей с высокой долей возобновляемых источников энергии такое моделирование становится вычислительно неосуществимым из-за необходимости использования чрезвычайно малых временных шагов моделирования (1-50 микросекунд) для захвата сверхбыстрой динамики возобновляемых источников. В данной статье исследуется обучение операторов в качестве суррогатной модели для дорогостоящего моделирования. Впервые изучается фундаментальная концепция инвариантности временного шага, позволяющая моделям, обученным на грубых временных шагах, обобщаться на динамику с более высоким разрешением. Статья содержит сравнительный анализ трёх методов обучения операторов на простой тестовой системе, оценивая способность к нулевой суперразрешающей способности и обобщению между стабильными и нестабильными динамическими режимами.
- Вычислительное узкое место: Временное моделирование энергосистем с высокой долей возобновляемых источников требует чрезвычайно малых временных шагов 1-50 микросекунд для захвата сверхбыстрой динамики, связанной с инверторами, что делает системное моделирование вычислительно неосуществимым
- Практическая необходимость: События, такие как массовое отключение электроэнергии в Испании и Португалии в апреле 2025 года, подчёркивают острую необходимость в масштабируемых инструментах анализа в реальном времени
- Изменение климата: Преодоление вычислительных препятствий критически важно для стабильной интеграции возобновляемых источников энергии, требуемой политикой смягчения последствий изменения климата
- Методы классификации: Могут только определять состояние устойчивости системы, не могут служить суррогатными моделями для временного моделирования и не применимы для проектирования управления
- Методы замены компонентов: Требуют сложных интерфейсов для интеграции компонентов машинного обучения в дифференциальные уравнения остальной системы
- Суррогатные модели всей системы: Требуют значительного объёма обучения, валидации и тестирования обобщения
- Первое введение концепции инвариантности временного шага: Позволяет моделям, обученным на грубых временных шагах, обобщаться на динамику с более высоким разрешением
- Сравнительный анализ нулевой суперразрешающей способности: Сравнение производительности трёх методов обучения операторов при обобщении с нулевой суперразрешающей способностью
- Анализ обобщения механизмов устойчивости: Исследование способности моделей обобщаться между стабильными и нестабильными динамическими режимами
- Путь для интеграции возобновляемых источников: Поддержка стабильной интеграции возобновляемых источников через масштабируемые и вычислительно осуществимые инструменты анализа
Обучение оператора G, отображающего начальную траекторию t ∈ 0, τ на желаемую будущую траекторию t ∈ τi, T, генерируемую обыкновенным дифференциальным уравнением.
- Архитектура: Использует две ветви нейронной сети
- Ветвь обработки обрабатывает входную траекторию
- Основная ветвь кодирует время запроса выхода
- Выход: Предсказанные значения траектории получаются путём комбинирования выходов двух ветвей через скалярное произведение
- Основная идея: Проектирует входные данные на базис Фурье, применяет изученные спектральные множители, затем преобразует обратно в временную область
- Преимущества: Спектральное представление может захватывать гладкие временные структуры и поддерживать изменения разрешения
- Улучшение: Использует тензоризацию для уменьшения количества параметров при сохранении точности
- Архитектура: Структура кодировщик-декодировщик
- Кодирует входную траекторию в скрытое состояние
- Эволюционирует скрытое состояние через нейронное ОДУ
- Декодирует обратно в исходное пространство
- Решатели: Оценивает решатели с фиксированным шагом (Adams) и адаптивным шагом (Dormand-Prince-Shampine)
Используется система одной машины к бесконечной шине (SMIB), состоящая из синхронного генератора, подключённого через линию передачи к жёсткому источнику. Динамика угла ротора генератора управляется следующим уравнением:
∂t2∂2δ=Hπf0(Pm−D∂t∂δ−X∣E∣∣V∣sinδ)
где δ(t) — угол ротора, Pm — входная механическая мощность, D — коэффициент демпфирования, E и V — напряжения, X — реактивное сопротивление линии передачи, H — постоянная инерции, f₀ — номинальная частота.
- Выборка параметров: Pm ~ U0, 2, D ~ 0.0, 0.135
- Стабильные траектории: Pm1 ~ U0.0, Pmax_m1, где Pmax_m1 определяется уравнениями (2) и (3)
- Нестабильные траектории: Используется приблизительно 100 итераций бинарного поиска
- Масштаб данных: 8000 обучающих траекторий и 1000 валидационных траекторий для каждого набора данных
- Временные окна: Входная последовательность t ∈ 0, 0.2s, целевая последовательность t ∈ 0.3, 3.1s
- Оптимизация гиперпараметров: 120 испытаний байесовской оптимизации
- Количество параметров: Все модели содержат примерно 700 тысяч параметров для обеспечения справедливого сравнения
- Функция потерь: Норма Соболева H1
- Количество эпох: 60 эпох для LNODE и FNO, 600 эпох для DeepONet
- Нулевая суперразрешающая способность: RMSE и процент снижения производительности
- Обобщение динамических механизмов: Mean Absolute Scaled Error (средняя абсолютная масштабированная ошибка)
| Модель | Δt=100ms (RMSE) | Δt=50μs (RMSE) | Снижение производительности (%) |
|---|
| DeepONet | 0.0220±0.0001 | 0.0348±0.0002 | 45.2 |
| FNO | 0.0186±0.0001 | 0.0302±0.0001 | 47.5 |
| LNODE (Fixed) | 0.0280±0.0006 | 0.0305±0.0006 | 8.6 |
| LNODE (Adaptive) | 0.0275±0.0003 | 0.0296±0.0003 | 7.3 |
- Лучшая производительность LNODE: LNODE достигает минимального снижения производительности при решении задачи нулевой суперразрешающей способности
- Отличная абсолютная производительность FNO: FNO имеет самую низкую RMSE при исходном разрешении обучения, но показывает наибольшее снижение производительности при высоком разрешении
- Значительные различия в способности обобщения: Снижение производительности LNODE составляет только 8.6% и 7.3%, в то время как DeepONet и FNO превышают 45%
- Влияние обучающих данных: Модели, обученные только на стабильных траекториях, с трудом обобщаются на нестабильные области
- Эффект смешанного обучения: Включение 20% нестабильных траекторий в обучающие данные позволяет всем методам захватывать динамику нестабильных областей
- Преимущество DeepONet: При смешанном обучении DeepONet — единственный метод, сохраняющий аналогичную производительность в стабильной области
- Методы классификации: Определяют состояние устойчивости системы и запасы устойчивости, но не могут служить суррогатными моделями
- Методы суррогатного моделирования:
- Замена компонентов: аппроксимация дифференциальных уравнений отдельных компонентов моделями
- Моделирование всей системы: разработка управляемых данными суррогатных моделей для всей системы (метод данной работы)
- Neural ODE: Используется для моделирования отдельных компонентов энергосистем
- DeepONet: Применяется к моделированию энергосистем после возмущений
- FNO: Впервые применяется к моделированию энергосистем
- Осуществимость инвариантности временного шага: Методы обучения операторов способны обобщаться от грубых к тонким временным шагам
- Различия в производительности методов: LNODE показывает лучшие результаты при нулевой суперразрешающей способности, FNO превосходит по абсолютной точности
- Важность обучающих данных: Смешанные обучающие данные, содержащие как стабильные, так и нестабильные траектории, критически важны для обобщения
- Сложность системы: Система SMIB слишком проста и не отражает сложную динамику сетей с высокой долей возобновляемых источников
- Проверка практичности: Требуется комплексное моделирование и тестирование на реальных тестовых системах
- Сравнение методов: Необходимо больше тестов для проверки конкурентоспособности методов при различных индуктивных смещениях
- Моделирование сложных систем: Расширение на реальные сети с высокой долей возобновляемых источников
- Практическое тестирование: Проверка эффективности методов на реальных энергосистемах
- Улучшение алгоритмов: Исследование лучших индуктивных смещений и архитектурных решений
- Высокая новизна: Впервые вводится концепция инвариантности временного шага в моделирование энергосистем
- Важность проблемы: Решает критическое вычислительное узкое место интеграции возобновляемых источников
- Комплексный подход: Систематическое сравнение трёх основных методов обучения операторов
- Обоснованный дизайн экспериментов: Комплексная оценка нулевой суперразрешающей способности и обобщения динамических механизмов
- Социальное значение: Прямое содействие целям смягчения последствий изменения климата
- Простота тестовой системы: Система SMIB не отражает сложность реальных электросетей
- Ограниченная способность обобщения: Обобщение между динамическими механизмами остаётся затруднительным
- Недостаток теоретического анализа: Отсутствуют теоретические гарантии инвариантности временного шага
- Неподтверждённая практичность: Требуется проверка на крупномасштабных реальных системах
- Академический вклад: Открывает новое направление машинного обучения для моделирования энергосистем
- Практическая ценность: Предоставляет путь решения вычислительных проблем интеграции возобновляемых источников
- Воспроизводимость: Предоставляет репозиторий GitHub для облегчения последующих исследований
- Быстрое моделирование энергосистем: Сценарии, требующие анализа в реальном или близком к реальному времени
- Интеграция возобновляемых источников: Анализ устойчивости сетей с высокой долей возобновляемых источников
- Многомасштабное моделирование: Сложные системы, требующие моделирования на различных временных шкалах
Статья цитирует 25 соответствующих работ, охватывающих теорию обучения операторов, моделирование энергосистем, методы машинного обучения и другие области, обеспечивая прочную теоретическую основу для исследования.
Общая оценка: Это новаторская работа в области моделирования энергосистем, которая, хотя в настоящее время проверена только на простых системах, предоставляет новые идеи и методы для решения критических технических проблем интеграции возобновляемых источников энергии. Введённая концепция инвариантности временного шага имеет важное теоретическое и практическое значение и заслуживает дальнейшего углубленного исследования и расширенного применения.