2025-11-23T09:37:17.053116

Operator Learning for Power Systems Simulation

Schlegel, Taylor, Farrokhabadi

Time domain simulation, i.e., modeling the system's evolution over time, is a crucial tool for studying and enhancing power system stability and dynamic performance. However, these simulations become computationally intractable for renewable-penetrated grids, due to the small simulation time step required to capture renewable energy resources' ultra-fast dynamic phenomena in the range of 1-50 microseconds. This creates a critical need for solutions that are both fast and scalable, posing a major barrier for the stable integration of renewable energy resources and thus climate change mitigation. This paper explores operator learning, a family of machine learning methods that learn mappings between functions, as a surrogate model for these costly simulations. The paper investigates, for the first time, the fundamental concept of simulation time step-invariance, which enables models trained on coarse time steps to generalize to fine-resolution dynamics. Three operator learning methods are benchmarked on a simple test system that, while not incorporating practical complexities of renewable-penetrated grids, serves as a first proof-of-concept to demonstrate the viability of time step-invariance. Models are evaluated on (i) zero-shot super-resolution, where training is performed on a coarse simulation time step and inference is performed at super-resolution, and (ii) generalization between stable and unstable dynamic regimes. This work addresses a key challenge in the integration of renewable energy for the mitigation of climate change by benchmarking operator learning methods to model physical systems.

academic

Обучение операторов для моделирования энергосистем

Основная информация

ID статьи: 2510.09704
Название: Operator Learning for Power Systems Simulation
Авторы: Matthew Schlegel (University of Calgary), Matthew E. Taylor (University of Alberta), Mostafa Farrokhabadi (University of Calgary)
Категория: cs.LG
Дата публикации/Конференция: NeurIPS 2025 Workshop on Tackling Climate Change with Machine Learning
Ссылка на статью: https://arxiv.org/abs/2510.09704

Аннотация

Временное моделирование (то есть моделирование эволюции системы во времени) является важным инструментом для исследования и повышения устойчивости и динамических характеристик энергосистем. Однако для сетей с высокой долей возобновляемых источников энергии такое моделирование становится вычислительно неосуществимым из-за необходимости использования чрезвычайно малых временных шагов моделирования (1-50 микросекунд) для захвата сверхбыстрой динамики возобновляемых источников. В данной статье исследуется обучение операторов в качестве суррогатной модели для дорогостоящего моделирования. Впервые изучается фундаментальная концепция инвариантности временного шага, позволяющая моделям, обученным на грубых временных шагах, обобщаться на динамику с более высоким разрешением. Статья содержит сравнительный анализ трёх методов обучения операторов на простой тестовой системе, оценивая способность к нулевой суперразрешающей способности и обобщению между стабильными и нестабильными динамическими режимами.

Исследовательский контекст и мотивация

Постановка проблемы

Вычислительное узкое место: Временное моделирование энергосистем с высокой долей возобновляемых источников требует чрезвычайно малых временных шагов 1-50 микросекунд для захвата сверхбыстрой динамики, связанной с инверторами, что делает системное моделирование вычислительно неосуществимым
Практическая необходимость: События, такие как массовое отключение электроэнергии в Испании и Португалии в апреле 2025 года, подчёркивают острую необходимость в масштабируемых инструментах анализа в реальном времени
Изменение климата: Преодоление вычислительных препятствий критически важно для стабильной интеграции возобновляемых источников энергии, требуемой политикой смягчения последствий изменения климата

Ограничения существующих методов

Методы классификации: Могут только определять состояние устойчивости системы, не могут служить суррогатными моделями для временного моделирования и не применимы для проектирования управления
Методы замены компонентов: Требуют сложных интерфейсов для интеграции компонентов машинного обучения в дифференциальные уравнения остальной системы
Суррогатные модели всей системы: Требуют значительного объёма обучения, валидации и тестирования обобщения

Основные вклады

Первое введение концепции инвариантности временного шага: Позволяет моделям, обученным на грубых временных шагах, обобщаться на динамику с более высоким разрешением
Сравнительный анализ нулевой суперразрешающей способности: Сравнение производительности трёх методов обучения операторов при обобщении с нулевой суперразрешающей способностью
Анализ обобщения механизмов устойчивости: Исследование способности моделей обобщаться между стабильными и нестабильными динамическими режимами
Путь для интеграции возобновляемых источников: Поддержка стабильной интеграции возобновляемых источников через масштабируемые и вычислительно осуществимые инструменты анализа

Подробное описание методов

Определение задачи

Обучение оператора G, отображающего начальную траекторию t ∈ 0, τ на желаемую будущую траекторию t ∈ τi, T, генерируемую обыкновенным дифференциальным уравнением.

Три метода обучения операторов

1. Deep Operator Networks (DeepONets)

Архитектура: Использует две ветви нейронной сети
- Ветвь обработки обрабатывает входную траекторию
- Основная ветвь кодирует время запроса выхода
Выход: Предсказанные значения траектории получаются путём комбинирования выходов двух ветвей через скалярное произведение

2. Fourier Neural Operators (FNOs)

Основная идея: Проектирует входные данные на базис Фурье, применяет изученные спектральные множители, затем преобразует обратно в временную область
Преимущества: Спектральное представление может захватывать гладкие временные структуры и поддерживать изменения разрешения
Улучшение: Использует тензоризацию для уменьшения количества параметров при сохранении точности

3. Latent Neural ODEs (LNODEs)

Архитектура: Структура кодировщик-декодировщик
- Кодирует входную траекторию в скрытое состояние
- Эволюционирует скрытое состояние через нейронное ОДУ
- Декодирует обратно в исходное пространство
Решатели: Оценивает решатели с фиксированным шагом (Adams) и адаптивным шагом (Dormand-Prince-Shampine)

Тестовая система SMIB

Используется система одной машины к бесконечной шине (SMIB), состоящая из синхронного генератора, подключённого через линию передачи к жёсткому источнику. Динамика угла ротора генератора управляется следующим уравнением:

$\frac{\partial^2\delta}{\partial t^2} = \frac{\pi f_0}{H}\left(P_m - D\frac{\partial\delta}{\partial t} - \frac{|E||V|}{X}\sin\delta\right)$

где δ(t) — угол ротора, Pm — входная механическая мощность, D — коэффициент демпфирования, E и V — напряжения, X — реактивное сопротивление линии передачи, H — постоянная инерции, f₀ — номинальная частота.

Экспериментальная установка

Генерация данных

Выборка параметров: Pm ~ U0, 2, D ~ 0.0, 0.135
Стабильные траектории: Pm1 ~ U0.0, Pmax_m1, где Pmax_m1 определяется уравнениями (2) и (3)
Нестабильные траектории: Используется приблизительно 100 итераций бинарного поиска
Масштаб данных: 8000 обучающих траекторий и 1000 валидационных траекторий для каждого набора данных
Временные окна: Входная последовательность t ∈ 0, 0.2s, целевая последовательность t ∈ 0.3, 3.1s

Обучение моделей

Оптимизация гиперпараметров: 120 испытаний байесовской оптимизации
Количество параметров: Все модели содержат примерно 700 тысяч параметров для обеспечения справедливого сравнения
Функция потерь: Норма Соболева H1
Количество эпох: 60 эпох для LNODE и FNO, 600 эпох для DeepONet

Метрики оценки

Нулевая суперразрешающая способность: RMSE и процент снижения производительности
Обобщение динамических механизмов: Mean Absolute Scaled Error (средняя абсолютная масштабированная ошибка)

Результаты экспериментов

Результаты нулевой суперразрешающей способности

Модель	Δt=100ms (RMSE)	Δt=50μs (RMSE)	Снижение производительности (%)
DeepONet	0.0220±0.0001	0.0348±0.0002	45.2
FNO	0.0186±0.0001	0.0302±0.0001	47.5
LNODE (Fixed)	0.0280±0.0006	0.0305±0.0006	8.6
LNODE (Adaptive)	0.0275±0.0003	0.0296±0.0003	7.3

Основные выводы

Лучшая производительность LNODE: LNODE достигает минимального снижения производительности при решении задачи нулевой суперразрешающей способности
Отличная абсолютная производительность FNO: FNO имеет самую низкую RMSE при исходном разрешении обучения, но показывает наибольшее снижение производительности при высоком разрешении
Значительные различия в способности обобщения: Снижение производительности LNODE составляет только 8.6% и 7.3%, в то время как DeepONet и FNO превышают 45%

Обобщение динамических механизмов

Влияние обучающих данных: Модели, обученные только на стабильных траекториях, с трудом обобщаются на нестабильные области
Эффект смешанного обучения: Включение 20% нестабильных траекторий в обучающие данные позволяет всем методам захватывать динамику нестабильных областей
Преимущество DeepONet: При смешанном обучении DeepONet — единственный метод, сохраняющий аналогичную производительность в стабильной области

Связанные работы

Классификация методов машинного обучения для энергосистем

Методы классификации: Определяют состояние устойчивости системы и запасы устойчивости, но не могут служить суррогатными моделями
Методы суррогатного моделирования:
- Замена компонентов: аппроксимация дифференциальных уравнений отдельных компонентов моделями
- Моделирование всей системы: разработка управляемых данными суррогатных моделей для всей системы (метод данной работы)

Применение обучения операторов в энергосистемах

Neural ODE: Используется для моделирования отдельных компонентов энергосистем
DeepONet: Применяется к моделированию энергосистем после возмущений
FNO: Впервые применяется к моделированию энергосистем

Заключение и обсуждение

Основные выводы

Осуществимость инвариантности временного шага: Методы обучения операторов способны обобщаться от грубых к тонким временным шагам
Различия в производительности методов: LNODE показывает лучшие результаты при нулевой суперразрешающей способности, FNO превосходит по абсолютной точности
Важность обучающих данных: Смешанные обучающие данные, содержащие как стабильные, так и нестабильные траектории, критически важны для обобщения

Ограничения

Сложность системы: Система SMIB слишком проста и не отражает сложную динамику сетей с высокой долей возобновляемых источников
Проверка практичности: Требуется комплексное моделирование и тестирование на реальных тестовых системах
Сравнение методов: Необходимо больше тестов для проверки конкурентоспособности методов при различных индуктивных смещениях

Направления будущих исследований

Моделирование сложных систем: Расширение на реальные сети с высокой долей возобновляемых источников
Практическое тестирование: Проверка эффективности методов на реальных энергосистемах
Улучшение алгоритмов: Исследование лучших индуктивных смещений и архитектурных решений

Глубокая оценка

Достоинства

Высокая новизна: Впервые вводится концепция инвариантности временного шага в моделирование энергосистем
Важность проблемы: Решает критическое вычислительное узкое место интеграции возобновляемых источников
Комплексный подход: Систематическое сравнение трёх основных методов обучения операторов
Обоснованный дизайн экспериментов: Комплексная оценка нулевой суперразрешающей способности и обобщения динамических механизмов
Социальное значение: Прямое содействие целям смягчения последствий изменения климата

Недостатки

Простота тестовой системы: Система SMIB не отражает сложность реальных электросетей
Ограниченная способность обобщения: Обобщение между динамическими механизмами остаётся затруднительным
Недостаток теоретического анализа: Отсутствуют теоретические гарантии инвариантности временного шага
Неподтверждённая практичность: Требуется проверка на крупномасштабных реальных системах

Влияние

Академический вклад: Открывает новое направление машинного обучения для моделирования энергосистем
Практическая ценность: Предоставляет путь решения вычислительных проблем интеграции возобновляемых источников
Воспроизводимость: Предоставляет репозиторий GitHub для облегчения последующих исследований

Сценарии применения

Быстрое моделирование энергосистем: Сценарии, требующие анализа в реальном или близком к реальному времени
Интеграция возобновляемых источников: Анализ устойчивости сетей с высокой долей возобновляемых источников
Многомасштабное моделирование: Сложные системы, требующие моделирования на различных временных шкалах

Библиография

Статья цитирует 25 соответствующих работ, охватывающих теорию обучения операторов, моделирование энергосистем, методы машинного обучения и другие области, обеспечивая прочную теоретическую основу для исследования.

Общая оценка: Это новаторская работа в области моделирования энергосистем, которая, хотя в настоящее время проверена только на простых системах, предоставляет новые идеи и методы для решения критических технических проблем интеграции возобновляемых источников энергии. Введённая концепция инвариантности временного шага имеет важное теоретическое и практическое значение и заслуживает дальнейшего углубленного исследования и расширенного применения.