2025-11-12T21:16:10.844190

A Taylor Series Approach to Correction of Input Errors in Gaussian Process Regression

Qureshi, Ogri, Bell et al.

Gaussian Processes (GPs) are widely recognized as powerful non-parametric models for regression and classification. Traditional GP frameworks predominantly operate under the assumption that the inputs are either accurately known or subject to zero-mean noise. However, several real-world applications such as mobile sensors have imperfect localization, leading to inputs with biased errors. These biases can typically be estimated through measurements collected over time using, for example, Kalman filters. To avoid recomputation of the entire GP model when better estimates of the inputs used in the training data become available, we introduce a technique for updating a trained GP model to incorporate updated estimates of the inputs. By leveraging the differentiability of the mean and covariance functions derived from the squared exponential kernel, a second-order correction algorithm is developed to update the trained GP models. Precomputed Jacobians and Hessians of kernels enable real-time refinement of the mean and covariance predictions. The efficacy of the developed approach is demonstrated using two simulation studies, with error analyses revealing improvements in both predictive accuracy and uncertainty quantification.

academic

Подход на основе рядов Тейлора к коррекции ошибок входных данных в регрессии гауссовских процессов

Основная информация

ID статьи: 2504.18463
Название: A Taylor Series Approach to Correction of Input Errors in Gaussian Process Regression
Авторы: Muzaffar Qureshi, Tochukwu Elijah Ogri, Zachary I. Bell, Wanjiku A. Makumi, Rushikesh Kamalapurkar
Классификация: eess.SY (Системы и управление), cs.RO (Робототехника), cs.SY (Системы и управление)
Дата публикации: 25 апреля 2025 г.
Ссылка на статью: https://arxiv.org/abs/2504.18463

Аннотация

В данной статье предлагается метод на основе рядов Тейлора для коррекции ошибок входных данных в регрессии гауссовских процессов (ГП). Традиционная структура ГП предполагает, что входные данные либо точно известны, либо подчиняются шуму с нулевым средним, однако в практических приложениях, таких как мобильные датчики, входные данные содержат смещённые ошибки из-за неточного позиционирования. Чтобы избежать пересчёта всей модели ГП при получении улучшенных оценок входных данных, авторы разработали алгоритм коррекции второго порядка, используя дифференцируемость функций среднего и ковариации квадратичного экспоненциального ядра. Благодаря предварительно вычисленным матрицам Якоби и Гессе достигается уточнение предсказаний среднего и ковариации в реальном времени.

Научный контекст и мотивация

Определение проблемы

Основная проблема: В практических приложениях мобильные датчики создают неточные входные данные для регрессии ГП из-за ошибок позиционирования, что влияет на производительность модели
Значимость: Точное картирование полей критично для мониторинга окружающей среды, поисково-спасательных операций, автономного подводного исследования и других областей
Ограничения существующих методов:
- Традиционные методы предполагают точные входные данные или только шум с нулевым средним
- Гетероскедастичные ГП сосредоточены на корректировке выходной дисперсии и зависят от детерминированных измерений входных данных
- Локальная линейная аппроксимация в ГП с шумными входными данными (NIGP) может не работать при высокой нелинейности функций
- Расширенный фильтр Калмана показывает снижение производительности при сильной нелинейности или возмущениях

Научная мотивация

В условиях, где сигналы GPS недоступны или ненадёжны, неопределённость позиционирования распространяется на модель ГП, приводя к снижению производительности предсказаний. Существующие исследования в основном анализируют влияние неопределённости входных данных на предсказания ГП, но не предлагают методов обновления модели ГП для адаптации к исправленным оценкам входных данных.

Основные вклады

Разработана техника обновления модели ГП: Интеграция коррекции ошибок входных данных, вызванных позиционированием, через предварительно вычисленные высокопорядковые производные функций среднего и ковариации ГП
Предоставлен детальный анализ ошибок предсказания и времени вычисления: Включая теоретический анализ сходимости и оценку вычислительной сложности
Обширная верификация методом Монте-Карло: Демонстрация эффективности метода на двух различных сценариях
Возможность обновления в реальном времени: Исключение необходимости переобучения или повторного посещения мест измерений

Подробное описание метода

Определение задачи

Рассмотрим агента, оснащённого датчиком, посещающего набор мест измерений в области $X \subset \mathbb{R}^p$ для создания карты скалярного поля $h: X \to \mathbb{R}$ . Поле может быть смоделировано ГП: $h̄ \sim GP(μ, Σ)$

где $μ: \mathbb{R}^p \to \mathbb{R}$ — функция среднего, $Σ: \mathbb{R}^p × \mathbb{R}^p \to \mathbb{R}$ — функция ковариации.

Архитектура основного алгоритма

1. Квадратичное экспоненциальное ядро

Выбирается ядро ковариации квадратичной экспоненты: $k(\hat{x}, \hat{x}') := α^2 \exp\left(-\frac{||\hat{x} - \hat{x}'||^2}{2β^2}\right)$

где $α$ обозначает амплитуду, $β$ — масштаб длины.

2. Метод коррекции рядом Тейлора

Для точки запроса $x_e$ исправленный вектор среднего представляется разложением Тейлора второго порядка: $M(\hat{X}, x_e) := \hat{M}(\hat{X}, x_e) + \sum_{i=1}^n \frac{\partial\hat{M}(\hat{X}, x_e)}{\partial\hat{x}_i} δ_i + \frac{1}{2} \sum_{i=1}^n \frac{\partial^2\hat{M}(\hat{X}, x_e)}{\partial\hat{x}_i^2} δ_i^2$

где $δ_i$ обозначает возмущение i-го места измерения.

3. Матрицы Якоби и Гессе

Матрица Якоби функции среднего: $J_M := \left[\frac{\partial\hat{M}}{\partial\hat{x}_1}, \frac{\partial\hat{M}}{\partial\hat{x}_2}, \cdots, \frac{\partial\hat{M}}{\partial\hat{x}_n}\right]$

Матрица Гессе $H_M \in \mathbb{R}^{n×n}$ содержит все вторые частные производные.

4. Коррекция ковариации

Коррекция матрицы ковариации следует аналогичному разложению Тейлора: $S(\hat{X}, x_e) := \hat{S}(\hat{X}, x_e) + \sum_{i=1}^n \frac{\partial\hat{S}(\hat{X}, x_e)}{\partial\hat{x}_i} δ_i + \frac{1}{2} \sum_{i=1}^n \frac{\partial^2\hat{S}(\hat{X}, x_e)}{\partial\hat{x}_i^2} δ_i^2$

Технические инновации

Структура офлайн-онлайн:
- Офлайн этап: предварительное вычисление высокопорядковых производных функций среднего и ковариации
- Онлайн этап: использование сохранённых производных и информации об ошибках входных данных для обновления модели ГП в реальном времени
Использование дифференцируемости: Полное использование бесконечной дифференцируемости квадратичного экспоненциального ядра, гарантирующее существование и непрерывность всех производных
Вычислительная эффективность: Вычислительная сложность онлайн обновления составляет O(n), что значительно лучше O(n³) полного пересчёта ГП

Теоретический анализ

Теоремы сходимости

Теорема 1: Если ядро k аналитично на входной области X, то функция среднего $\hat{M}$ также является вещественно-аналитической, может быть представлена разложением Тейлора и равномерно сходится на любом компактном подмножестве X.

Теорема 2: Для достижения желаемой точности аппроксимации ε > 0 минимальный порядок производных в разложении Тейлора составляет: $N = \left\lceil \frac{\log(\frac{ε}{L_m})}{\log(β)} \right\rceil$

где $L_m$ — константа, ограничивающая тензор производных порядка (N+1).

Экспериментальная установка

Наборы данных и сценарии

Одномерный эксперимент

Функция: $h_1(x) = \sin(2πx)$ , $x \in [0,1]$
Места измерений: $\hat{X} = \{0, 0.1, 0.2, ..., 1\}$
Параметры ядра: $α = 0.1$ , $β = 0.2$
Возмущения: гауссовский шум $ε \sim N(0, 0.01^2)$ , вектор ошибок $δ_i \sim [0, 0.03]$

Двумерный эксперимент

Функция: $h_2(x,y) = \sin(2πx) \cdot \cos(2πy)$ , $(x,y) \in [0,1]^2$
Возмущения: фиксированное смещение $δ_i = 0.1$ (моделирование смещения датчика)

Метрики оценки

Точность предсказания: абсолютная ошибка между исправленным ГП и идеальным ГП
Время вычисления: сравнение времени коррекции с полным пересчётом ГП
Квантификация неопределённости: степень улучшения оценки ковариации

Методы сравнения

Базовая модель: идеальная модель ГП, обученная на истинных местах измерений
Повреждённая модель: модель ГП, обученная на запланированных местах, но использующая фактические измеренные значения
Исправленная модель: модель ГП, исправленная предложенным методом

Результаты экспериментов

Основные результаты

На основе средних результатов 1000 симуляций:

Метрика	Одномерная симуляция	Двумерная симуляция
Ошибка повреждённого ГП	1.2653	1.939
Ошибка исправленного ГП	1.055	1.2296
Процент улучшения	79.27%	71.785%

Сравнение времени вычисления

Метод	Одномерное время (сек)	Двумерное время (сек)
Повреждённый ГП	0.019	0.023
Исправленный ГП	0.000022	0.000036

Ключевые находки

Значительное повышение точности: В обоих тестовых сценариях метод коррекции достиг снижения ошибок более чем на 70%
Значительное улучшение вычислительной эффективности: Процесс коррекции примерно в 1000 раз быстрее полного вычисления ГП
Улучшение квантификации неопределённости: Оценка ковариации также значительно улучшена
Способность адаптации в реальном времени: Метод поддерживает онлайн обновление без необходимости переобучения

Связанные работы

Основные направления исследований

Обработка неопределённости входных данных:
- Аналитические методы Girard и др. (предполагают известное распределение входных данных)
- Итеративная структура предсказания Candela и др.
Регрессия гетероскедастичного ГП:
- Обработка переменного шума Kersting и др.
- Основное внимание уделяется корректировке выходной дисперсии
ГП с шумными входными данными (NIGP):
- Метод локального линейного разложения
- Точность ограничена при высокой нелинейности функций
Методы оценки состояния:
- Рекурсивная оценка расширенного фильтра Калмана
- Производительность снижается при сильной нелинейности

Преимущества данной работы

По сравнению с существующими методами, данная работа впервые предлагает технику обновления обученной модели ГП для адаптации к исправленным оценкам входных данных, заполняя пробел в этой области.

Заключение и обсуждение

Основные выводы

Верификация эффективности: Предложенный метод коррекции на основе рядов Тейлора показал значительное снижение ошибок и повышение вычислительной эффективности в обоих исследованиях симуляции
Прочная теоретическая база: Анализ сходимости подтверждает теоретическую надёжность метода
Практическая ценность: Метод особенно подходит для задач коррекции в реальном времени в динамических окружениях

Ограничения

Предположение о совершенных возмущениях: Метод предполагает, что возмущения $δ_i$ полностью известны, что означает полную наблюдаемость состояния агента
Проблемы частичного наблюдения: В практических сценариях может быть доступно только частичное измерение состояния, требующее дополнительных стратегий оценки
Проблемы масштабируемости: Для больших моделей ГП размер матриц производных может быть неблагоприятным для масштабирования
Ограничения функции ядра: Текущий метод специально разработан для квадратичного экспоненциального ядра

Направления будущих исследований

Приближённые методы: Разработка методов снижения размерности для обеспечения вычислительной осуществимости крупномасштабных приложений
Обработка частичного наблюдения: Расширение метода для работы со сценариями неполной информации о состоянии
Поддержка нескольких ядер: Расширение метода на другие типы функций ядра
Практическое развёртывание: Верификация практичности метода на реальных робототехнических системах

Глубокая оценка

Достоинства

Высокая инновационность метода: Впервые предложена техника онлайн коррекции модели ГП, решающая важную проблему практических приложений
Прочная теоретическая база: Предоставлен полный анализ сходимости и границы ошибок
Значительная вычислительная эффективность: Онлайн сложность O(n) по сравнению с O(n³) пересчёта представляет огромное преимущество
Полная экспериментальная верификация: Всесторонняя проверка эффективности метода на одномерных и двумерных примерах
Высокая практическая ценность: Особенно подходит для приложений мобильных роботов в условиях отказа GPS

Недостатки

Строгие предположения: Предположение о совершенной информации о возмущениях трудно удовлетворить в практических приложениях
Ограничение функции ядра: Детальный анализ проведён только для квадратичного экспоненциального ядра
Недостаточный анализ масштабируемости: Анализ применимости к высокомерным или крупномасштабным задачам недостаточен
Отсутствие практической верификации: Не хватает экспериментов на реальных робототехнических системах

Влияние

Академический вклад: Предоставляет новую теоретическую структуру и практический метод для обработки ошибок входных данных в регрессии ГП
Перспективы применения: Широкие перспективы применения в автономной навигации, мониторинге окружающей среды, поисково-спасательных операциях и других областях
Воспроизводимость: Подробное описание метода и чёткий алгоритм обеспечивают хорошую воспроизводимость

Применимые сценарии

Навигация мобильных роботов: Картирование полей в условиях отказа GPS
Мониторинг окружающей среды: Слияние данных и коррекция в сенсорных сетях
Автономное исследование: Онлайн обучение и адаптация в неизвестных окружениях
Промышленная диагностика: Системы контроля качества, требующие онлайн коррекции

Библиография

Статья ссылается на 21 важную работу, охватывающую классические и передовые исследования в области теории ГП, навигации роботов, оценки состояния и других смежных областей, обеспечивая прочную теоретическую базу для исследования.

Общая оценка: Это высококачественная техническая статья, предлагающая инновационный метод онлайн коррекции модели ГП с важной теоретической ценностью и практическим потенциалом применения. Метод достигает значительных улучшений как в вычислительной эффективности, так и в точности предсказания, обеспечивая ценный вклад в исследования и приложения в соответствующих областях.