Gaussian Processes (GPs) are widely recognized as powerful non-parametric models for regression and classification. Traditional GP frameworks predominantly operate under the assumption that the inputs are either accurately known or subject to zero-mean noise. However, several real-world applications such as mobile sensors have imperfect localization, leading to inputs with biased errors. These biases can typically be estimated through measurements collected over time using, for example, Kalman filters. To avoid recomputation of the entire GP model when better estimates of the inputs used in the training data become available, we introduce a technique for updating a trained GP model to incorporate updated estimates of the inputs. By leveraging the differentiability of the mean and covariance functions derived from the squared exponential kernel, a second-order correction algorithm is developed to update the trained GP models. Precomputed Jacobians and Hessians of kernels enable real-time refinement of the mean and covariance predictions. The efficacy of the developed approach is demonstrated using two simulation studies, with error analyses revealing improvements in both predictive accuracy and uncertainty quantification.
- ID статьи: 2504.18463
- Название: A Taylor Series Approach to Correction of Input Errors in Gaussian Process Regression
- Авторы: Muzaffar Qureshi, Tochukwu Elijah Ogri, Zachary I. Bell, Wanjiku A. Makumi, Rushikesh Kamalapurkar
- Классификация: eess.SY (Системы и управление), cs.RO (Робототехника), cs.SY (Системы и управление)
- Дата публикации: 25 апреля 2025 г.
- Ссылка на статью: https://arxiv.org/abs/2504.18463
В данной статье предлагается метод на основе рядов Тейлора для коррекции ошибок входных данных в регрессии гауссовских процессов (ГП). Традиционная структура ГП предполагает, что входные данные либо точно известны, либо подчиняются шуму с нулевым средним, однако в практических приложениях, таких как мобильные датчики, входные данные содержат смещённые ошибки из-за неточного позиционирования. Чтобы избежать пересчёта всей модели ГП при получении улучшенных оценок входных данных, авторы разработали алгоритм коррекции второго порядка, используя дифференцируемость функций среднего и ковариации квадратичного экспоненциального ядра. Благодаря предварительно вычисленным матрицам Якоби и Гессе достигается уточнение предсказаний среднего и ковариации в реальном времени.
- Основная проблема: В практических приложениях мобильные датчики создают неточные входные данные для регрессии ГП из-за ошибок позиционирования, что влияет на производительность модели
- Значимость: Точное картирование полей критично для мониторинга окружающей среды, поисково-спасательных операций, автономного подводного исследования и других областей
- Ограничения существующих методов:
- Традиционные методы предполагают точные входные данные или только шум с нулевым средним
- Гетероскедастичные ГП сосредоточены на корректировке выходной дисперсии и зависят от детерминированных измерений входных данных
- Локальная линейная аппроксимация в ГП с шумными входными данными (NIGP) может не работать при высокой нелинейности функций
- Расширенный фильтр Калмана показывает снижение производительности при сильной нелинейности или возмущениях
В условиях, где сигналы GPS недоступны или ненадёжны, неопределённость позиционирования распространяется на модель ГП, приводя к снижению производительности предсказаний. Существующие исследования в основном анализируют влияние неопределённости входных данных на предсказания ГП, но не предлагают методов обновления модели ГП для адаптации к исправленным оценкам входных данных.
- Разработана техника обновления модели ГП: Интеграция коррекции ошибок входных данных, вызванных позиционированием, через предварительно вычисленные высокопорядковые производные функций среднего и ковариации ГП
- Предоставлен детальный анализ ошибок предсказания и времени вычисления: Включая теоретический анализ сходимости и оценку вычислительной сложности
- Обширная верификация методом Монте-Карло: Демонстрация эффективности метода на двух различных сценариях
- Возможность обновления в реальном времени: Исключение необходимости переобучения или повторного посещения мест измерений
Рассмотрим агента, оснащённого датчиком, посещающего набор мест измерений в области X⊂Rp для создания карты скалярного поля h:X→R. Поле может быть смоделировано ГП:
hˉ∼GP(μ,Σ)
где μ:Rp→R — функция среднего, Σ:Rp×Rp→R — функция ковариации.
Выбирается ядро ковариации квадратичной экспоненты:
k(x^,x^′):=α2exp(−2β2∣∣x^−x^′∣∣2)
где α обозначает амплитуду, β — масштаб длины.
Для точки запроса xe исправленный вектор среднего представляется разложением Тейлора второго порядка:
M(X^,xe):=M^(X^,xe)+∑i=1n∂x^i∂M^(X^,xe)δi+21∑i=1n∂x^i2∂2M^(X^,xe)δi2
где δi обозначает возмущение i-го места измерения.
Матрица Якоби функции среднего:
JM:=[∂x^1∂M^,∂x^2∂M^,⋯,∂x^n∂M^]
Матрица Гессе HM∈Rn×n содержит все вторые частные производные.
Коррекция матрицы ковариации следует аналогичному разложению Тейлора:
S(X^,xe):=S^(X^,xe)+∑i=1n∂x^i∂S^(X^,xe)δi+21∑i=1n∂x^i2∂2S^(X^,xe)δi2
- Структура офлайн-онлайн:
- Офлайн этап: предварительное вычисление высокопорядковых производных функций среднего и ковариации
- Онлайн этап: использование сохранённых производных и информации об ошибках входных данных для обновления модели ГП в реальном времени
- Использование дифференцируемости: Полное использование бесконечной дифференцируемости квадратичного экспоненциального ядра, гарантирующее существование и непрерывность всех производных
- Вычислительная эффективность: Вычислительная сложность онлайн обновления составляет O(n), что значительно лучше O(n³) полного пересчёта ГП
Теорема 1: Если ядро k аналитично на входной области X, то функция среднего M^ также является вещественно-аналитической, может быть представлена разложением Тейлора и равномерно сходится на любом компактном подмножестве X.
Теорема 2: Для достижения желаемой точности аппроксимации ε > 0 минимальный порядок производных в разложении Тейлора составляет:
N=⌈log(β)log(Lmε)⌉
где Lm — константа, ограничивающая тензор производных порядка (N+1).
- Функция: h1(x)=sin(2πx), x∈[0,1]
- Места измерений: X^={0,0.1,0.2,...,1}
- Параметры ядра: α=0.1, β=0.2
- Возмущения: гауссовский шум ε∼N(0,0.012), вектор ошибок δi∼[0,0.03]
- Функция: h2(x,y)=sin(2πx)⋅cos(2πy), (x,y)∈[0,1]2
- Возмущения: фиксированное смещение δi=0.1 (моделирование смещения датчика)
- Точность предсказания: абсолютная ошибка между исправленным ГП и идеальным ГП
- Время вычисления: сравнение времени коррекции с полным пересчётом ГП
- Квантификация неопределённости: степень улучшения оценки ковариации
- Базовая модель: идеальная модель ГП, обученная на истинных местах измерений
- Повреждённая модель: модель ГП, обученная на запланированных местах, но использующая фактические измеренные значения
- Исправленная модель: модель ГП, исправленная предложенным методом
На основе средних результатов 1000 симуляций:
| Метрика | Одномерная симуляция | Двумерная симуляция |
|---|
| Ошибка повреждённого ГП | 1.2653 | 1.939 |
| Ошибка исправленного ГП | 1.055 | 1.2296 |
| Процент улучшения | 79.27% | 71.785% |
| Метод | Одномерное время (сек) | Двумерное время (сек) |
|---|
| Повреждённый ГП | 0.019 | 0.023 |
| Исправленный ГП | 0.000022 | 0.000036 |
- Значительное повышение точности: В обоих тестовых сценариях метод коррекции достиг снижения ошибок более чем на 70%
- Значительное улучшение вычислительной эффективности: Процесс коррекции примерно в 1000 раз быстрее полного вычисления ГП
- Улучшение квантификации неопределённости: Оценка ковариации также значительно улучшена
- Способность адаптации в реальном времени: Метод поддерживает онлайн обновление без необходимости переобучения
- Обработка неопределённости входных данных:
- Аналитические методы Girard и др. (предполагают известное распределение входных данных)
- Итеративная структура предсказания Candela и др.
- Регрессия гетероскедастичного ГП:
- Обработка переменного шума Kersting и др.
- Основное внимание уделяется корректировке выходной дисперсии
- ГП с шумными входными данными (NIGP):
- Метод локального линейного разложения
- Точность ограничена при высокой нелинейности функций
- Методы оценки состояния:
- Рекурсивная оценка расширенного фильтра Калмана
- Производительность снижается при сильной нелинейности
По сравнению с существующими методами, данная работа впервые предлагает технику обновления обученной модели ГП для адаптации к исправленным оценкам входных данных, заполняя пробел в этой области.
- Верификация эффективности: Предложенный метод коррекции на основе рядов Тейлора показал значительное снижение ошибок и повышение вычислительной эффективности в обоих исследованиях симуляции
- Прочная теоретическая база: Анализ сходимости подтверждает теоретическую надёжность метода
- Практическая ценность: Метод особенно подходит для задач коррекции в реальном времени в динамических окружениях
- Предположение о совершенных возмущениях: Метод предполагает, что возмущения δi полностью известны, что означает полную наблюдаемость состояния агента
- Проблемы частичного наблюдения: В практических сценариях может быть доступно только частичное измерение состояния, требующее дополнительных стратегий оценки
- Проблемы масштабируемости: Для больших моделей ГП размер матриц производных может быть неблагоприятным для масштабирования
- Ограничения функции ядра: Текущий метод специально разработан для квадратичного экспоненциального ядра
- Приближённые методы: Разработка методов снижения размерности для обеспечения вычислительной осуществимости крупномасштабных приложений
- Обработка частичного наблюдения: Расширение метода для работы со сценариями неполной информации о состоянии
- Поддержка нескольких ядер: Расширение метода на другие типы функций ядра
- Практическое развёртывание: Верификация практичности метода на реальных робототехнических системах
- Высокая инновационность метода: Впервые предложена техника онлайн коррекции модели ГП, решающая важную проблему практических приложений
- Прочная теоретическая база: Предоставлен полный анализ сходимости и границы ошибок
- Значительная вычислительная эффективность: Онлайн сложность O(n) по сравнению с O(n³) пересчёта представляет огромное преимущество
- Полная экспериментальная верификация: Всесторонняя проверка эффективности метода на одномерных и двумерных примерах
- Высокая практическая ценность: Особенно подходит для приложений мобильных роботов в условиях отказа GPS
- Строгие предположения: Предположение о совершенной информации о возмущениях трудно удовлетворить в практических приложениях
- Ограничение функции ядра: Детальный анализ проведён только для квадратичного экспоненциального ядра
- Недостаточный анализ масштабируемости: Анализ применимости к высокомерным или крупномасштабным задачам недостаточен
- Отсутствие практической верификации: Не хватает экспериментов на реальных робототехнических системах
- Академический вклад: Предоставляет новую теоретическую структуру и практический метод для обработки ошибок входных данных в регрессии ГП
- Перспективы применения: Широкие перспективы применения в автономной навигации, мониторинге окружающей среды, поисково-спасательных операциях и других областях
- Воспроизводимость: Подробное описание метода и чёткий алгоритм обеспечивают хорошую воспроизводимость
- Навигация мобильных роботов: Картирование полей в условиях отказа GPS
- Мониторинг окружающей среды: Слияние данных и коррекция в сенсорных сетях
- Автономное исследование: Онлайн обучение и адаптация в неизвестных окружениях
- Промышленная диагностика: Системы контроля качества, требующие онлайн коррекции
Статья ссылается на 21 важную работу, охватывающую классические и передовые исследования в области теории ГП, навигации роботов, оценки состояния и других смежных областей, обеспечивая прочную теоретическую базу для исследования.
Общая оценка: Это высококачественная техническая статья, предлагающая инновационный метод онлайн коррекции модели ГП с важной теоретической ценностью и практическим потенциалом применения. Метод достигает значительных улучшений как в вычислительной эффективности, так и в точности предсказания, обеспечивая ценный вклад в исследования и приложения в соответствующих областях.