2025-11-23T18:40:17.722372

Adaptive Motion Planning via Contact-Based Intent Inference for Human-Robot Collaboration

Song, Liang, Zheng
Human-robot collaboration (HRC) requires robots to adapt their motions to human intent to ensure safe and efficient cooperation in shared spaces. Although large language models (LLMs) provide high-level reasoning for inferring human intent, their application to reliable motion planning in HRC remains challenging. Physical human-robot interaction (pHRI) is intuitive but often relies on continuous kinesthetic guidance, which imposes burdens on operators. To address these challenges, a contact-informed adaptive motion-planning framework is introduced to infer human intent directly from physical contact and employ the inferred intent for online motion correction in HRC. First, an optimization-based force estimation method is proposed to infer human-intended contact forces and locations from joint torque measurements and a robot dynamics model, thereby reducing cost and installation complexity while enabling whole-body sensitivity. Then, a torque-based contact detection mechanism with link-level localization is introduced to reduce the optimization search space and to enable real-time estimation. Subsequently, a contact-informed adaptive motion planner is developed to infer human intent from contacts and to replan robot motion online, while maintaining smoothness and adapting to human corrections. Finally, experiments on a 7-DOF manipulator are conducted to demonstrate the accuracy of the proposed force estimation method and the effectiveness of the contact-informed adaptive motion planner under perception uncertainty in HRC.
academic

Адаптивное планирование движений посредством вывода намерений на основе контакта для сотрудничества человека и робота

Основная информация

  • ID статьи: 2510.08811
  • Название: Adaptive Motion Planning via Contact-Based Intent Inference for Human-Robot Collaboration
  • Авторы: Jiurun Song (Texas A&M University), Xiao Liang (Texas A&M University), Minghui Zheng (Texas A&M University)
  • Классификация: cs.RO (Робототехника)
  • Дата публикации: 9 октября 2024 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.08811

Аннотация

Сотрудничество человека и робота (HRC) требует адаптации робота к намерениям человека для обеспечения безопасного и эффективного взаимодействия в общем пространстве. Хотя большие языковые модели (LLM) предоставляют высокоуровневые возможности рассуждений для вывода намерений человека, их применение в надежном планировании движений HRC остается сложной задачей. Физическое взаимодействие человека и робота (pHRI) интуитивно понятно, но обычно требует постоянного кинестетического руководства, что создает нагрузку на оператора. Для решения этих проблем в данной статье представлена адаптивная система планирования движений на основе информации о контакте, которая непосредственно выводит намерения человека из физического контакта и использует их для онлайн-коррекции движений в HRC.

Исследовательский контекст и мотивация

Основная проблема

В сотрудничестве человека и робота робот должен адаптироваться к намерениям человека в реальном времени для обеспечения безопасного и эффективного взаимодействия, особенно в неопределенных и динамических средах. Когда запланированная траектория робота не совпадает с намерением человека, требуется своевременная коррекция.

Значимость проблемы

  1. Требования безопасности: В общем рабочем пространстве робот должен реагировать на корректировки безопасности со стороны человека
  2. Требования эффективности: Снижение нагрузки от постоянного физического руководства человеком и повышение эффективности сотрудничества
  3. Практические соображения: Существующие методы либо требуют дорогостоящих датчиков, либо нуждаются в постоянном вмешательстве человека

Ограничения существующих методов

  1. Большие языковые модели: Применимы для высокоуровневого планирования задач, но имеют задержки и неполные описания при непрерывной низкоуровневой адаптации движений
  2. Кинестетическое руководство: Требует постоянных физических усилий, создавая нагрузку на оператора
  3. Тактильные датчики: Сложное развертывание, высокие затраты, проблемы с адаптацией к криволинейным поверхностям и устойчивостью к ударам

Исследовательская мотивация

Использование того факта, что величина и направление контактной силы естественным образом кодируют намерение человека, позволяя передавать корректирующие намерения посредством кратковременного контакта, а не постоянного руководства.

Основные вклады

  1. Метод оптимизационной оценки силы: Вывод контактной силы и положения намерения человека на основе датчиков крутящего момента в суставах и динамической модели робота, снижение затрат и сложности установки, обеспечение чувствительности всего тела
  2. Механизм обнаружения контакта на основе крутящего момента: Введение локализации на уровне звена для сокращения пространства поиска оптимизации и обеспечение оценки в реальном времени
  3. Адаптивный планировщик движений на основе информации о контакте: Вывод намерений человека из информации о контакте и переплан движений робота в режиме онлайн с сохранением гладкости и адаптацией к корректировкам человека
  4. Экспериментальная верификация: Проверка точности метода оценки силы на 7-степенном манипуляторе и эффективности адаптивного планировщика движений при неопределенности восприятия

Подробное описание методов

Определение задачи

Для n-степенного последовательного манипулятора, используя измерения крутящего момента в суставах и динамическую модель робота, оценить контактную силу и положение намерения человека, а затем использовать эту информацию для онлайн-коррекции планирования движений робота.

Архитектура модели

1. Моделирование динамики

Уравнение динамики робота включает внешние контактные силы:

τ = M(q)q̈ + h(q,q̇) + τ_ext

где τ_ext — крутящий момент в суставах, вызванный внешней контактной силой.

2. Обнаружение контакта

Статистика обнаружения на основе остаточного крутящего момента:

η(t) = ||W_τ τ̂_ext(t)||_2

Использование экспоненциально взвешенного скользящего среднего (EWMA) фильтрации и гистерезисного механизма для обеспечения надежных переходов состояния.

3. Локализация на уровне звена

Определение звена контакта путем анализа распределения остаточного крутящего момента:

ℓ = max{j | |τ̂_ext,j| > τ_th and |τ̂_ext,j+1| < τ_th}

4. Оценка контактной силы

Моделирование контакта как точечного контакта на звене с решением через ограниченную нелинейную оптимизацию:

min_{s,F_c} (1/2)∑_{k=1}^N ||τ̂_ext(t_k) - J_c(q(t_k),s)^T F_c||^2
s.t. 0 ≤ s ≤ 1, ||F_c|| ≤ F_max_c

5. Адаптивное планирование движений

Коррекция опорной траектории на основе оцененной контактной силы:

  • Вычисление средней контактной силы и направления
  • Генерация декартова смещения: Δx_c^(r) = α sat(||F̄_c^(r)||, F_max_c) f̂^(r)
  • Использование C¹ полиномиальных функций выпуклости для обеспечения гладкости траектории
  • Накопление деформаций для сохранения неизменности конечной цели

Технические инновации

  1. Чувствительность всего тела: Использование существующих датчиков крутящего момента в суставах для обеспечения восприятия контакта всего манипулятора
  2. Производительность в реальном времени: Сокращение пространства поиска посредством грубой локализации на уровне звена для обеспечения оценки в реальном времени
  3. Гладкая адаптация: Использование функций выпуклости для обеспечения C¹ непрерывности коррекции траектории
  4. Вывод намерений: Прямое отображение величины и направления контактной силы на корректирующие намерения движения

Экспериментальная установка

Экспериментальная платформа

  • Робот: 7-степенный манипулятор Franka Research 3
  • Датчики: Датчики крутящего момента в суставах
  • Среда: Сценарий сотрудничества при разборке компьютера

Показатели оценки

  • Точность оценки силы: Оценка путем сравнения предсказанного крутящего момента в суставах с измеренным значением
  • Адаптивность движений: Оценка по успешности избежания препятствий и гладкости траектории
  • Время отклика: Задержка от обнаружения контакта до коррекции движения

Дизайн экспериментов

  1. Верификация оценки силы: Робот выполняет круговую траекторию, человек прикладывает толчки, тяги и постукивания на разных звеньях
  2. Коррекция одиночного контакта: Сценарий избежания препятствий по прямой траектории
  3. Коррекция множественных контактов: Сложное избежание препятствий, требующее многократного вмешательства человека

Результаты экспериментов

Основные результаты

1. Точность оценки силы

  • Средняя абсолютная ошибка: 0,665 Н·м (оценка крутящего момента в суставе)
  • Временная согласованность: Оцененный крутящий момент и измеренное значение показывают согласованные тенденции на всех 7 суставах
  • Обнаружение контакта: Все 5 событий контакта были своевременно обнаружены

2. Производительность адаптации движений

  • Коррекция одиночного контакта: Успешное избежание вертикально и горизонтально расположенных препятствий
  • Коррекция множественных контактов: 4 последовательных контакта успешно направили робота вокруг сложного препятствия
  • Гладкость траектории: Все скорректированные траектории сохраняют C¹ непрерывность

Анализ случаев

Эксперимент 1: Избежание вертикального препятствия

  • Человек прикладывает горизонтальную контактную силу в отрицательном направлении x
  • Робот успешно смещается в сторону, избегая препятствия
  • Траектория плавно сходится к исходной целевой точке

Эксперимент 2: Избежание горизонтального препятствия

  • Человек прикладывает восходящую контактную силу
  • Робот обходит препятствие сверху
  • Демонстрирует правильное понимание намерений в различных направлениях

Эксперимент 3: Множественные корректировки

  • 4 последовательных контакта: 2 боковых, 1 сильное смещение, 1 нисходящая коррекция
  • Демонстрирует способность обработки сложных последовательностей намерений
  • Подтверждает эффективность механизма пошаговой коррекции

Экспериментальные выводы

  1. Согласованность направления силы: Оцененное направление силы остается согласованным в пределах одного события контакта, указывая на единственное доминирующее намерение
  2. Изменение амплитуды силы: Сила меньше в начале и конце контакта, достигая пика в середине, что соответствует естественной модели контакта
  3. Производительность в реальном времени: Система способна обнаруживать контакт и корректировать движение в реальном времени, удовлетворяя требованиям сотрудничества

Связанные работы

Основные направления исследований

  1. Применение больших языковых моделей в HRC: Высокоуровневое планирование задач и семантические рассуждения
  2. Физическое взаимодействие человека и робота: Кинестетическое руководство, управление импедансом, совместное управление
  3. Технологии восприятия контакта: Тактильные датчики, оценка силы на основе моделей
  4. Методы вывода намерений: Машинное обучение, методы оптимизации, вероятностные модели

Преимущества данной работы

  1. Экономическая эффективность: Использование существующих датчиков крутящего момента в суставах без необходимости в дополнительных тактильных датчиках
  2. Производительность в реальном времени: Реализация оценки в реальном времени посредством иерархической стратегии локализации
  3. Восприятие всего тела: Обеспечение чувствительности всего манипулятора в отличие от методов, ограниченных захватом
  4. Гладкая адаптация: Гарантирование непрерывности траектории, избежание скачков

Заключение и обсуждение

Основные выводы

  1. Предложенная система способна точно оценивать контактную силу и положение намерения человека
  2. Планирование движений на основе информации о контакте обеспечивает гладкую онлайн-коррекцию траектории
  3. Экспериментальная верификация подтверждает эффективность метода в задачах сотрудничества при разборке
  4. По сравнению с постоянным кинестетическим руководством значительно снижается нагрузка на оператора

Ограничения

  1. Предположение о точечном контакте: Текущий метод предполагает точечный контакт, что может быть неприменимо при контакте на большой площади
  2. Настройка параметров: Чувствительность системы требует ручной настройки и может не адаптироваться к индивидуальным различиям
  3. Ограничения окружающей среды: Основная верификация проведена в структурированной среде, адаптивность в сложных средах недостаточно протестирована
  4. Зависимость от динамической модели: Метод зависит от точной динамической модели робота

Направления будущих исследований

  1. Персонализированное обучение: Адаптация к индивидуальным стилям взаимодействия посредством методов обучения
  2. Обработка множественных контактов: Расширение на сценарии одновременного множественного контакта
  3. Обобщение в окружающей среде: Верификация в более сложных и неструктурированных средах
  4. Долгосрочное обучение: Итеративное улучшение параметров через многократные испытания

Глубокая оценка

Преимущества

  1. Техническая инновация: Умелое сочетание моделирования динамики и методов оптимизации для реализации низкостоимостного высокоточного восприятия контакта
  2. Практическая ценность: Решение важной проблемы в реальном HRC с прямым применением
  3. Полнота системы: Формирование полной замкнутой системы от обнаружения контакта до планирования движений
  4. Достаточная экспериментальная верификация: Многосценарная верификация демонстрирует надежность и адаптивность метода

Недостатки

  1. Недостаточный теоретический анализ: Отсутствие теоретических гарантий сходимости и устойчивости
  2. Ограниченные сравнительные эксперименты: Недостаточное количественное сравнение с другими передовыми методами
  3. Отсутствие пользовательских исследований: Отсутствие субъективной оценки реальными пользователями и долгосрочных исследований использования
  4. Анализ вычислительной сложности: Недостаточно детальный анализ вычислительных затрат решения оптимизации

Влияние

  1. Академический вклад: Предоставление нового технического пути для вывода намерений в HRC
  2. Промышленное применение: Метод имеет хорошие перспективы промышленного применения
  3. Воспроизводимость: Достаточная детализация технических деталей облегчает воспроизведение и расширение
  4. Вдохновляющее значение: Предоставление ценных идей для связанных исследований

Применимые сценарии

  1. Совместное производство: Сборка, разборка, полировка и другие производственные задачи, требующие сотрудничества человека и робота
  2. Сервисные роботы: Сценарии домашних и медицинских услуг, требующие физического взаимодействия
  3. Реабилитационное обучение: Применение реабилитационных роботов, требующих адаптации к намерениям пациента
  4. Образовательные исследования: Использование в качестве исследовательской платформы для HRC и вывода намерений

Библиография

Статья цитирует 38 связанных работ, охватывающих важные работы в нескольких связанных областях, включая HRC, pHRI, восприятие контакта и планирование движений, обеспечивая прочную теоретическую основу для исследования.


Общая оценка: Это высококачественная статья с важным вкладом в область сотрудничества человека и робота. Предложенная авторами система адаптивного планирования движений на основе информации о контакте технически передовая, практически применима и достаточно экспериментально верифицирована. Хотя существует место для улучшения в теоретическом анализе и пользовательских исследованиях, в целом это представляет собой важный прогресс в этой области с хорошей академической ценностью и перспективами применения.