2025-11-23T18:40:17.722372

Adaptive Motion Planning via Contact-Based Intent Inference for Human-Robot Collaboration

Song, Liang, Zheng

Human-robot collaboration (HRC) requires robots to adapt their motions to human intent to ensure safe and efficient cooperation in shared spaces. Although large language models (LLMs) provide high-level reasoning for inferring human intent, their application to reliable motion planning in HRC remains challenging. Physical human-robot interaction (pHRI) is intuitive but often relies on continuous kinesthetic guidance, which imposes burdens on operators. To address these challenges, a contact-informed adaptive motion-planning framework is introduced to infer human intent directly from physical contact and employ the inferred intent for online motion correction in HRC. First, an optimization-based force estimation method is proposed to infer human-intended contact forces and locations from joint torque measurements and a robot dynamics model, thereby reducing cost and installation complexity while enabling whole-body sensitivity. Then, a torque-based contact detection mechanism with link-level localization is introduced to reduce the optimization search space and to enable real-time estimation. Subsequently, a contact-informed adaptive motion planner is developed to infer human intent from contacts and to replan robot motion online, while maintaining smoothness and adapting to human corrections. Finally, experiments on a 7-DOF manipulator are conducted to demonstrate the accuracy of the proposed force estimation method and the effectiveness of the contact-informed adaptive motion planner under perception uncertainty in HRC.

academic

Адаптивное планирование движений посредством вывода намерений на основе контакта для сотрудничества человека и робота

Основная информация

ID статьи: 2510.08811
Название: Adaptive Motion Planning via Contact-Based Intent Inference for Human-Robot Collaboration
Авторы: Jiurun Song (Texas A&M University), Xiao Liang (Texas A&M University), Minghui Zheng (Texas A&M University)
Классификация: cs.RO (Робототехника)
Дата публикации: 9 октября 2024 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.08811

Аннотация

Сотрудничество человека и робота (HRC) требует адаптации робота к намерениям человека для обеспечения безопасного и эффективного взаимодействия в общем пространстве. Хотя большие языковые модели (LLM) предоставляют высокоуровневые возможности рассуждений для вывода намерений человека, их применение в надежном планировании движений HRC остается сложной задачей. Физическое взаимодействие человека и робота (pHRI) интуитивно понятно, но обычно требует постоянного кинестетического руководства, что создает нагрузку на оператора. Для решения этих проблем в данной статье представлена адаптивная система планирования движений на основе информации о контакте, которая непосредственно выводит намерения человека из физического контакта и использует их для онлайн-коррекции движений в HRC.

Исследовательский контекст и мотивация

Основная проблема

В сотрудничестве человека и робота робот должен адаптироваться к намерениям человека в реальном времени для обеспечения безопасного и эффективного взаимодействия, особенно в неопределенных и динамических средах. Когда запланированная траектория робота не совпадает с намерением человека, требуется своевременная коррекция.

Значимость проблемы

Требования безопасности: В общем рабочем пространстве робот должен реагировать на корректировки безопасности со стороны человека
Требования эффективности: Снижение нагрузки от постоянного физического руководства человеком и повышение эффективности сотрудничества
Практические соображения: Существующие методы либо требуют дорогостоящих датчиков, либо нуждаются в постоянном вмешательстве человека

Ограничения существующих методов

Большие языковые модели: Применимы для высокоуровневого планирования задач, но имеют задержки и неполные описания при непрерывной низкоуровневой адаптации движений
Кинестетическое руководство: Требует постоянных физических усилий, создавая нагрузку на оператора
Тактильные датчики: Сложное развертывание, высокие затраты, проблемы с адаптацией к криволинейным поверхностям и устойчивостью к ударам

Исследовательская мотивация

Использование того факта, что величина и направление контактной силы естественным образом кодируют намерение человека, позволяя передавать корректирующие намерения посредством кратковременного контакта, а не постоянного руководства.

Основные вклады

Метод оптимизационной оценки силы: Вывод контактной силы и положения намерения человека на основе датчиков крутящего момента в суставах и динамической модели робота, снижение затрат и сложности установки, обеспечение чувствительности всего тела
Механизм обнаружения контакта на основе крутящего момента: Введение локализации на уровне звена для сокращения пространства поиска оптимизации и обеспечение оценки в реальном времени
Адаптивный планировщик движений на основе информации о контакте: Вывод намерений человека из информации о контакте и переплан движений робота в режиме онлайн с сохранением гладкости и адаптацией к корректировкам человека
Экспериментальная верификация: Проверка точности метода оценки силы на 7-степенном манипуляторе и эффективности адаптивного планировщика движений при неопределенности восприятия

Подробное описание методов

Определение задачи

Для n-степенного последовательного манипулятора, используя измерения крутящего момента в суставах и динамическую модель робота, оценить контактную силу и положение намерения человека, а затем использовать эту информацию для онлайн-коррекции планирования движений робота.

Архитектура модели

1. Моделирование динамики

Уравнение динамики робота включает внешние контактные силы:

τ = M(q)q̈ + h(q,q̇) + τ_ext

где τ_ext — крутящий момент в суставах, вызванный внешней контактной силой.

2. Обнаружение контакта

Статистика обнаружения на основе остаточного крутящего момента:

η(t) = ||W_τ τ̂_ext(t)||_2

Использование экспоненциально взвешенного скользящего среднего (EWMA) фильтрации и гистерезисного механизма для обеспечения надежных переходов состояния.

3. Локализация на уровне звена

Определение звена контакта путем анализа распределения остаточного крутящего момента:

ℓ = max{j | |τ̂_ext,j| > τ_th and |τ̂_ext,j+1| < τ_th}

4. Оценка контактной силы

Моделирование контакта как точечного контакта на звене с решением через ограниченную нелинейную оптимизацию:

min_{s,F_c} (1/2)∑_{k=1}^N ||τ̂_ext(t_k) - J_c(q(t_k),s)^T F_c||^2
s.t. 0 ≤ s ≤ 1, ||F_c|| ≤ F_max_c

5. Адаптивное планирование движений

Коррекция опорной траектории на основе оцененной контактной силы:

Вычисление средней контактной силы и направления
Генерация декартова смещения: Δx_c^(r) = α sat(||F̄_c^(r)||, F_max_c) f̂^(r)
Использование C¹ полиномиальных функций выпуклости для обеспечения гладкости траектории
Накопление деформаций для сохранения неизменности конечной цели

Технические инновации

Чувствительность всего тела: Использование существующих датчиков крутящего момента в суставах для обеспечения восприятия контакта всего манипулятора
Производительность в реальном времени: Сокращение пространства поиска посредством грубой локализации на уровне звена для обеспечения оценки в реальном времени
Гладкая адаптация: Использование функций выпуклости для обеспечения C¹ непрерывности коррекции траектории
Вывод намерений: Прямое отображение величины и направления контактной силы на корректирующие намерения движения

Экспериментальная установка

Экспериментальная платформа

Робот: 7-степенный манипулятор Franka Research 3
Датчики: Датчики крутящего момента в суставах
Среда: Сценарий сотрудничества при разборке компьютера

Показатели оценки

Точность оценки силы: Оценка путем сравнения предсказанного крутящего момента в суставах с измеренным значением
Адаптивность движений: Оценка по успешности избежания препятствий и гладкости траектории
Время отклика: Задержка от обнаружения контакта до коррекции движения

Дизайн экспериментов

Верификация оценки силы: Робот выполняет круговую траекторию, человек прикладывает толчки, тяги и постукивания на разных звеньях
Коррекция одиночного контакта: Сценарий избежания препятствий по прямой траектории
Коррекция множественных контактов: Сложное избежание препятствий, требующее многократного вмешательства человека

Результаты экспериментов

Основные результаты

1. Точность оценки силы

Средняя абсолютная ошибка: 0,665 Н·м (оценка крутящего момента в суставе)
Временная согласованность: Оцененный крутящий момент и измеренное значение показывают согласованные тенденции на всех 7 суставах
Обнаружение контакта: Все 5 событий контакта были своевременно обнаружены

2. Производительность адаптации движений

Коррекция одиночного контакта: Успешное избежание вертикально и горизонтально расположенных препятствий
Коррекция множественных контактов: 4 последовательных контакта успешно направили робота вокруг сложного препятствия
Гладкость траектории: Все скорректированные траектории сохраняют C¹ непрерывность

Анализ случаев

Эксперимент 1: Избежание вертикального препятствия

Человек прикладывает горизонтальную контактную силу в отрицательном направлении x
Робот успешно смещается в сторону, избегая препятствия
Траектория плавно сходится к исходной целевой точке

Эксперимент 2: Избежание горизонтального препятствия

Человек прикладывает восходящую контактную силу
Робот обходит препятствие сверху
Демонстрирует правильное понимание намерений в различных направлениях

Эксперимент 3: Множественные корректировки

4 последовательных контакта: 2 боковых, 1 сильное смещение, 1 нисходящая коррекция
Демонстрирует способность обработки сложных последовательностей намерений
Подтверждает эффективность механизма пошаговой коррекции

Экспериментальные выводы

Согласованность направления силы: Оцененное направление силы остается согласованным в пределах одного события контакта, указывая на единственное доминирующее намерение
Изменение амплитуды силы: Сила меньше в начале и конце контакта, достигая пика в середине, что соответствует естественной модели контакта
Производительность в реальном времени: Система способна обнаруживать контакт и корректировать движение в реальном времени, удовлетворяя требованиям сотрудничества

Связанные работы

Основные направления исследований

Применение больших языковых моделей в HRC: Высокоуровневое планирование задач и семантические рассуждения
Физическое взаимодействие человека и робота: Кинестетическое руководство, управление импедансом, совместное управление
Технологии восприятия контакта: Тактильные датчики, оценка силы на основе моделей
Методы вывода намерений: Машинное обучение, методы оптимизации, вероятностные модели

Преимущества данной работы

Экономическая эффективность: Использование существующих датчиков крутящего момента в суставах без необходимости в дополнительных тактильных датчиках
Производительность в реальном времени: Реализация оценки в реальном времени посредством иерархической стратегии локализации
Восприятие всего тела: Обеспечение чувствительности всего манипулятора в отличие от методов, ограниченных захватом
Гладкая адаптация: Гарантирование непрерывности траектории, избежание скачков

Заключение и обсуждение

Основные выводы

Предложенная система способна точно оценивать контактную силу и положение намерения человека
Планирование движений на основе информации о контакте обеспечивает гладкую онлайн-коррекцию траектории
Экспериментальная верификация подтверждает эффективность метода в задачах сотрудничества при разборке
По сравнению с постоянным кинестетическим руководством значительно снижается нагрузка на оператора

Ограничения

Предположение о точечном контакте: Текущий метод предполагает точечный контакт, что может быть неприменимо при контакте на большой площади
Настройка параметров: Чувствительность системы требует ручной настройки и может не адаптироваться к индивидуальным различиям
Ограничения окружающей среды: Основная верификация проведена в структурированной среде, адаптивность в сложных средах недостаточно протестирована
Зависимость от динамической модели: Метод зависит от точной динамической модели робота

Направления будущих исследований

Персонализированное обучение: Адаптация к индивидуальным стилям взаимодействия посредством методов обучения
Обработка множественных контактов: Расширение на сценарии одновременного множественного контакта
Обобщение в окружающей среде: Верификация в более сложных и неструктурированных средах
Долгосрочное обучение: Итеративное улучшение параметров через многократные испытания

Глубокая оценка

Преимущества

Техническая инновация: Умелое сочетание моделирования динамики и методов оптимизации для реализации низкостоимостного высокоточного восприятия контакта
Практическая ценность: Решение важной проблемы в реальном HRC с прямым применением
Полнота системы: Формирование полной замкнутой системы от обнаружения контакта до планирования движений
Достаточная экспериментальная верификация: Многосценарная верификация демонстрирует надежность и адаптивность метода

Недостатки

Недостаточный теоретический анализ: Отсутствие теоретических гарантий сходимости и устойчивости
Ограниченные сравнительные эксперименты: Недостаточное количественное сравнение с другими передовыми методами
Отсутствие пользовательских исследований: Отсутствие субъективной оценки реальными пользователями и долгосрочных исследований использования
Анализ вычислительной сложности: Недостаточно детальный анализ вычислительных затрат решения оптимизации

Влияние

Академический вклад: Предоставление нового технического пути для вывода намерений в HRC
Промышленное применение: Метод имеет хорошие перспективы промышленного применения
Воспроизводимость: Достаточная детализация технических деталей облегчает воспроизведение и расширение
Вдохновляющее значение: Предоставление ценных идей для связанных исследований

Применимые сценарии

Совместное производство: Сборка, разборка, полировка и другие производственные задачи, требующие сотрудничества человека и робота
Сервисные роботы: Сценарии домашних и медицинских услуг, требующие физического взаимодействия
Реабилитационное обучение: Применение реабилитационных роботов, требующих адаптации к намерениям пациента
Образовательные исследования: Использование в качестве исследовательской платформы для HRC и вывода намерений

Библиография

Статья цитирует 38 связанных работ, охватывающих важные работы в нескольких связанных областях, включая HRC, pHRI, восприятие контакта и планирование движений, обеспечивая прочную теоретическую основу для исследования.

Общая оценка: Это высококачественная статья с важным вкладом в область сотрудничества человека и робота. Предложенная авторами система адаптивного планирования движений на основе информации о контакте технически передовая, практически применима и достаточно экспериментально верифицирована. Хотя существует место для улучшения в теоретическом анализе и пользовательских исследованиях, в целом это представляет собой важный прогресс в этой области с хорошей академической ценностью и перспективами применения.