2025-11-23T18:40:17.722372

Adaptive Motion Planning via Contact-Based Intent Inference for Human-Robot Collaboration

Song, Liang, Zheng
Human-robot collaboration (HRC) requires robots to adapt their motions to human intent to ensure safe and efficient cooperation in shared spaces. Although large language models (LLMs) provide high-level reasoning for inferring human intent, their application to reliable motion planning in HRC remains challenging. Physical human-robot interaction (pHRI) is intuitive but often relies on continuous kinesthetic guidance, which imposes burdens on operators. To address these challenges, a contact-informed adaptive motion-planning framework is introduced to infer human intent directly from physical contact and employ the inferred intent for online motion correction in HRC. First, an optimization-based force estimation method is proposed to infer human-intended contact forces and locations from joint torque measurements and a robot dynamics model, thereby reducing cost and installation complexity while enabling whole-body sensitivity. Then, a torque-based contact detection mechanism with link-level localization is introduced to reduce the optimization search space and to enable real-time estimation. Subsequently, a contact-informed adaptive motion planner is developed to infer human intent from contacts and to replan robot motion online, while maintaining smoothness and adapting to human corrections. Finally, experiments on a 7-DOF manipulator are conducted to demonstrate the accuracy of the proposed force estimation method and the effectiveness of the contact-informed adaptive motion planner under perception uncertainty in HRC.
academic

Adaptive Bewegungsplanung durch kontaktbasierte Absichtserkennung für die Mensch-Roboter-Kollaboration

Grundinformationen

  • Paper-ID: 2510.08811
  • Titel: Adaptive Motion Planning via Contact-Based Intent Inference for Human-Robot Collaboration
  • Autoren: Jiurun Song (Texas A&M University), Xiao Liang (Texas A&M University), Minghui Zheng (Texas A&M University)
  • Klassifikation: cs.RO (Robotik)
  • Veröffentlichungsdatum: 9. Oktober 2024 (arXiv-Preprint)
  • Paper-Link: https://arxiv.org/abs/2510.08811

Zusammenfassung

Die Mensch-Roboter-Kollaboration (HRC) erfordert, dass Roboter sich an menschliche Absichten anpassen, um sichere und effiziente Zusammenarbeit in gemeinsamen Räumen zu gewährleisten. Obwohl große Sprachmodelle (LLMs) hochrangige Reasoning-Fähigkeiten zur Absichtserkennung bieten, bleibt ihre Anwendung in zuverlässiger HRC-Bewegungsplanung eine Herausforderung. Die physische Mensch-Roboter-Interaktion (pHRI) ist intuitiv, erfordert aber typischerweise kontinuierliche kinästhetische Führung, was den Bediener belastet. Um diese Herausforderungen zu bewältigen, wird in diesem Artikel ein adaptives Bewegungsplanungsframework auf Basis von Kontaktinformationen eingeführt, das menschliche Absichten direkt aus physischen Kontakten ableitet und für Online-Bewegungskorrektionen in der HRC verwendet wird.

Forschungshintergrund und Motivation

Kernproblem

In der Mensch-Roboter-Kollaboration muss der Roboter menschliche Absichten in Echtzeit adaptieren, um sichere und effiziente Zusammenarbeit zu gewährleisten, besonders in unsicheren und dynamischen Umgebungen. Wenn der geplante Pfad des Roboters nicht mit der menschlichen Absicht übereinstimmt, sind zeitnahe Anpassungen erforderlich.

Bedeutung des Problems

  1. Sicherheitsanforderungen: In gemeinsamen Arbeitsbereichen muss der Roboter auf menschliche Sicherheitskorrektionen reagieren können
  2. Effizienzanforderungen: Reduzierung der Last durch kontinuierliche physische Führung durch Menschen und Verbesserung der Kollaborationseffizienz
  3. Praktische Überlegungen: Bestehende Methoden sind entweder auf teure Sensoren angewiesen oder erfordern kontinuierliche menschliche Intervention

Einschränkungen bestehender Methoden

  1. Große Sprachmodelle: Geeignet für hochrangige Aufgabenplanung, aber mit Verzögerungen und unvollständigen Beschreibungen bei kontinuierlicher niedrigstufiger Bewegungsadaption
  2. Kinästhetische Führung: Erfordert kontinuierliche physische Anstrengung und belastet den Bediener
  3. Taktile Sensoren: Komplexe Bereitstellung, hohe Kosten, Herausforderungen bei Oberflächenanpassung und Stoßfestigkeit

Forschungsmotivation

Nutzung der Tatsache, dass Magnitude und Richtung von Kontaktkräften die menschliche Absicht natürlicherweise kodieren, durch kurzzeitige Kontakte statt kontinuierliche Führung zur Vermittlung von Korrekturabsichten.

Kernbeiträge

  1. Optimierungsgesteuerte Kraftschätzungsmethode: Ableitung von Kontaktkräften und -positionen der menschlichen Absicht basierend auf Gelenkdrehmoment-Sensoren und Roboterdynamikmodellen, Reduzierung von Kosten und Installationskomplexität, Realisierung von Ganzkörper-Sensitivität
  2. Drehmomentbasierter Kontakterkennungsmechanismus: Einführung von Gliedmaßen-Lokalisierung zur Reduzierung des Optimierungssuchraums und Realisierung von Echtzeitschätzung
  3. Kontaktinformations-adaptive Bewegungsplaner: Ableitung menschlicher Absichten aus Kontaktinformationen und Online-Neuplanung der Roboterbewegung unter Beibehaltung der Glätte und Anpassung an menschliche Korrektionen
  4. Experimentelle Validierung: Validierung der Genauigkeit der Kraftschätzungsmethode auf einem 7-DOF-Manipulator und Wirksamkeit des adaptiven Bewegungsplaners unter Wahrnehmungsunsicherheit

Methodische Details

Aufgabendefinition

Gegeben ein n-DOF-Serienmechanismus wird durch Gelenkdrehmomentmessungen und das Roboterdynamikmodell die Kontaktkraft und -position der menschlichen Absicht geschätzt und diese Information für Online-Bewegungsplanungsanpassungen genutzt.

Modellarchitektur

1. Dynamische Modellierung

Die Roboterdynamikgleichung enthält externe Kontaktkräfte:

τ = M(q)q̈ + h(q,q̇) + τ_ext

wobei τ_ext das Gelenkdrehmoment ist, das durch externe Kontaktkräfte verursacht wird.

2. Kontakterkennung

Erkennungsstatistik basierend auf Restdrehmoment:

η(t) = ||W_τ τ̂_ext(t)||_2

Verwendung von exponentiell gewichteter gleitender Durchschnittsfilterung (EWMA) und Hysteresemechanismus zur Gewährleistung zuverlässiger Zustandsübergänge.

3. Gliedmaßen-Lokalisierung

Bestimmung der Kontaktgliedmaße durch Analyse der Restdrehmomentverteilung:

ℓ = max{j | |τ̂_ext,j| > τ_th and |τ̂_ext,j+1| < τ_th}

4. Kontaktkraftschätzung

Modellierung des Kontakts als Punktkontakt auf einer Gliedmaße, Lösung durch eingeschränkte nichtlineare Optimierung:

min_{s,F_c} (1/2)∑_{k=1}^N ||τ̂_ext(t_k) - J_c(q(t_k),s)^T F_c||^2
s.t. 0 ≤ s ≤ 1, ||F_c|| ≤ F_max_c

5. Adaptive Bewegungsplanung

Anpassung des Referenzpfads basierend auf geschätzter Kontaktkraft:

  • Berechnung der durchschnittlichen Kontaktkraft und -richtung
  • Generierung der kartesischen Abweichung: Δx_c^(r) = α sat(||F̄_c^(r)||, F_max_c) f̂^(r)
  • Verwendung von C¹-Polynom-Bump-Funktionen zur Gewährleistung der Pfadglätte
  • Kumulative Verformung zur Sicherstellung unveränderter Endziele

Technische Innovationen

  1. Ganzkörper-Sensitivität: Nutzung vorhandener Gelenkdrehmoment-Sensoren zur Kontakterkennung des gesamten Manipulators
  2. Echtzeitleistung: Reduzierung des Suchraums durch Gliedmaßen-Grobpositionierung und Realisierung von Echtzeitkraftschätzung
  3. Sanfte Anpassung: Verwendung von Bump-Funktionen zur Gewährleistung der C¹-Kontinuität von Pfadkorrektionen
  4. Absichtserkennung: Direkte Abbildung von Magnitude und Richtung der Kontaktkraft auf Bewegungskorrektionsabsichten

Experimentelle Einrichtung

Experimentelle Plattform

  • Roboter: 7-DOF Franka Research 3 Manipulator
  • Sensoren: Gelenkdrehmoment-Sensoren
  • Umgebung: Szenario der Computerdemontage-Kollaboration

Bewertungsmetriken

  • Kraftschätzungsgenauigkeit: Bewertung durch Vergleich vorhergesagter und gemessener Gelenkdrehmomente
  • Bewegungsadaptivität: Bewertung durch Hindernisvermeidungserfolgsquote und Pfadglätte
  • Reaktionszeit: Verzögerung von Kontakterkennung bis Bewegungsanpassung

Experimentelles Design

  1. Kraftschätzungsvalidierung: Roboter führt Kreisbahn aus, Mensch übt Druck, Zug und Klopfen auf verschiedene Gliedmaßen aus
  2. Einzelne Kontaktkorrektur: Szenario mit geradliniger Pfadvermeidung
  3. Mehrfache Kontaktkorrektur: Komplexe Vermeidung erfordert mehrfache menschliche Intervention

Experimentelle Ergebnisse

Hauptergebnisse

1. Kraftschätzungsgenauigkeit

  • Mittlerer absoluter Fehler: 0,665 N·m (Gelenkdrehmomentschätzung)
  • Zeitliche Konsistenz: Geschätzte Drehmomente und Messwerte zeigen konsistente Trends über alle 7 Gelenke
  • Kontakterkennung: Alle 5 Kontaktereignisse wurden zeitnah erkannt

2. Bewegungsadaptationsleistung

  • Einzelne Kontaktkorrektur: Erfolgreiche Vermeidung vertikal und horizontal angebrachter Hindernisse
  • Mehrfache Kontaktkorrektur: 4 aufeinanderfolgende Kontakte führten den Roboter erfolgreich um komplexe Hindernisse
  • Pfadglätte: Alle korrigierten Pfade behielten C¹-Kontinuität bei

Fallstudien

Experiment 1: Vermeidung vertikaler Hindernisse

  • Mensch übt horizontale Kontaktkraft in negativer x-Richtung aus
  • Roboter weicht erfolgreich seitlich aus
  • Pfad konvergiert sanft zum ursprünglichen Ziel

Experiment 2: Vermeidung horizontaler Hindernisse

  • Mensch übt Aufwärtskontaktkraft aus
  • Roboter umgeht Hindernis von oben
  • Demonstriert korrekte Interpretation von Absichten in verschiedenen Richtungen

Experiment 3: Mehrfache Korrektionen

  • 4 aufeinanderfolgende Kontakte: 2 seitlich, 1 Kraftversatz, 1 Abwärtskorrektur
  • Demonstriert Verarbeitungsfähigkeit komplexer Absichtssequenzen
  • Validiert Wirksamkeit des inkrementellen Korrekturmechanismus

Experimentelle Erkenntnisse

  1. Kraftrichtungskonsistenz: Geschätzte Kraftrichtung bleibt innerhalb eines Kontaktereignisses konsistent, was auf eine einzelne dominante Absicht hindeutet
  2. Kraftamplitudenvariationen: Kraft ist am Anfang und Ende des Kontakts gering, erreicht in der Mitte den Spitzenwert, was natürlichen Kontaktmustern entspricht
  3. Echtzeitleistung: System kann Kontakte in Echtzeit erkennen und Bewegungen anpassen und erfüllt Kollaborationsanforderungen

Verwandte Arbeiten

Hauptforschungsrichtungen

  1. Anwendung großer Sprachmodelle in HRC: Hochrangige Aufgabenplanung und semantisches Reasoning
  2. Physische Mensch-Roboter-Interaktion: Kinästhetische Führung, Impedanzregelung, gemeinsame Kontrolle
  3. Kontaktsensortechniken: Taktile Sensoren, modellbasierte Kraftschätzung
  4. Absichtserkennungsmethoden: Maschinelles Lernen, Optimierungsmethoden, probabilistische Modelle

Vorteile dieses Artikels

  1. Kosteneffizienz: Nutzung vorhandener Gelenkdrehmoment-Sensoren ohne zusätzliche taktile Sensoren
  2. Echtzeitleistung: Realisierung von Echtzeitschätzung durch hierarchische Positionierungsstrategie
  3. Ganzkörperwahrnehmung: Realisierung von Ganzkörper-Manipulator-Sensitivität im Vergleich zu endeffektorgebundenen Methoden
  4. Sanfte Anpassung: Gewährleistung der Pfadkontinuität und Vermeidung von Sprüngen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Das vorgeschlagene Framework kann Kontaktkraft und -position der menschlichen Absicht genau schätzen
  2. Die auf Kontaktinformationen basierende Bewegungsplanung ermöglicht sanfte Online-Pfadanpassungen
  3. Experimente validieren die Wirksamkeit der Methode in Kollaborations-Demontageaufgaben
  4. Im Vergleich zu kontinuierlicher kinästhetischer Führung wird die menschliche Operatorbelastung erheblich reduziert

Einschränkungen

  1. Punktkontakt-Annahme: Aktuelle Methode geht von Punktkontakt aus, möglicherweise nicht geeignet für großflächige Kontakte
  2. Parametereinstellung: Systemempfindlichkeit erfordert manuelle Anpassung, möglicherweise nicht an individuelle Unterschiede angepasst
  3. Umgebungsbeschränkungen: Hauptsächlich in strukturierten Umgebungen validiert, Adaptivität in komplexen Umgebungen nicht ausreichend getestet
  4. Dynamikmodellabhängigkeit: Methode hängt von genauem Roboterdynamikmodell ab

Zukünftige Richtungen

  1. Personalisiertes Lernen: Anpassung an individuelle Interaktionsstile durch Lernmethoden
  2. Mehrfachkontaktverarbeitung: Erweiterung auf gleichzeitige Mehrpunktkontaktszenarien
  3. Umgebungsgeneralisierung: Validierung in komplexeren und unstrukturierten Umgebungen
  4. Langzeitlernen: Iterative Parameterverbesserung durch mehrfache Versuche

Tiefgreifende Bewertung

Stärken

  1. Technische Innovation: Geschickte Kombination von Dynamikmodellierung und Optimierungsmethoden zur Realisierung kostengünstiger hochgenauer Kontaktwahrnehmung
  2. Praktischer Wert: Lösung wichtiger Probleme in praktischer HRC mit direktem Anwendungswert
  3. Systemvollständigkeit: Bildung eines vollständigen Regelkreises von Kontakterkennung bis Bewegungsplanung
  4. Ausreichende Experimente: Mehrszenarien-Validierung demonstriert Robustheit und Adaptivität der Methode

Mängel

  1. Unzureichende theoretische Analyse: Fehlende theoretische Garantien für Konvergenz und Stabilität
  2. Begrenzte Vergleichsexperimente: Unzureichende quantitative Vergleiche mit anderen fortgeschrittenen Methoden
  3. Fehlende Benutzerstudien: Mangel an subjektiven Bewertungen echter Benutzer und Langzeitnutzungsstudien
  4. Rechenkomplexität: Unzureichende Analyse des Rechenaufwands der Optimierungslösung

Auswirkungen

  1. Akademischer Beitrag: Bietet neuen technischen Weg für Absichtserkennung in HRC
  2. Industrielle Anwendung: Methode hat gute Industrialisierungsaussichten
  3. Reproduzierbarkeit: Ausreichende technische Details ermöglichen Reproduktion und Erweiterung
  4. Inspirationswert: Bietet wertvolle Ideen für verwandte Forschung

Anwendungsszenarien

  1. Kollaborative Fertigung: Montage-, Demontage-, Polieraufgaben und andere Fertigungsaufgaben mit Mensch-Roboter-Kollaboration
  2. Serviceroboter: Szenarien mit physischer Interaktion in Heim- und Medizindienstleistungen
  3. Rehabilitationstraining: Rehabilitationsroboteranwendungen, die sich an Patientenabsichten anpassen müssen
  4. Bildungsforschung: Forschungsplattform für HRC und Absichtserkennung

Literaturverzeichnis

Das Papier zitiert 38 relevante Arbeiten, die wichtige Arbeiten in mehreren verwandten Bereichen wie HRC, pHRI, Kontaktwahrnehmung und Bewegungsplanung abdecken und eine solide theoretische Grundlage für die Forschung bieten.


Gesamtbewertung: Dies ist ein hochqualitatives Papier mit wichtigen Beiträgen im Bereich der Mensch-Roboter-Kollaboration. Das von den Autoren vorgeschlagene adaptive Bewegungsplanungsframework auf Basis von Kontaktinformationen ist technisch fortschrittlich und praktisch stark, mit ausreichender experimenteller Validierung. Obwohl es Raum für Verbesserungen in theoretischer Analyse und Benutzerstudien gibt, ist es insgesamt ein wichtiger Fortschritt in diesem Bereich mit gutem akademischen und Anwendungswert.