2025-11-14T06:07:11.042630

Asynchronous Event-Inertial Odometry using a Unified Gaussian Process Regression Framework

Li, Wang, Liu et al.
Recent works have combined monocular event camera and inertial measurement unit to estimate the $SE(3)$ trajectory. However, the asynchronicity of event cameras brings a great challenge to conventional fusion algorithms. In this paper, we present an asynchronous event-inertial odometry under a unified Gaussian Process (GP) regression framework to naturally fuse asynchronous data associations and inertial measurements. A GP latent variable model is leveraged to build data-driven motion prior and acquire the analytical integration capacity. Then, asynchronous event-based feature associations and integral pseudo measurements are tightly coupled using the same GP framework. Subsequently, this fusion estimation problem is solved by underlying factor graph in a sliding-window manner. With consideration of sparsity, those historical states are marginalized orderly. A twin system is also designed for comparison, where the traditional inertial preintegration scheme is embedded in the GP-based framework to replace the GP latent variable model. Evaluations on public event-inertial datasets demonstrate the validity of both systems. Comparison experiments show competitive precision compared to the state-of-the-art synchronous scheme.
academic

비동기 이벤트-관성 주행거리 측정: 통합 가우스 과정 회귀 프레임워크

기본 정보

  • 논문 ID: 2412.03136
  • 제목: Asynchronous Event-Inertial Odometry using a Unified Gaussian Process Regression Framework
  • 저자: Xudong Li, Zhixiang Wang, Zihao Liu, Yizhai Zhang, Fan Zhang, Xiuming Yao, Panfeng Huang
  • 분류: cs.RO (로봇공학)
  • 발표 시간: 2024년 12월 4일 (arXiv 사전인쇄본)
  • 논문 링크: https://arxiv.org/abs/2412.03136

초록

본 논문은 비동기 데이터 연관성과 관성 측정을 자연스럽게 융합하기 위해 통합 가우스 과정(GP) 회귀 프레임워크를 기반으로 한 비동기 이벤트-관성 주행거리 측정 방법을 제안한다. 본 방법은 GP 잠재변수 모델을 활용하여 데이터 기반의 운동 사전정보를 구축하고 해석적 적분 능력을 획득한 후, 동일한 GP 프레임워크 내에서 비동기 이벤트 특징 연관성과 적분 의사측정을 긴밀하게 결합한다. 슬라이딩 윈도우 인수 그래프를 통해 융합 추정 문제를 해결하며, 희소성을 고려하여 과거 상태에 대한 순차적 주변화를 수행한다. 저자들은 또한 전통적인 관성 사전적분 방식을 GP 프레임워크에 내장한 대조 시스템을 설계했다. 공개 이벤트-관성 데이터셋에 대한 평가는 두 시스템의 유효성을 입증하며, 대조 실험은 최첨단 동기식 방식과 동등한 정확도를 보여준다.

연구 배경 및 동기

문제 정의

이벤트 카메라는 생물학적으로 영감을 받은 시각 센서로서 비동기 트리거 메커니즘을 가지고 있으며, 각 픽셀 수준에서 독립적으로 광도 강도 변화를 기록한다. 이러한 특수한 메커니즘은 이벤트 카메라에 전통적인 카메라 대비 다음과 같은 현저한 장점을 제공한다: 저전력, 저지연, 높은 동적 범위 및 높은 시간 분해능. 그러나 이벤트 카메라의 비동기성은 전통적인 융합 알고리즘에 거대한 도전을 야기한다.

기존 방법의 한계

  1. 프레임 기반 이산 시간 방식: 이벤트를 고정 시간 윈도우의 이벤트 프레임으로 누적하여 이벤트의 시간적 다양성을 손실하고, 운동 흐림을 초래하며 추가적인 제거 작업이 필요함
  2. 전통적인 IMU 사전적분: 이산 시간 프레임워크 내에서 적용되어 프레임 간 많은 시간 측정이 폐기되고 세밀한 운동 정보가 손실됨
  3. 계산 효율성: 기존 GP 방법은 일반적으로 전체 평활 백엔드를 사용하여 계산 비용이 높음

연구 동기

이벤트 카메라의 높은 시간 분해능 특성을 충분히 활용하기 위해, 비동기 및 높은 시간 분해능의 이벤트-관성 관측을 융합하기 위한 새로운 방법 도입이 시급하다. 본 논문은 비동기 측정 융합 방식 문제에 초점을 맞추고 통합 GP 프레임워크 기반의 해결책을 제안한다.

핵심 기여

  1. 통합 GP 프레임워크: 비동기 이벤트 특징 연관성과 관성 측정의 융합을 자연스럽게 처리할 수 있는 통합 가우스 과정 회귀 프레임워크 제안
  2. GP 잠재변수 모델: GP 회귀 프레임워크에 잠재변수 모델을 도입하여 관성 측정을 해석적으로 적분하고 암묵적으로 데이터 기반의 GP 유도
  3. 이중 시스템 설계: 두 가지 융합 방식의 대조 시스템 구현:
    • CT-IMU: 희소 GP 사전정보 + IMU 사전적분
    • GP-IMU: GP 회귀 사전적분
  4. 효율적인 슬라이딩 윈도우: 슬라이딩 윈도우 인수 그래프 최적화 채택, 주변화 전략을 통해 계산 효율성 유지
  5. 완전 비동기 처리: EKLT를 활용한 이벤트 기반 특징 검출 및 추적으로 이벤트 카메라의 높은 시간 분해능 특성 유지

방법 상세 설명

작업 정의

입력: 비동기 이벤트 스트림 및 IMU 측정 데이터 출력: SE(3) 궤적 추정 (위치, 자세 및 속도 포함) 제약: 비동기 데이터 연관성 처리, 계산 효율성 유지

모델 아키텍처

1. 희소 GP 사전정보

백색 잡음 가속도(WNOA) 운동 사전정보를 사용하여 SE(3) 모델링:

Ṫwb(t) = Twb(t)ϖbwb(t)∧
ϖ̇bwb(t) = w(t), w(t) ∼ GP(0,Qcδ(t-t'))

여기서 ϖbwb(t)는 체 좌표계 속도이고, w(t)는 영 평균 백색 잡음 GP로 모델링된 일반화된 가속도 벡터이다.

2. GP 회귀 사전적분

상대 가속도 및 회전 벡터 속도를 독립 GP로 모델링:

ṙbkb(t) ∼ GP(0,kr(t,t'))
abbk(t) ∼ GP(0,ka(t,t'))

잠재 상태 ρ̂ 및 α̂를 통해 GP의 잡음 관측을 획득한 후, GP의 추론 능력을 활용하여 사전적분 속도, 위치 및 회전 증분 계산.

3. 시스템 아키텍처

전체 시스템은 두 개의 병렬 스레드로 구성:

  • 비동기 특징 추적 프론트엔드: EKLT를 사용한 이벤트 기반 특징 검출 및 추적
  • GP 기반 슬라이딩 윈도우 백엔드: 특징 관리, 삼각측량 및 인수 그래프 최적화 처리

기술 혁신점

1. 통합 프레임워크 설계

두 방법 모두 동일한 GP 프레임워크에서 작동하지만 IMU 데이터 처리 방식이 다름:

  • CT-IMU: 연속 시간 궤적에서 상태 쿼리, IMU 측정을 별도로 융합
  • GP-IMU: IMU 측정에 의존하여 상태 추론, 궤적 사전정보 제약 감소

2. 보간 투영 인수

GP 보간을 통해 측정 시점 tτ에서의 위치 자세 Twbτ 획득, 시각 잔차 오류 정의:

rV(Twbτ, li, ẑi) = ẑi - (1/di)K(TwbτTbτcτ)T li

3. 슬라이딩 윈도우 최적화

동적 주변화 전략 채택, 최신 상태 및 관련 랜드마크 포인트를 우선적으로 주변화하여 헤시안 행렬의 희소 구조 유지.

실험 설정

데이터셋

  • DAVIS 데이터셋: DAVIS240C(240×180)를 사용하여 여러 장면에서 기록한 격렬한 운동 데이터
  • MVSEC 데이터셋: 왼쪽 이벤트 카메라(DAVIS 346B, 346×260) 데이터 사용

평가 지표

  • RMS RTE: 균제곱근 상대 궤적 오류, 정확도 평가용
  • 계산 시간: 각 모듈의 평균 시간 소비
  • 인수 그래프 규모: 최적화 문제의 복잡도 지표

대조 방법

  • Vidal et al. 3 (E+I 구성)
  • Guan & Lu 4의 이벤트-관성 방법
  • 제안된 두 방법의 내부 대조

구현 세부사항

  • 시차 조건: 8픽셀
  • 최소 특징 궤적: 4개
  • GP-IMU 잠재 상태 수: 400개
  • 슬라이딩 윈도우 최소 크기: 40
  • 상태 간 시간 간격: 0.05초

실험 결과

주요 결과

수열CT-IMUGP-IMURef.4Ref.3
dynamic translation0.0300.0600.0560.037
dynamic 6dof0.0760.0560.0730.040
poster translation0.0870.0820.2420.087
poster 6dof0.1560.0840.2100.197
boxes 6dof0.3470.1510.0730.078
shapes 6dof0.1080.244---0.163

성능 분석

  1. 정확도 성능: 두 방법 모두 대부분의 수열에서 이산 최적화 방법과 동등한 정확도를 보이며, 일부 수열에서는 더 우수한 성능 발휘
  2. 계산 효율성: GP-IMU는 변수가 적어 일반적으로 더 낮은 계산 비용 보유
  3. 견고성: GP-IMU는 IMU 잡음에 더 민감함. IMU 기반 GP 구축에 의존하기 때문에 시각 잔차에 영향

시간 소비 분석

방법프론트엔드최적화주변화IMU 사전적분기타
CT-IMU(s)1273.97247.8343.9510.1770.743
GP-IMU(s)1274.51182.0544.9144.7130.693

EKLT 추적기는 총 시간의 약 80%를 차지하며, 가장 시간이 많이 소요되는 부분이다. GP-IMU는 그래프 최적화 측면에서 더 빠르지만 IMU 사전적분은 약간 느리다.

관련 연구

이벤트-관성 주행거리 측정 분류

  1. 프레임 기반 이산 시간 방식: 전통적인 프레임 카메라 알고리즘을 상속하여 이벤트 누적에 대한 데이터 연관성 수행
  2. 이벤트 기반 연속 시간 방법: 이벤트 스트림을 직접 처리하여 연속 시간 백엔드 채택

로봇공학에서의 가우스 과정 응용

GP 연속 시간 표현 방법은 초기에 스캔 라이더 및 비동기 센서의 운동 궤적 추론에 사용되었다. 최근 연구는 GP를 단안 이벤트 시각 주행거리 측정 시스템에 적용했지만 높은 계산 비용 문제가 존재한다.

결론 및 논의

주요 결론

  1. 제안된 두 가지 GP 방법 모두 비동기 이벤트-관성 융합 문제를 효과적으로 처리 가능
  2. GP-IMU는 대부분의 수열에서 더 높은 정확도를 보이지만 IMU 잡음에 더 민감함
  3. 슬라이딩 윈도우 전략은 계산 복잡도를 효과적으로 제어
  4. 방법은 복잡한 운동 장면에서 경쟁력 있는 성능 발휘

한계

  1. 실시간성 문제: 모든 프론트엔드 비동기 측정을 최적화를 위해 보유하기 때문에 현재 시스템은 실시간 실행 불가
  2. 견고성 부족: 이상치 제거 또는 운동 보상 메커니즘 부재
  3. IMU 품질 의존성: GP-IMU 방법은 IMU 데이터 품질에 높은 요구사항
  4. 격렬한 운동 제한: 급격한 가속도 변화 시 두 방법 모두 영향을 받을 수 있음

향후 방향

  1. 정보 이론 기반의 그래프 희소화 전략으로 실시간 성능 달성
  2. 프론트엔드 개선으로 시스템 견고성 향상
  3. 저품질 IMU에 대한 알고리즘 최적화
  4. 더 복잡한 운동 패턴으로 확장

심층 평가

장점

  1. 이론적 혁신: 통합 GP 프레임워크는 비동기 융합 문제를 교묘하게 해결하며 이론적 기초가 견고함
  2. 체계적 연구: 이중 시스템 설계를 통해 포괄적인 대조 분석 제공
  3. 충분한 실험: 여러 공개 데이터셋에서 상세한 평가 수행
  4. 공학적 구현: GTSAM 기반 구현으로 방법의 재현성 보장

부족점

  1. 실시간성 제한: 현재 실시간 응용 요구사항 충족 불가, 실용 가치 제한
  2. 프론트엔드 의존성: EKLT 프론트엔드에 과도하게 의존하며 이상 상황 처리 부족
  3. 적용 범위: IMU 품질 및 운동 유형에 일정한 제한
  4. 이론적 분석 부족: 두 방법의 이론적 차이에 대한 심층 분석 부족

영향력

  1. 학술적 가치: 이벤트 카메라 및 관성 융합에 새로운 이론적 프레임워크 제공
  2. 실용적 잠재력: 실시간성 문제 해결 후 로봇 항법 등 분야에서 응용 가능
  3. 확장성: 프레임워크는 우수한 확장성을 가지며 다른 센서 융합 시나리오에 적응 가능

적용 장면

  1. 고동적 환경: 전통 카메라가 처리하기 어려운 고속 운동 장면에 적합
  2. 충분한 계산 자원: 정확도 요구사항이 높고 계산 자원이 상대적으로 충분한 응용에 적합
  3. 연구 플랫폼: 이벤트 카메라 연구를 위한 가치 있는 기준 방법 제공

참고문헌

본 논문은 26편의 관련 문헌을 인용하며, 이벤트 카메라 개요, IMU 사전적분, 연속 시간 추정, 가우스 과정 회귀 등 핵심 분야의 중요한 연구를 포괄하고 있으며, 문헌 인용이 포괄적이고 권위 있다.


종합 평가: 본 논문은 이벤트-관성 주행거리 측정 분야에서 혁신적인 연구로, 제안된 통합 GP 프레임워크는 비동기 센서 융합 처리에 새로운 사고방식을 제공한다. 실시간성 등의 한계가 있지만 이론적 기여가 현저하고 실험 평가가 충분하여 해당 분야의 후속 연구를 위한 견고한 기초를 마련했다.