NeuroRVQ: Multi-Scale EEG Tokenization for Generative Large Brainwave Models
Barmpas, Lee, Koliousis et al.
Electroencephalography (EEG) captures neural activity across multiple temporal and spectral scales, yielding signals that are rich but complex for representation learning. Recently, EEG foundation models trained to predict masked signal-tokens have shown promise for learning generalizable representations. However, their performance is hindered by their signal tokenization modules. Existing neural tokenizers fail to preserve high-frequency dynamics, limiting their ability to reconstruct EEG signals with high fidelity. We introduce NeuroRVQ, a scalable Large Brainwave Model (LBM) centered on a codebook-based tokenizer. Our tokenizer integrates: (i) multi-scale feature extraction modules that capture the full frequency neural spectrum; (ii) hierarchical residual vector quantization (RVQ) codebooks for high-resolution encoding; and, (iii) an EEG signal phase- and amplitude-aware loss function for efficient training. This design enables efficient EEG compression while supporting accurate reconstruction across all frequency bands, leading to robust generative masked modeling. Our empirical results demonstrate that NeuroRVQ achieves lower reconstruction error and outperforms existing LBMs on a variety of downstream tasks. More broadly, NeuroRVQ tokenizer establishes a strong prior for codebook-based general-purpose brainwave models, enabling advances in neural decoding, generative modeling and multimodal biosignal integration.
뇌전도(EEG) 신호는 여러 시간 및 주파수 스케일에서 신경 활동을 포착하여 풍부하지만 복잡한 신호를 생성하며, 이는 표현 학습에 어려움을 야기합니다. 최근 마스크된 신호 토큰 예측을 통해 훈련된 EEG 기초 모델은 일반화 가능한 표현 학습에서 유망함을 보였으나, 그 성능은 신호 토큰화 모듈에 의해 제한됩니다. 기존 신경 토큰화기는 고주파 동역학을 보존하지 못하여 EEG 신호의 고충실도 재구성 능력을 제한합니다. 본 논문은 코드북 기반 토큰화기를 중심으로 하는 확장 가능한 대규모 뇌파 모델(LBM)인 NeuroRVQ를 제시합니다. 이 토큰화기는 다음을 통합합니다: (i) 완전한 주파수 신경 스펙트럼을 포착하는 다중 스케일 특징 추출 모듈; (ii) 고해상도 인코딩을 위한 계층적 잔차 벡터 양자화(RVQ) 코드북; (iii) 효율적인 훈련을 위한 EEG 신호 위상 및 진폭 인식 손실 함수.
뇌-컴퓨터 인터페이스(BCI) 시스템은 EEG 장치로 기록된 뇌파를 분석하여 뇌와 외부 세계 간의 직접 통신을 구현합니다. EEG 신호는 수면과 감정에서 운동에 이르기까지 인간 경험의 완전한 스펙트럼을 나타낼 수 있습니다. 그러나 기존 대규모 뇌파 모델(LBM)은 근본적인 병목—신호 토큰화—에 직면해 있습니다.