A Deep State-Space Model Compression Method using Upper Bound on Output Error
Sakamoto, Sato
We study deep state-space models (Deep SSMs) that contain linear-quadratic-output (LQO) systems as internal blocks and present a compression method with a provable output error guarantee. We first derive an upper bound on the output error between two Deep SSMs and show that the bound can be expressed via the $h^2$-error norms between the layerwise LQO systems, thereby providing a theoretical justification for existing model order reduction (MOR)-based compression. Building on this bound, we formulate an optimization problem in terms of the $h^2$-error norm and develop a gradient-based MOR method. On the IMDb task from the Long Range Arena benchmark, we demonstrate that our compression method achieves strong performance. Moreover, unlike prior approaches, we reduce roughly 80% of trainable parameters without retraining, with only a 4-5% performance drop.
본 논문은 선형 이차 출력(LQO) 시스템을 내부 블록으로 포함하는 심층 상태공간 모델(Deep SSMs)을 연구하며, 증명 가능한 출력 오류 보장을 갖춘 압축 방법을 제안한다. 저자들은 먼저 두 Deep SSMs 간의 출력 오류에 대한 상한을 도출하고, 이 상한이 층간 LQO 시스템의 h² 오류 노름으로 표현될 수 있음을 증명하여 기존의 모델 차수 축소(MOR) 기반 압축 방법에 이론적 근거를 제공한다. 이 상한을 기반으로, 저자들은 h² 오류 노름을 목적함수로 최적화 문제를 수립하고 기울기 기반 MOR 방법을 개발했다. Long Range Arena 벤치마크의 IMDb 작업에서 이 압축 방법은 우수한 성능을 보이며, 기존 방법과 달리 재훈련 없이 약 80%의 훈련 가능한 매개변수를 감소시키면서 성능 저하는 4-5%에 불과하다.
Deep SSMs는 장거리 의존성과 비선형성을 효율적으로 처리할 수 있는 수열 모델로서 다양한 작업에서 Transformer와 동등한 성능을 보여주었다. 그러나 높은 성능을 위해서는 많은 매개변수가 필요하며, 특히 내장된 선형 상태공간 모델의 매개변수 규모가 크다. 실제 배포에서는 성능을 유지하면서 더 컴팩트한 모델이 필요하다.