Layout-Independent License Plate Recognition via Integrated Vision and Language Models
Shabaninia, Asadi-zeydabadi, Nezamabadi-pour
This work presents a pattern-aware framework for automatic license plate recognition (ALPR), designed to operate reliably across diverse plate layouts and challenging real-world conditions. The proposed system consists of a modern, high-precision detection network followed by a recognition stage that integrates a transformer-based vision model with an iterative language modelling mechanism. This unified recognition stage performs character identification and post-OCR refinement in a seamless process, learning the structural patterns and formatting rules specific to license plates without relying on explicit heuristic corrections or manual layout classification. Through this design, the system jointly optimizes visual and linguistic cues, enables iterative refinement to improve OCR accuracy under noise, distortion, and unconventional fonts, and achieves layout-independent recognition across multiple international datasets (IR-LPR, UFPR-ALPR, AOLP). Experimental results demonstrate superior accuracy and robustness compared to recent segmentation-free approaches, highlighting how embedding pattern analysis within the recognition stage bridges computer vision and language modelling for enhanced adaptability in intelligent transportation and surveillance applications.
본 연구는 다양한 번호판 레이아웃과 도전적인 실제 환경 조건에서 안정적으로 작동하는 패턴 인식 자동 번호판 인식(ALPR) 프레임워크를 제안한다. 본 시스템은 현대적 고정밀 검출 네트워크와 통합 트랜스포머 비전 모델 및 반복적 언어 모델링 메커니즘으로 구성된 인식 단계로 이루어진다. 이 통합 인식 단계는 원활한 프로세스에서 문자 인식과 OCR 후처리 정제를 수행하며, 명시적 휴리스틱 보정이나 수동 레이아웃 분류에 의존하지 않고 번호판 특유의 구조 패턴과 형식 규칙을 학습한다. 이러한 설계를 통해 시스템은 비전과 언어 단서를 공동으로 최적화하여 반복적 정제를 실현하고, 노이즈, 왜곡 및 비정상적 폰트 조건에서 OCR 정확도를 향상시키며, 여러 국제 데이터셋에서 레이아웃 독립적 인식을 달성한다.