Enhancing Zero-Shot Anomaly Detection: CLIP-SAM Collaboration with Cascaded Prompts
Hou, Xu, Li et al.
Recently, the powerful generalization ability exhibited by foundation models has brought forth new solutions for zero-shot anomaly segmentation tasks. However, guiding these foundation models correctly to address downstream tasks remains a challenge. This paper proposes a novel two-stage framework, for zero-shot anomaly segmentation tasks in industrial anomaly detection. This framework excellently leverages the powerful anomaly localization capability of CLIP and the boundary perception ability of SAM.(1) To mitigate SAM's inclination towards object segmentation, we propose the Co-Feature Point Prompt Generation (PPG) module. This module collaboratively utilizes CLIP and SAM to generate positive and negative point prompts, guiding SAM to focus on segmenting anomalous regions rather than the entire object. (2) To further optimize SAM's segmentation results and mitigate rough boundaries and isolated noise, we introduce the Cascaded Prompts for SAM (CPS) module. This module employs hybrid prompts cascaded with a lightweight decoder of SAM, achieving precise segmentation of anomalous regions. Across multiple datasets, consistent experimental validation demonstrates that our approach achieves state-of-the-art zero-shot anomaly segmentation results. Particularly noteworthy is our performance on the Visa dataset, where we outperform the state-of-the-art methods by 10.3\% and 7.7\% in terms of {$F_1$-max} and AP metrics, respectively.
본 논문은 산업 이상 탐지에서 제로샷 이상 분할 작업을 위한 새로운 2단계 프레임워크를 제안한다. 이 프레임워크는 CLIP의 강력한 이상 위치 파악 능력과 SAM의 경계 인식 능력을 충분히 활용한다. Co-Feature Point Prompt Generation (PPG) 모듈과 Cascaded Prompts for SAM (CPS) 모듈을 통해, 본 방법은 여러 데이터셋에서 최첨단 제로샷 이상 분할 결과를 달성했으며, 특히 VisA 데이터셋에서 F1-max와 AP 지표가 기존 최고 방법 대비 각각 10.3%와 7.7% 향상되었다.
논문은 기초 모델, 이상 탐지, 컴퓨터 비전 등 다양한 분야의 중요 연구를 포함한 40편의 관련 문헌을 인용하고 있으며, 문헌 검토가 비교적 포괄적이다.
종합 평가: 본 논문이 제안한 CLIP-SAM 협업 프레임워크는 기술적으로 혁신성을 가지고 있으며 실험 결과가 인상적이다. 계산 효율성과 일부 지표에서 개선 여지가 있지만, 전반적으로 제로샷 이상 탐지 분야에 중요한 기여를 하였으며 높은 학술적 가치와 실용적 가치를 가진다.