Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion
Zhang, Cheng
Thanks to the recent achievements in task-driven image quality enhancement (IQE) models like ESTR, the image enhancement model and the visual recognition model can mutually enhance each other's quantitation while producing high-quality processed images that are perceivable by our human vision systems. However, existing task-driven IQE models tend to overlook an underlying fact -- different levels of vision tasks have varying and sometimes conflicting requirements of image features. To address this problem, this paper proposes a generalized gradient promotion (GradProm) training strategy for task-driven IQE of medical images. Specifically, we partition a task-driven IQE system into two sub-models, i.e., a mainstream model for image enhancement and an auxiliary model for visual recognition. During training, GradProm updates only parameters of the image enhancement model using gradients of the visual recognition model and the image enhancement model, but only when gradients of these two sub-models are aligned in the same direction, which is measured by their cosine similarity. In case gradients of these two sub-models are not in the same direction, GradProm only uses the gradient of the image enhancement model to update its parameters. Theoretically, we have proved that the optimization direction of the image enhancement model will not be biased by the auxiliary visual recognition model under the implementation of GradProm. Empirically, extensive experimental results on four public yet challenging medical image datasets demonstrated the superior performance of GradProm over existing state-of-the-art methods.
본 논문은 작업 기반 의료 영상 품질 향상 문제를 다루기 위해 일반화된 그래디언트 촉진(GradProm) 훈련 전략을 제안합니다. 기존의 작업 기반 영상 품질 향상 모델(예: ESTR)이 영상 향상 모델과 시각 인식 모델 간의 상호 촉진을 달성할 수 있지만, 서로 다른 수준의 시각 작업이 영상 특징에 대해 서로 다르고 때로는 상충하는 요구사항을 가진다는 중요한 사실을 간과합니다. 이 문제를 해결하기 위해 본 논문은 작업 기반 IQE 시스템을 주요 영상 향상 모델과 보조 시각 인식 모델의 두 개 부분 모델로 나눕니다. GradProm은 두 부분 모델의 그래디언트 방향이 일치할 때만 두 그래디언트를 사용하여 영상 향상 모델 매개변수를 업데이트하고, 그렇지 않으면 영상 향상 모델 자체의 그래디언트만 사용합니다. 이론적으로 본 방법이 영상 향상 모델의 최적화 방향이 보조 시각 인식 모델에 의해 편향되지 않음을 보장할 수 있음을 증명했으며, 실험 결과는 네 개의 공개 의료 영상 데이터셋에서 그 우수성을 검증합니다.
그림 2에서 보는 바와 같이, 동일한 입력 영상 하에서 노이즈 제거 작업은 영상의 모든 영역에 집중하고, 의미론적 분할 작업은 전경 객체 영역에 집중하며, 진단 작업은 전경 객체의 판별적 국소 영역에 집중합니다. 이러한 특징 요구사항의 불일치는 업스트림 영상 향상 모델과 다운스트림 시각 인식 모델 간의 잠재적 충돌을 초래하여 성능에 영향을 미칩니다.