2025-11-14T11:43:10.270391

Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation

Brain tumor segmentation is crucial for diagnosis and treatment planning, yet challenges such as class imbalance and limited model generalization continue to hinder progress. This work presents a reproducible evaluation of U-Net segmentation performance on brain tumor MRI using focal loss and basic data augmentation strategies. Experiments were conducted on a publicly available MRI dataset, focusing on focal loss parameter tuning and assessing the impact of three data augmentation techniques: horizontal flip, rotation, and scaling. The U-Net with focal loss achieved a precision of 90%, comparable to state-of-the-art results. By making all code and results publicly available, this study establishes a transparent, reproducible baseline to guide future research on augmentation strategies and loss function design in brain tumor segmentation.

academic

뇌종양 분할을 위한 데이터 증강 및 손실 함수의 재현 가능한 평가

기본 정보

논문 ID: 2510.08617
제목: Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation
저자: Saumya B (인도과학원)
분류: cs.CV cs.LG
발표 시간: 2025년 10월 8일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.08617

초록

뇌종양 분할은 진단 및 치료 계획에 필수적이지만, 클래스 불균형 및 제한된 모델 일반화 등의 과제가 진전을 방해하고 있습니다. 본 연구는 초점 손실(focal loss)과 기본 데이터 증강 전략을 사용하는 U-Net의 뇌종양 MRI 분할 성능에 대한 재현 가능한 평가를 수행합니다. 실험은 공개 MRI 데이터셋에서 수행되며, 초점 손실 매개변수 튜닝과 세 가지 데이터 증강 기법(수평 뒤집기, 회전, 스케일링)의 영향 평가에 중점을 둡니다. 초점 손실을 사용한 U-Net은 90%의 정확도를 달성하여 최첨단 결과와 동등합니다. 모든 코드와 결과를 공개함으로써, 본 연구는 뇌종양 분할에서 증강 전략 및 손실 함수 설계의 향후 연구를 위한 투명하고 재현 가능한 벤치마크를 수립합니다.

연구 배경 및 동기

문제 정의

뇌종양은 가장 도전적인 의료 질환 중 하나이며, 효과적인 치료 계획을 위해 종양 경계의 정확한 식별이 필요합니다. 자기공명영상(MRI)은 뇌종양 감지에 널리 사용되는 영상 방식이지만, 방사선과 의사가 종양 영역을 수동으로 표시하는 데는 다음과 같은 문제가 있습니다:

시간이 오래 걸리고 오류가 발생하기 쉬움
관찰자 간 변이성이 큼
임상 환경에서 확장하기 어려움

기술적 과제

클래스 불균형: 종양 픽셀이 배경 픽셀에 비해 희소하여 기존 손실 함수의 효과가 떨어짐
데이터 부족: 의료 영상 주석 비용이 높고 사용 가능한 훈련 데이터가 제한됨
일반화 능력: 모델이 서로 다른 스캐너 및 환자 집단 간에 일반화되는 능력이 제한됨

연구 동기

본 연구는 초점 손실 매개변수와 데이터 증강 전략을 체계적으로 평가하여 뇌종양 분할을 위한 재현 가능한 벤치마크를 수립하고, 기존 연구의 투명성 및 재현 가능성 측면의 공백을 메우는 것을 목표로 합니다.

핵심 기여

재현 가능한 벤치마크 수립: 초점 손실을 사용한 U-Net의 뇌종양 MRI 분할 벤치마크 구현 제공
체계적 매개변수 분석: 초점 손실 매개변수(α 및 γ)가 모델 성능에 미치는 영향에 대한 심층 분석
데이터 증강 전략 평가: 세 가지 서로 다른 데이터 증강 기법이 모델 성능에 미치는 효과 평가
오픈소스 기여: 모든 코드 및 실험 구성을 공개하여 연구의 투명성 및 재현 가능성 보장

방법 상세 설명

작업 정의

입력: 256×256 픽셀의 T1 가중치 대비 강화 MRI 영상
출력: 종양 영역을 식별하는 이진 분할 마스크
목표: 뇌종양 경계를 정확하게 분할하고 클래스 불균형 문제 처리

모델 아키텍처

U-Net 구조 설계

인코더: 4개의 다운샘플링 블록, 각 블록은 2개의 합성곱 계층(3×3 커널, ReLU 활성화, He 정규 초기화)으로 구성되며, 2×2 최대 풀링과 0.3의 드롭아웃이 뒤따름
병목 계층: 1024 필터의 2개 합성곱 계층으로 고수준 특징 표현 캡처
디코더: 4개의 업샘플링 블록, 전치 합성곱을 사용한 업샘플링, 공간 세부 정보 유지를 위한 스킵 연결 결합
출력 계층: 1×1 합성곱 + Sigmoid 활성화로 이진 분할 맵 생성

초점 손실 함수

초점 손실은 각 픽셀 손실의 기여도를 동적으로 조정하여 클래스 불균형을 해결합니다:

$FL(p_t) = -\alpha(1-p_t)^\gamma \log(p_t)$

여기서:

$p_t$ : 참 클래스에 대한 모델의 예측 확률
$\alpha$ : 클래스 균형 가중치 인수
$\gamma$ : 초점 매개변수로 어려운 샘플에 대한 주의도 제어
$(1-p_t)$ : 조정 인수로 오분류 샘플에 더 높은 가중치 부여

기술적 혁신 포인트

매개변수화 연구: 두 가지 초점 손실 매개변수 세트를 체계적으로 비교:
- α=0.25, γ=2.0: 어려운 샘플 및 종양 경계 강조
- α=2.0, γ=0.75: 소수 클래스에 더 집중하되 어려운 샘플에 대한 초점 감소
증강 전략 비교: 세 가지 기본 증강 기법의 효과를 독립적으로 평가하여 실제 응용에 지침 제공

실험 설정

데이터셋

출처: 남방 병원 및 천진 의과대학(2005-2010년), Jun Cheng 수집
규모: 233명 환자로부터 3064장의 T1 가중치 대비 강화 MRI 영상
종양 유형:
- 뇌막종: 708례
- 신경교종: 1426례
- 뇌하수체종: 930례
주석: 경험이 풍부한 3명의 방사선과 의사가 종양 경계를 수동으로 표시
데이터 분할: 훈련 세트 1838 샘플, 검증 세트 613 샘플, 테스트 세트 613 샘플

평가 지표

Dice 계수: 분할 겹침도 측정
IoU(교집합 대 합집합): 예측과 실제 영역의 겹침 평가
정밀도(Precision): 종양으로 예측된 픽셀 중 실제 종양인 비율
재현율(Recall): 올바르게 식별된 실제 종양 픽셀의 비율
정확도(Accuracy): 전체 픽셀 분류 정확도

비교 방법

Arafat et al. (2023): 심층 학습 기반 뇌종양 분할 방법
Gupta et al. (2021): MRI 뇌종양 분할을 위한 심층 학습 사용

구현 세부 사항

최적화기: Adam, 학습률 1×10⁻⁴
배치 크기: 8
훈련 에포크: 200 에포크
하드웨어: Google Colab TPUv2-8
프레임워크: TensorFlow

실험 결과

주요 결과

초점 손실 매개변수 튜닝 결과

매개변수 설정	정확도	손실	정밀도	재현율	IoU	Dice 계수
α=0.25, γ=2.0	0.9941	0.0082	0.9014	0.7681	0.7082	0.7867
α=2.0, γ=0.75	0.9939	0.0154	0.8778	0.7789	0.7004	0.7839

주요 발견: α=0.25, γ=2.0의 매개변수 조합이 대부분의 지표에서 더 나은 성능을 보이며, 특히 정밀도 및 손실 값에서 우수합니다.

데이터 증강 효과 평가

증강 기법	정확도	손실	정밀도	재현율	IoU	Dice 계수
증강 없음	0.9941	0.0082	0.9014	0.7681	0.7082	0.7867
수평 뒤집기	0.9942	0.0053	0.9001	0.7779	0.7152	0.8041
회전(±15°)	0.9940	0.0029	0.8774	0.7892	0.7090	0.7955
무작위 스케일링	0.9934	0.0064	0.9097	0.7106	0.6643	0.7486