2025-11-14T11:43:10.270391

Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation

Brain tumor segmentation is crucial for diagnosis and treatment planning, yet challenges such as class imbalance and limited model generalization continue to hinder progress. This work presents a reproducible evaluation of U-Net segmentation performance on brain tumor MRI using focal loss and basic data augmentation strategies. Experiments were conducted on a publicly available MRI dataset, focusing on focal loss parameter tuning and assessing the impact of three data augmentation techniques: horizontal flip, rotation, and scaling. The U-Net with focal loss achieved a precision of 90%, comparable to state-of-the-art results. By making all code and results publicly available, this study establishes a transparent, reproducible baseline to guide future research on augmentation strategies and loss function design in brain tumor segmentation.

academic

Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation

基本信息

论文ID: 2510.08617
标题: Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation
作者: Saumya B (印度科学学院)
分类: cs.CV cs.LG
发表时间: 2025年10月8日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2510.08617

耗时且容易出错
观察者间变异性大
在临床环境中难以规模化

技术挑战

类别不平衡：肿瘤像素相对于背景像素稀少，导致传统损失函数效果不佳
数据稀缺性：医学图像标注成本高，可用训练数据有限
泛化能力：模型在不同扫描仪和患者群体间的泛化能力有限

研究动机

该研究旨在通过系统性评估焦点损失参数和数据增强策略，为脑肿瘤分割建立一个可复现的基准，填补现有研究在透明度和可复现性方面的空白。

核心贡献

建立可复现基准：提供了使用焦点损失的U-Net在脑肿瘤MRI分割上的基准实现
系统性参数分析：深入分析了焦点损失参数(α和γ)对模型性能的影响
数据增强策略评估：评估了三种不同数据增强技术对模型性能的效果
开源贡献：公开所有代码和实验配置，确保研究的透明度和可复现性

编码器：四个下采样块，每块包含两个卷积层(3×3核，ReLU激活，He正态初始化)，followed by 2×2最大池化和0.3的dropout
瓶颈层：两个1024滤波器的卷积层，捕获高级特征表示
解码器：四个上采样块，使用转置卷积上采样，结合跳跃连接保持空间细节
输出层：1×1卷积 + Sigmoid激活，生成二值分割图

焦点损失函数

焦点损失通过动态调整每个像素损失的贡献来解决类别不平衡：

$FL(p_t) = -\alpha(1-p_t)^\gamma \log(p_t)$

其中：

$p_t$ ：模型对真实类别的预测概率
$\alpha$ ：类别平衡权重因子
$\gamma$ ：聚焦参数，控制对困难样本的关注度
$(1-p_t)$ ：调制因子，给误分类样本更高权重

技术创新点

参数化研究：系统性比较了两组焦点损失参数：
- α=0.25, γ=2.0：强调困难样本和肿瘤边界
- α=2.0, γ=0.75：更关注少数类但减少对困难样本的聚焦
增强策略对比：独立评估三种基础增强技术的效果，为实际应用提供指导

实验设置

数据集

来源：南方医院和天津医科大学(2005-2010年)，由Jun Cheng收集
规模：3064张T1加权对比增强MRI图像，来自233名患者
肿瘤类型：
- 脑膜瘤：708例
- 胶质瘤：1426例
- 垂体瘤：930例
标注：三名经验丰富的放射科医师手动描绘肿瘤边界
数据划分：训练集1838样本，验证集613样本，测试集613样本

评价指标

Dice系数：衡量分割重叠度
IoU(交并比)：评估预测与真实区域的重叠
精确度(Precision)：预测为肿瘤的像素中真正是肿瘤的比例
召回率(Recall)：真实肿瘤像素被正确识别的比例
准确度(Accuracy)：整体像素分类准确率

对比方法

Arafat et al. (2023)：基于深度学习的脑肿瘤分割方法
Gupta et al. (2021)：使用深度学习进行MRI脑肿瘤分割

实现细节

优化器：Adam，学习率1×10⁻⁴
批大小：8
训练轮数：200 epochs
硬件：Google Colab TPUv2-8
框架：TensorFlow

参数设置	准确度	损失	精确度	召回率	IoU	Dice系数
α=0.25, γ=2.0	0.9941	0.0082	0.9014	0.7681	0.7082	0.7867
α=2.0, γ=0.75	0.9939	0.0154	0.8778	0.7789	0.7004	0.7839

关键发现：α=0.25, γ=2.0的参数组合在大多数指标上表现更好，特别是在精确度和损失值方面。

数据增强效果评估

增强技术	准确度	损失	精确度	召回率	IoU	Dice系数
无增强	0.9941	0.0082	0.9014	0.7681	0.7082	0.7867
水平翻转	0.9942	0.0053	0.9001	0.7779	0.7152	0.8041
旋转(±15°)	0.9940	0.0029	0.8774	0.7892	0.7090	0.7955
随机缩放	0.9934	0.0064	0.9097	0.7106	0.6643	0.7486