2025-11-14T11:43:10.270391

Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation

Brain tumor segmentation is crucial for diagnosis and treatment planning, yet challenges such as class imbalance and limited model generalization continue to hinder progress. This work presents a reproducible evaluation of U-Net segmentation performance on brain tumor MRI using focal loss and basic data augmentation strategies. Experiments were conducted on a publicly available MRI dataset, focusing on focal loss parameter tuning and assessing the impact of three data augmentation techniques: horizontal flip, rotation, and scaling. The U-Net with focal loss achieved a precision of 90%, comparable to state-of-the-art results. By making all code and results publicly available, this study establishes a transparent, reproducible baseline to guide future research on augmentation strategies and loss function design in brain tumor segmentation.

academic

Воспроизводимая оценка методов увеличения данных и функций потерь для сегментации опухолей мозга

Основная информация

ID статьи: 2510.08617
Название: Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation
Автор: Saumya B (Индийский институт науки)
Классификация: cs.CV cs.LG
Дата публикации: 8 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.08617

Аннотация

Сегментация опухолей мозга имеет решающее значение для диагностики и планирования лечения, однако прогресс затрудняют такие проблемы, как дисбаланс классов и ограниченная обобщающая способность модели. В данном исследовании проводится воспроизводимая оценка производительности U-Net с использованием фокусной функции потерь и базовых стратегий увеличения данных при сегментации опухолей мозга на МРТ. Эксперименты проводились на открытом наборе данных МРТ с акцентом на настройку параметров фокусной функции потерь и оценку влияния трёх методов увеличения данных: горизонтального отражения, поворота и масштабирования. U-Net с использованием фокусной функции потерь достиг точности 90%, что сопоставимо с передовыми результатами. Путём открытия всего кода и результатов данное исследование устанавливает прозрачный и воспроизводимый эталон, обеспечивающий руководство для будущих исследований в области стратегий увеличения данных и проектирования функций потерь при сегментации опухолей мозга.

Предпосылки и мотивация исследования

Определение проблемы

Опухоли мозга являются одним из наиболее сложных заболеваний, требующих точного определения границ опухоли для эффективного планирования лечения. Магнитно-резонансная томография (МРТ) — широко используемый метод визуализации для выявления опухолей мозга, однако ручное описание областей опухоли радиологами сопряжено со следующими проблемами:

Трудозатратность и подверженность ошибкам
Высокая вариабельность между наблюдателями
Сложность масштабирования в клинической среде

Технические вызовы

Дисбаланс классов: пиксели опухоли редки по сравнению с фоновыми пикселями, что приводит к неэффективности традиционных функций потерь
Дефицит данных: высокая стоимость аннотирования медицинских изображений ограничивает объём доступных обучающих данных
Обобщающая способность: ограниченная способность модели к обобщению между различными сканерами и популяциями пациентов

Мотивация исследования

Данное исследование направлено на заполнение пробела в прозрачности и воспроизводимости существующих исследований путём систематической оценки параметров фокусной функции потерь и стратегий увеличения данных, установления воспроизводимого эталона для сегментации опухолей мозга.

Основные вклады

Установление воспроизводимого эталона: предоставлена эталонная реализация U-Net с фокусной функцией потерь для сегментации опухолей мозга на МРТ
Систематический анализ параметров: глубокий анализ влияния параметров фокусной функции потерь (α и γ) на производительность модели
Оценка стратегий увеличения данных: оценка эффективности трёх различных методов увеличения данных на производительность модели
Вклад в открытый исходный код: открытие всего кода и конфигураций экспериментов для обеспечения прозрачности и воспроизводимости исследования

Подробное описание методов

Определение задачи

Входные данные: Т1-взвешенные контрастные МРТ-изображения размером 256×256 пикселей
Выходные данные: Бинарная маска сегментации, определяющая область опухоли
Цель: Точная сегментация границ опухоли мозга с обработкой дисбаланса классов

Архитектура модели

Конструкция U-Net

Кодировщик: четыре блока понижающей дискретизации, каждый содержит два сверточных слоя (ядро 3×3, активация ReLU, инициализация He), за которыми следуют максимальное объединение 2×2 и отсев 0,3
Узкое место: два сверточных слоя с 1024 фильтрами для захвата высокоуровневого представления признаков
Декодировщик: четыре блока повышающей дискретизации с использованием транспонированной свёртки для повышающей дискретизации, объединённые с пропускающими соединениями для сохранения пространственных деталей
Выходной слой: свёртка 1×1 + активация Sigmoid для создания бинарной карты сегментации

Функция фокусной потери

Фокусная потеря решает проблему дисбаланса классов путём динамической регулировки вклада потерь каждого пикселя:

$FL(p_t) = -\alpha(1-p_t)^\gamma \log(p_t)$

где:

$p_t$ : вероятность предсказания моделью истинного класса
$\alpha$ : весовой коэффициент балансировки классов
$\gamma$ : параметр фокусировки, контролирующий внимание к сложным образцам
$(1-p_t)$ : модулирующий коэффициент, придающий более высокий вес неправильно классифицированным образцам

Технические инновации

Параметризованное исследование: систематическое сравнение двух наборов параметров фокусной функции потерь:
- α=0,25, γ=2,0: акцент на сложные образцы и границы опухоли
- α=2,0, γ=0,75: больше внимания к меньшинству, но меньше фокусировки на сложных образцах
Сравнение стратегий увеличения: независимая оценка эффективности трёх базовых методов увеличения для практического применения

Экспериментальная установка

Набор данных

Источник: Южная больница и Тяньцзиньский медицинский университет (2005-2010 гг.), собрано Jun Cheng
Объём: 3064 Т1-взвешенных контрастных МРТ-изображения от 233 пациентов
Типы опухолей:
- Менингиома: 708 случаев
- Глиома: 1426 случаев
- Аденома гипофиза: 930 случаев
Аннотирование: ручное описание границ опухоли тремя опытными радиологами
Разделение данных: обучающий набор 1838 образцов, валидационный набор 613 образцов, тестовый набор 613 образцов

Метрики оценки

Коэффициент Dice: измерение степени перекрытия сегментации
IoU (пересечение над объединением): оценка перекрытия предсказанной и истинной областей
Точность (Precision): доля пикселей, предсказанных как опухоль, которые действительно являются опухолью
Полнота (Recall): доля истинных пикселей опухоли, правильно идентифицированных
Аккуратность (Accuracy): общая точность классификации пикселей

Методы сравнения

Arafat et al. (2023): метод сегментации опухолей мозга на основе глубокого обучения
Gupta et al. (2021): сегментация опухолей мозга МРТ с использованием глубокого обучения

Детали реализации

Оптимизатор: Adam, скорость обучения 1×10⁻⁴
Размер пакета: 8
Количество эпох: 200
Оборудование: Google Colab TPUv2-8
Фреймворк: TensorFlow

Результаты экспериментов

Основные результаты

Результаты настройки параметров фокусной функции потерь

Параметры	Аккуратность	Потеря	Точность	Полнота	IoU	Коэффициент Dice
α=0,25, γ=2,0	0,9941	0,0082	0,9014	0,7681	0,7082	0,7867
α=2,0, γ=0,75	0,9939	0,0154	0,8778	0,7789	0,7004	0,7839

Ключевые выводы: комбинация параметров α=0,25, γ=2,0 показывает лучшую производительность по большинству метрик, особенно по точности и значению потерь.

Оценка эффективности увеличения данных

Метод увеличения	Аккуратность	Потеря	Точность	Полнота	IoU	Коэффициент Dice
Без увеличения	0,9941	0,0082	0,9014	0,7681	0,7082	0,7867
Горизонтальное отражение	0,9942	0,0053	0,9001	0,7779	0,7152	0,8041
Поворот (±15°)	0,9940	0,0029	0,8774	0,7892	0,7090	0,7955
Случайное масштабирование	0,9934	0,0064	0,9097	0,7106	0,6643	0,7486

Абляционные эксперименты

Горизонтальное отражение: улучшение по всем метрикам, наиболее значительное увеличение коэффициента Dice (+0,0174)
Поворот: повышение полноты и коэффициента Dice, демонстрирующее хорошую обобщающую способность
Масштабирование: наихудший результат, даже ниже базовой модели по некоторым метрикам

Анализ кривых обучения

Горизонтальное отражение и поворот: более стабильные кривые валидации с меньшим разрывом между производительностью обучения и валидации
Масштабирование: большие колебания потерь валидации, слабая обобщающая способность
Без увеличения: гладкие кривые, но лёгкое переобучение

Сравнение с передовыми методами

Модель	Точность	Полнота	IoU	Коэффициент Dice
Данное исследование	0,9001	0,7779	0,7152	0,8041
Arafat et al.	0,82	0,74	0,68	0,94
Gupta et al.	0,89	0,91	-	0,90

Примечание: хотя данное исследование демонстрирует превосходную точность, коэффициент Dice немного ниже некоторых методов сравнения.

Связанные работы

Традиционные методы

Пороговая сегментация: метод Otsu на основе гистограммы яркости
Обнаружение границ: модели активных контуров
Рост региона: расширение региона на основе точки-семени
Ограничения: чувствительность к шуму, слабая обобщающая способность

Методы глубокого обучения

Архитектуры CNN: автоматическое изучение иерархических признаков, превосходящее методы с ручными признаками
U-Net: структура кодировщик-декодировщик с пропускающими соединениями, ставшая золотым стандартом биомедицинской сегментации
Эволюция функций потерь: от бинарной кросс-энтропии к потере Dice и фокусной потере

Стратегии увеличения данных

Геометрические преобразования: отражение, поворот, масштабирование
Эластичные деформации: моделирование деформации тканей
Возмущения интенсивности: моделирование различных условий сканирования

Выводы и обсуждение

Основные выводы

Выбор параметров фокусной функции потерь имеет решающее значение: комбинация α=0,25, γ=2,0 более эффективна при обработке дисбаланса классов
Простые стратегии увеличения эффективны: горизонтальное отражение — наиболее эффективный метод увеличения, поворот — второй по эффективности
Ограниченная эффективность масштабирования: изменение размера вносит небольшой вклад в повышение производительности на данном наборе данных
Важность воспроизводимости: установлен прозрачный экспериментальный эталон

Ограничения

Единственный набор данных: валидация только на одном наборе данных, обобщающая способность требует проверки
Базовые стратегии увеличения: не исследованы более продвинутые методы, такие как эластичные деформации
Фиксированная архитектура: использован только стандартный U-Net, отсутствует сравнение с другими передовыми архитектурами
Метрики оценки: основной акцент на пиксельных метриках, отсутствует оценка клинической релевантности

Направления будущих исследований

Продвинутые стратегии увеличения: эластичные деформации, модально-специфичные преобразования
Генеративное увеличение данных: синтез обучающих данных с использованием GAN
Многозадачное обучение: объединение сегментации и классификации типа опухоли
Кросс-датасетная валидация: проверка обобщающей способности метода на нескольких наборах данных

Глубокая оценка

Преимущества

Высокая прозрачность исследования: предоставлен полный код и конфигурации экспериментов, обеспечена воспроизводимость
Сильная систематичность: поэтапный дизайн экспериментов, сначала оптимизация параметров функции потерь, затем оценка стратегий увеличения
Практическая ценность: предоставлены чёткие рекомендации по выбору параметров и стратегиям увеличения для практического применения
Установление эталона: предоставлен стандартизированный эталон оценки для данной области

Недостатки

Ограниченная новизна: в основном комбинация и оценка существующих методов, отсутствуют технические инновации
Недостаточная глубина экспериментов: отсутствует глубокий анализ механизмов действия различных стратегий увеличения
Ограничения набора данных: единственный набор данных может привести к ограниченности выводов
Недостаточное сравнение: ограниченное сравнение с передовыми методами, отсутствуют тесты статистической значимости

Влияние

Научный вклад: предоставлен надёжный эталон и справочная точка для исследований сегментации опухолей мозга
Практическая ценность: предоставлено практическое техническое решение для клинического применения
Воспроизводимость: способствует повышению прозрачности и воспроизводимости исследований в данной области
Образовательная ценность: предоставлен полный справочник реализации для начинающих

Применимые сценарии

Клиническая диагностическая поддержка: может служить вспомогательным инструментом для радиологов
Исследовательский эталон: предоставляет эталон сравнения для новых методов
Применение в обучении: практический случай для курсов обработки медицинских изображений
Разработка продуктов: технологическая основа для медицинских AI-продуктов

Библиография

Ronneberger et al. (2015) — оригинальная статья U-Net
Lin et al. (2017) — статья о введении фокусной функции потерь
Cheng et al. (2015) — статья об источнике набора данных
Nalepa et al. (2019) — обзор увеличения данных при сегментации опухолей мозга

Общая оценка: это добротная эмпирическая исследовательская статья, которая, хотя и имеет ограниченные технические инновации, обладает значительной ценностью в установлении воспроизводимого эталона и систематической оценке. Прозрачность и полнота статьи заслуживают похвалы и закладывают хорошую основу для дальнейшего развития данной области.