Brain tumor segmentation is crucial for diagnosis and treatment planning, yet challenges such as class imbalance and limited model generalization continue to hinder progress. This work presents a reproducible evaluation of U-Net segmentation performance on brain tumor MRI using focal loss and basic data augmentation strategies. Experiments were conducted on a publicly available MRI dataset, focusing on focal loss parameter tuning and assessing the impact of three data augmentation techniques: horizontal flip, rotation, and scaling. The U-Net with focal loss achieved a precision of 90%, comparable to state-of-the-art results. By making all code and results publicly available, this study establishes a transparent, reproducible baseline to guide future research on augmentation strategies and loss function design in brain tumor segmentation.
- ID статьи: 2510.08617
- Название: Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation
- Автор: Saumya B (Индийский институт науки)
- Классификация: cs.CV cs.LG
- Дата публикации: 8 октября 2025 г. (препринт arXiv)
- Ссылка на статью: https://arxiv.org/abs/2510.08617
Сегментация опухолей мозга имеет решающее значение для диагностики и планирования лечения, однако прогресс затрудняют такие проблемы, как дисбаланс классов и ограниченная обобщающая способность модели. В данном исследовании проводится воспроизводимая оценка производительности U-Net с использованием фокусной функции потерь и базовых стратегий увеличения данных при сегментации опухолей мозга на МРТ. Эксперименты проводились на открытом наборе данных МРТ с акцентом на настройку параметров фокусной функции потерь и оценку влияния трёх методов увеличения данных: горизонтального отражения, поворота и масштабирования. U-Net с использованием фокусной функции потерь достиг точности 90%, что сопоставимо с передовыми результатами. Путём открытия всего кода и результатов данное исследование устанавливает прозрачный и воспроизводимый эталон, обеспечивающий руководство для будущих исследований в области стратегий увеличения данных и проектирования функций потерь при сегментации опухолей мозга.
Опухоли мозга являются одним из наиболее сложных заболеваний, требующих точного определения границ опухоли для эффективного планирования лечения. Магнитно-резонансная томография (МРТ) — широко используемый метод визуализации для выявления опухолей мозга, однако ручное описание областей опухоли радиологами сопряжено со следующими проблемами:
- Трудозатратность и подверженность ошибкам
- Высокая вариабельность между наблюдателями
- Сложность масштабирования в клинической среде
- Дисбаланс классов: пиксели опухоли редки по сравнению с фоновыми пикселями, что приводит к неэффективности традиционных функций потерь
- Дефицит данных: высокая стоимость аннотирования медицинских изображений ограничивает объём доступных обучающих данных
- Обобщающая способность: ограниченная способность модели к обобщению между различными сканерами и популяциями пациентов
Данное исследование направлено на заполнение пробела в прозрачности и воспроизводимости существующих исследований путём систематической оценки параметров фокусной функции потерь и стратегий увеличения данных, установления воспроизводимого эталона для сегментации опухолей мозга.
- Установление воспроизводимого эталона: предоставлена эталонная реализация U-Net с фокусной функцией потерь для сегментации опухолей мозга на МРТ
- Систематический анализ параметров: глубокий анализ влияния параметров фокусной функции потерь (α и γ) на производительность модели
- Оценка стратегий увеличения данных: оценка эффективности трёх различных методов увеличения данных на производительность модели
- Вклад в открытый исходный код: открытие всего кода и конфигураций экспериментов для обеспечения прозрачности и воспроизводимости исследования
Входные данные: Т1-взвешенные контрастные МРТ-изображения размером 256×256 пикселей
Выходные данные: Бинарная маска сегментации, определяющая область опухоли
Цель: Точная сегментация границ опухоли мозга с обработкой дисбаланса классов
- Кодировщик: четыре блока понижающей дискретизации, каждый содержит два сверточных слоя (ядро 3×3, активация ReLU, инициализация He), за которыми следуют максимальное объединение 2×2 и отсев 0,3
- Узкое место: два сверточных слоя с 1024 фильтрами для захвата высокоуровневого представления признаков
- Декодировщик: четыре блока повышающей дискретизации с использованием транспонированной свёртки для повышающей дискретизации, объединённые с пропускающими соединениями для сохранения пространственных деталей
- Выходной слой: свёртка 1×1 + активация Sigmoid для создания бинарной карты сегментации
Фокусная потеря решает проблему дисбаланса классов путём динамической регулировки вклада потерь каждого пикселя:
FL(pt)=−α(1−pt)γlog(pt)
где:
- pt: вероятность предсказания моделью истинного класса
- α: весовой коэффициент балансировки классов
- γ: параметр фокусировки, контролирующий внимание к сложным образцам
- (1−pt): модулирующий коэффициент, придающий более высокий вес неправильно классифицированным образцам
- Параметризованное исследование: систематическое сравнение двух наборов параметров фокусной функции потерь:
- α=0,25, γ=2,0: акцент на сложные образцы и границы опухоли
- α=2,0, γ=0,75: больше внимания к меньшинству, но меньше фокусировки на сложных образцах
- Сравнение стратегий увеличения: независимая оценка эффективности трёх базовых методов увеличения для практического применения
- Источник: Южная больница и Тяньцзиньский медицинский университет (2005-2010 гг.), собрано Jun Cheng
- Объём: 3064 Т1-взвешенных контрастных МРТ-изображения от 233 пациентов
- Типы опухолей:
- Менингиома: 708 случаев
- Глиома: 1426 случаев
- Аденома гипофиза: 930 случаев
- Аннотирование: ручное описание границ опухоли тремя опытными радиологами
- Разделение данных: обучающий набор 1838 образцов, валидационный набор 613 образцов, тестовый набор 613 образцов
- Коэффициент Dice: измерение степени перекрытия сегментации
- IoU (пересечение над объединением): оценка перекрытия предсказанной и истинной областей
- Точность (Precision): доля пикселей, предсказанных как опухоль, которые действительно являются опухолью
- Полнота (Recall): доля истинных пикселей опухоли, правильно идентифицированных
- Аккуратность (Accuracy): общая точность классификации пикселей
- Arafat et al. (2023): метод сегментации опухолей мозга на основе глубокого обучения
- Gupta et al. (2021): сегментация опухолей мозга МРТ с использованием глубокого обучения
- Оптимизатор: Adam, скорость обучения 1×10⁻⁴
- Размер пакета: 8
- Количество эпох: 200
- Оборудование: Google Colab TPUv2-8
- Фреймворк: TensorFlow
| Параметры | Аккуратность | Потеря | Точность | Полнота | IoU | Коэффициент Dice |
|---|
| α=0,25, γ=2,0 | 0,9941 | 0,0082 | 0,9014 | 0,7681 | 0,7082 | 0,7867 |
| α=2,0, γ=0,75 | 0,9939 | 0,0154 | 0,8778 | 0,7789 | 0,7004 | 0,7839 |
Ключевые выводы: комбинация параметров α=0,25, γ=2,0 показывает лучшую производительность по большинству метрик, особенно по точности и значению потерь.
| Метод увеличения | Аккуратность | Потеря | Точность | Полнота | IoU | Коэффициент Dice |
|---|
| Без увеличения | 0,9941 | 0,0082 | 0,9014 | 0,7681 | 0,7082 | 0,7867 |
| Горизонтальное отражение | 0,9942 | 0,0053 | 0,9001 | 0,7779 | 0,7152 | 0,8041 |
| Поворот (±15°) | 0,9940 | 0,0029 | 0,8774 | 0,7892 | 0,7090 | 0,7955 |
| Случайное масштабирование | 0,9934 | 0,0064 | 0,9097 | 0,7106 | 0,6643 | 0,7486 |
- Горизонтальное отражение: улучшение по всем метрикам, наиболее значительное увеличение коэффициента Dice (+0,0174)
- Поворот: повышение полноты и коэффициента Dice, демонстрирующее хорошую обобщающую способность
- Масштабирование: наихудший результат, даже ниже базовой модели по некоторым метрикам
- Горизонтальное отражение и поворот: более стабильные кривые валидации с меньшим разрывом между производительностью обучения и валидации
- Масштабирование: большие колебания потерь валидации, слабая обобщающая способность
- Без увеличения: гладкие кривые, но лёгкое переобучение
| Модель | Точность | Полнота | IoU | Коэффициент Dice |
|---|
| Данное исследование | 0,9001 | 0,7779 | 0,7152 | 0,8041 |
| Arafat et al. | 0,82 | 0,74 | 0,68 | 0,94 |
| Gupta et al. | 0,89 | 0,91 | - | 0,90 |
Примечание: хотя данное исследование демонстрирует превосходную точность, коэффициент Dice немного ниже некоторых методов сравнения.
- Пороговая сегментация: метод Otsu на основе гистограммы яркости
- Обнаружение границ: модели активных контуров
- Рост региона: расширение региона на основе точки-семени
- Ограничения: чувствительность к шуму, слабая обобщающая способность
- Архитектуры CNN: автоматическое изучение иерархических признаков, превосходящее методы с ручными признаками
- U-Net: структура кодировщик-декодировщик с пропускающими соединениями, ставшая золотым стандартом биомедицинской сегментации
- Эволюция функций потерь: от бинарной кросс-энтропии к потере Dice и фокусной потере
- Геометрические преобразования: отражение, поворот, масштабирование
- Эластичные деформации: моделирование деформации тканей
- Возмущения интенсивности: моделирование различных условий сканирования
- Выбор параметров фокусной функции потерь имеет решающее значение: комбинация α=0,25, γ=2,0 более эффективна при обработке дисбаланса классов
- Простые стратегии увеличения эффективны: горизонтальное отражение — наиболее эффективный метод увеличения, поворот — второй по эффективности
- Ограниченная эффективность масштабирования: изменение размера вносит небольшой вклад в повышение производительности на данном наборе данных
- Важность воспроизводимости: установлен прозрачный экспериментальный эталон
- Единственный набор данных: валидация только на одном наборе данных, обобщающая способность требует проверки
- Базовые стратегии увеличения: не исследованы более продвинутые методы, такие как эластичные деформации
- Фиксированная архитектура: использован только стандартный U-Net, отсутствует сравнение с другими передовыми архитектурами
- Метрики оценки: основной акцент на пиксельных метриках, отсутствует оценка клинической релевантности
- Продвинутые стратегии увеличения: эластичные деформации, модально-специфичные преобразования
- Генеративное увеличение данных: синтез обучающих данных с использованием GAN
- Многозадачное обучение: объединение сегментации и классификации типа опухоли
- Кросс-датасетная валидация: проверка обобщающей способности метода на нескольких наборах данных
- Высокая прозрачность исследования: предоставлен полный код и конфигурации экспериментов, обеспечена воспроизводимость
- Сильная систематичность: поэтапный дизайн экспериментов, сначала оптимизация параметров функции потерь, затем оценка стратегий увеличения
- Практическая ценность: предоставлены чёткие рекомендации по выбору параметров и стратегиям увеличения для практического применения
- Установление эталона: предоставлен стандартизированный эталон оценки для данной области
- Ограниченная новизна: в основном комбинация и оценка существующих методов, отсутствуют технические инновации
- Недостаточная глубина экспериментов: отсутствует глубокий анализ механизмов действия различных стратегий увеличения
- Ограничения набора данных: единственный набор данных может привести к ограниченности выводов
- Недостаточное сравнение: ограниченное сравнение с передовыми методами, отсутствуют тесты статистической значимости
- Научный вклад: предоставлен надёжный эталон и справочная точка для исследований сегментации опухолей мозга
- Практическая ценность: предоставлено практическое техническое решение для клинического применения
- Воспроизводимость: способствует повышению прозрачности и воспроизводимости исследований в данной области
- Образовательная ценность: предоставлен полный справочник реализации для начинающих
- Клиническая диагностическая поддержка: может служить вспомогательным инструментом для радиологов
- Исследовательский эталон: предоставляет эталон сравнения для новых методов
- Применение в обучении: практический случай для курсов обработки медицинских изображений
- Разработка продуктов: технологическая основа для медицинских AI-продуктов
- Ronneberger et al. (2015) — оригинальная статья U-Net
- Lin et al. (2017) — статья о введении фокусной функции потерь
- Cheng et al. (2015) — статья об источнике набора данных
- Nalepa et al. (2019) — обзор увеличения данных при сегментации опухолей мозга
Общая оценка: это добротная эмпирическая исследовательская статья, которая, хотя и имеет ограниченные технические инновации, обладает значительной ценностью в установлении воспроизводимого эталона и систематической оценке. Прозрачность и полнота статьи заслуживают похвалы и закладывают хорошую основу для дальнейшего развития данной области.