Brain tumor segmentation is crucial for diagnosis and treatment planning, yet challenges such as class imbalance and limited model generalization continue to hinder progress. This work presents a reproducible evaluation of U-Net segmentation performance on brain tumor MRI using focal loss and basic data augmentation strategies. Experiments were conducted on a publicly available MRI dataset, focusing on focal loss parameter tuning and assessing the impact of three data augmentation techniques: horizontal flip, rotation, and scaling. The U-Net with focal loss achieved a precision of 90%, comparable to state-of-the-art results. By making all code and results publicly available, this study establishes a transparent, reproducible baseline to guide future research on augmentation strategies and loss function design in brain tumor segmentation.
- ID del Artículo: 2510.08617
- Título: Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation
- Autor: Saumya B (Instituto Indio de Ciencias)
- Clasificación: cs.CV cs.LG
- Fecha de Publicación: 8 de octubre de 2025 (preimpresión arXiv)
- Enlace del Artículo: https://arxiv.org/abs/2510.08617
La segmentación de tumores cerebrales es crucial para el diagnóstico y la planificación del tratamiento, pero desafíos como el desequilibrio de clases y la generalización limitada del modelo siguen obstaculizando el progreso. Este estudio realiza una evaluación reproducible del rendimiento de U-Net utilizando pérdida focal y estrategias básicas de aumento de datos en la segmentación de tumores cerebrales por resonancia magnética. Los experimentos se realizaron en un conjunto de datos de resonancia magnética de acceso público, enfocándose en la sintonización de parámetros de pérdida focal y la evaluación del impacto de tres técnicas de aumento de datos: volteo horizontal, rotación y escalado. U-Net con pérdida focal logró una precisión del 90%, comparable con los resultados del estado del arte. Al publicar todo el código y los resultados, este estudio establece un punto de referencia transparente y reproducible que guía futuras investigaciones en estrategias de aumento y diseño de funciones de pérdida para segmentación de tumores cerebrales.
Los tumores cerebrales son una de las enfermedades médicas más desafiantes, requiriendo la identificación precisa de los límites del tumor para una planificación terapéutica efectiva. La resonancia magnética (RM) es una modalidad de imagen ampliamente utilizada para detectar tumores cerebrales, pero la delineación manual de áreas tumorales por radiólogos presenta los siguientes problemas:
- Consume mucho tiempo y es propensa a errores
- Gran variabilidad entre observadores
- Difícil de escalar en entornos clínicos
- Desequilibrio de Clases: Los píxeles de tumor son escasos en relación con los píxeles de fondo, lo que resulta en un rendimiento deficiente de las funciones de pérdida tradicionales
- Escasez de Datos: El costo de anotación de imágenes médicas es alto, con datos de entrenamiento disponibles limitados
- Capacidad de Generalización: La capacidad del modelo para generalizar entre diferentes escáneres y poblaciones de pacientes es limitada
Este estudio tiene como objetivo establecer un punto de referencia reproducible para la segmentación de tumores cerebrales mediante la evaluación sistemática de parámetros de pérdida focal y estrategias de aumento de datos, cerrando la brecha en transparencia y reproducibilidad en investigaciones existentes.
- Establecimiento de Punto de Referencia Reproducible: Proporciona una implementación de referencia de U-Net con pérdida focal para segmentación de tumores cerebrales por RM
- Análisis Sistemático de Parámetros: Análisis profundo del impacto de los parámetros de pérdida focal (α y γ) en el rendimiento del modelo
- Evaluación de Estrategias de Aumento de Datos: Evaluación de tres técnicas diferentes de aumento de datos en el rendimiento del modelo
- Contribución de Código Abierto: Publicación de todo el código y configuraciones experimentales para garantizar transparencia y reproducibilidad
Entrada: Imágenes de RM ponderadas en T1 con contraste mejorado de 256×256 píxeles
Salida: Máscara de segmentación binaria que identifica la región del tumor
Objetivo: Segmentar con precisión los límites del tumor cerebral, abordando el problema del desequilibrio de clases
- Codificador: Cuatro bloques de submuestreo, cada uno contiene dos capas convolucionales (núcleo 3×3, activación ReLU, inicialización normal de He), seguidas de agrupación máxima 2×2 y abandono de 0.3
- Capa de Cuello de Botella: Dos capas convolucionales con 1024 filtros, capturando representaciones de características de alto nivel
- Decodificador: Cuatro bloques de supermuestreo, utilizando convolución transpuesta para supermuestreo, combinadas con conexiones de salto para mantener detalles espaciales
- Capa de Salida: Convolución 1×1 + activación Sigmoid, generando mapa de segmentación binaria
La pérdida focal aborda el desequilibrio de clases ajustando dinámicamente la contribución de pérdida de cada píxel:
FL(pt)=−α(1−pt)γlog(pt)
Donde:
- pt: Probabilidad predicha del modelo para la clase verdadera
- α: Factor de ponderación de equilibrio de clases
- γ: Parámetro de enfoque, controlando la atención a muestras difíciles
- (1−pt): Factor de modulación, dando mayor peso a muestras mal clasificadas
- Investigación Parametrizada: Comparación sistemática de dos conjuntos de parámetros de pérdida focal:
- α=0.25, γ=2.0: Enfatiza muestras difíciles y límites de tumor
- α=2.0, γ=0.75: Mayor enfoque en clase minoritaria pero menos énfasis en muestras difíciles
- Comparación de Estrategias de Aumento: Evaluación independiente de tres técnicas de aumento básicas, proporcionando orientación para aplicaciones prácticas
- Fuente: Hospital del Sur y Universidad Médica de Tianjin (2005-2010), recopilado por Jun Cheng
- Escala: 3064 imágenes de RM ponderadas en T1 con contraste mejorado, de 233 pacientes
- Tipos de Tumor:
- Meningioma: 708 casos
- Glioma: 1426 casos
- Tumor hipofisario: 930 casos
- Anotación: Delineación manual de límites tumorales por tres radiólogos experimentados
- División de Datos: Conjunto de entrenamiento 1838 muestras, conjunto de validación 613 muestras, conjunto de prueba 613 muestras
- Coeficiente Dice: Mide el grado de superposición de segmentación
- IoU (Intersección sobre Unión): Evalúa la superposición entre región predicha y verdadera
- Precisión: Proporción de píxeles predichos como tumor que son realmente tumor
- Recall (Sensibilidad): Proporción de píxeles de tumor verdadero identificados correctamente
- Exactitud: Tasa de precisión general de clasificación de píxeles
- Arafat et al. (2023): Método de segmentación de tumor cerebral basado en aprendizaje profundo
- Gupta et al. (2021): Segmentación de tumor cerebral por RM usando aprendizaje profundo
- Optimizador: Adam, tasa de aprendizaje 1×10⁻⁴
- Tamaño de Lote: 8
- Épocas de Entrenamiento: 200 épocas
- Hardware: Google Colab TPUv2-8
- Marco: TensorFlow
| Configuración de Parámetros | Exactitud | Pérdida | Precisión | Recall | IoU | Coeficiente Dice |
|---|
| α=0.25, γ=2.0 | 0.9941 | 0.0082 | 0.9014 | 0.7681 | 0.7082 | 0.7867 |
| α=2.0, γ=0.75 | 0.9939 | 0.0154 | 0.8778 | 0.7789 | 0.7004 | 0.7839 |
Hallazgos Clave: La combinación de parámetros α=0.25, γ=2.0 mostró mejor rendimiento en la mayoría de métricas, particularmente en precisión y valor de pérdida.
| Técnica de Aumento | Exactitud | Pérdida | Precisión | Recall | IoU | Coeficiente Dice |
|---|
| Sin Aumento | 0.9941 | 0.0082 | 0.9014 | 0.7681 | 0.7082 | 0.7867 |
| Volteo Horizontal | 0.9942 | 0.0053 | 0.9001 | 0.7779 | 0.7152 | 0.8041 |
| Rotación (±15°) | 0.9940 | 0.0029 | 0.8774 | 0.7892 | 0.7090 | 0.7955 |
| Escalado Aleatorio | 0.9934 | 0.0064 | 0.9097 | 0.7106 | 0.6643 | 0.7486 |
- Volteo Horizontal: Mejora en todas las métricas, con el aumento más significativo en coeficiente Dice (+0.0174)
- Rotación: Aumenta recall y coeficiente Dice, demostrando buena capacidad de generalización
- Escalado: Peor rendimiento, incluso por debajo del modelo base en algunas métricas
- Volteo Horizontal y Rotación: Producen curvas de validación más estables, con menor brecha entre rendimiento de entrenamiento y validación
- Escalado: Mayor fluctuación en pérdida de validación, capacidad de generalización más débil
- Sin Aumento: Curvas suaves pero con ligero sobreajuste
| Modelo | Precisión | Recall | IoU | Coeficiente Dice |
|---|
| Este Estudio | 0.9001 | 0.7779 | 0.7152 | 0.8041 |
| Arafat et al. | 0.82 | 0.74 | 0.68 | 0.94 |
| Gupta et al. | 0.89 | 0.91 | - | 0.90 |
Nota: Aunque este estudio muestra excelente rendimiento en precisión, el coeficiente Dice es ligeramente inferior a algunos métodos de comparación.
- Segmentación por Umbralización: Método de Otsu basado en histograma de escala de grises
- Detección de Bordes: Modelos de contorno activo
- Crecimiento de Región: Expansión de región basada en punto semilla
- Limitaciones: Sensibles al ruido, capacidad de generalización deficiente
- Arquitecturas CNN: Aprendizaje automático de características jerárquicas, superando métodos de características manuales tradicionales
- U-Net: Estructura codificador-decodificador con conexiones de salto, estándar de oro para segmentación biomédica
- Evolución de Funciones de Pérdida: De entropía cruzada binaria a pérdida Dice, luego a pérdida focal
- Transformaciones Geométricas: Volteo, rotación, escalado
- Deformación Elástica: Simulación de deformación de tejido
- Perturbación de Intensidad: Simulación de diferentes condiciones de escaneo
- La Selección de Parámetros de Pérdida Focal es Crítica: La combinación α=0.25, γ=2.0 es más efectiva para manejar desequilibrio de clases
- Las Estrategias de Aumento Simple son Efectivas: El volteo horizontal es la técnica de aumento más efectiva, seguida por rotación
- El Aumento por Escalado es Limitado: Los cambios de tamaño contribuyen poco a la mejora de rendimiento en este conjunto de datos
- Importancia de la Reproducibilidad: Se estableció un punto de referencia experimental transparente
- Conjunto de Datos Único: Validación en un solo conjunto de datos, generalización pendiente de verificación
- Estrategias de Aumento Básicas: No se exploraron técnicas más avanzadas como deformación elástica
- Arquitectura Fija: Solo se utilizó U-Net estándar, sin comparación con arquitecturas más avanzadas
- Métricas de Evaluación: Enfoque principal en métricas a nivel de píxel, falta de evaluación de relevancia clínica
- Estrategias de Aumento Avanzadas: Deformación elástica, transformaciones específicas de modalidad
- Aumento de Datos Generativo: Síntesis de datos de entrenamiento usando GANs
- Aprendizaje Multitarea: Combinación de segmentación y clasificación de tipo de tumor
- Validación Entre Conjuntos de Datos: Verificación de capacidad de generalización del método en múltiples conjuntos de datos
- Alta Transparencia de Investigación: Proporciona código completo y configuraciones experimentales, garantizando reproducibilidad
- Fuerte Sistematicidad: Diseño experimental por etapas, primero optimizando parámetros de función de pérdida, luego evaluando estrategias de aumento
- Valor Práctico: Proporciona orientación clara sobre selección de parámetros y estrategias de aumento para aplicaciones prácticas
- Establecimiento de Punto de Referencia: Proporciona punto de referencia de evaluación estandarizado para el campo
- Innovación Limitada: Principalmente combinación y evaluación de métodos existentes, falta de innovación técnica
- Profundidad Experimental Insuficiente: No analiza profundamente los mecanismos de acción de diferentes estrategias de aumento
- Limitaciones del Conjunto de Datos: Un solo conjunto de datos puede limitar la generalidad de las conclusiones
- Comparación Insuficiente: Pocas comparaciones con métodos del estado del arte, falta de pruebas de significancia estadística
- Contribución Académica: Proporciona punto de referencia confiable y punto de referencia para investigación en segmentación de tumores cerebrales
- Valor Práctico: Proporciona solución técnica práctica para aplicaciones clínicas
- Reproducibilidad: Promueve transparencia y reproducibilidad en el campo
- Valor Educativo: Proporciona referencia de implementación completa para principiantes
- Asistencia al Diagnóstico Clínico: Puede servir como herramienta auxiliar para radiólogos
- Punto de Referencia de Investigación: Proporciona punto de referencia de comparación para nuevos métodos
- Aplicación Educativa: Caso práctico para cursos de procesamiento de imágenes médicas
- Desarrollo de Productos: Base técnica para productos de IA médica
- Ronneberger et al. (2015) - Artículo original de U-Net
- Lin et al. (2017) - Artículo de introducción de Focal Loss
- Cheng et al. (2015) - Artículo de fuente del conjunto de datos
- Nalepa et al. (2019) - Revisión de aumento de datos para segmentación de tumores cerebrales
Evaluación General: Este es un artículo de investigación empírica sólido que, aunque tiene innovación técnica limitada, posee valor importante en el establecimiento de puntos de referencia reproducibles y evaluación sistemática. La transparencia e integridad del artículo son dignas de elogio, sentando una base sólida para el desarrollo futuro del campo.