2025-11-13T13:28:10.924524

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

Jacobs, Morris, Shaik et al.
Sperm DNA fragmentation (SDF) is a critical parameter in male fertility assessment that conventional semen analysis fails to evaluate. This study presents the validation of a novel artificial intelligence (AI) tool designed to detect SDF through digital analysis of phase contrast microscopy images, using the terminal deoxynucleotidyl transferase dUTP nick end labeling (TUNEL) assay as the gold standard reference. Utilising the established link between sperm morphology and DNA integrity, the present work proposes a morphology assisted ensemble AI model that combines image processing techniques with state-of-the-art transformer based machine learning models (GC-ViT) for the prediction of DNA fragmentation in sperm from phase contrast images. The ensemble model is benchmarked against a pure transformer `vision' model as well as a `morphology-only` model. Promising results show the proposed framework is able to achieve sensitivity of 60\% and specificity of 75\%. This non-destructive methodology represents a significant advancement in reproductive medicine by enabling real-time sperm selection based on DNA integrity for clinical diagnostic and therapeutic applications.
academic

Валидация инструмента искусственного интеллекта для обнаружения фрагментации ДНК сперматозоидов с использованием анализа TUNEL in situ гибридизации

Основная информация

  • ID статьи: 2510.11142
  • Название: Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay
  • Авторы: B. A. Jacobs, A. Morris, I. Shaik, F. Lin
  • Категория: cs.CV (Компьютерное зрение)
  • Дата публикации: 13 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.11142v1

Аннотация

Фрагментация ДНК сперматозоидов (SDF) является ключевым параметром при оценке мужской фертильности, однако традиционный анализ спермы не позволяет оценить этот показатель. В данном исследовании предложен и валидирован новый инструмент искусственного интеллекта для обнаружения SDF путём цифрового анализа изображений фазово-контрастной микроскопии с использованием метода терминальной дезоксинуклеотидилтрансферазы dUTP-ник-конечного мечения (TUNEL) в качестве золотого стандарта. Используя установленную связь между морфологией сперматозоидов и целостностью ДНК, в исследовании предложена интегрированная модель ИИ, дополненная морфологией, которая объединяет методы обработки изображений и передовую модель машинного обучения на основе Transformer (GC-ViT) для прогнозирования фрагментации ДНК сперматозоидов на фазово-контрастных изображениях. Интегрированная модель была сравнена с чистой моделью Transformer и моделью, основанной исключительно на морфологии. Результаты показали, что предложенная структура достигает чувствительности 60% и специфичности 75%. Этот неинвазивный метод обеспечивает значительный прогресс в клинической диагностике и терапевтических приложениях репродуктивной медицины путём реализации выбора сперматозоидов в реальном времени на основе целостности ДНК.

Научная база и мотивация

Определение проблемы

  1. Основная проблема: Традиционный анализ спермы не может оценить фрагментацию ДНК сперматозоидов (SDF) — ключевой параметр фертильности, тесно связанный со снижением частоты оплодотворения, нарушением развития эмбриона и повышением частоты выкидышей.
  2. Клиническая значимость:
    • Бесплодие поражает примерно 15% пар репродуктивного возраста во всём мире, причём мужской фактор составляет 30-50%
    • SDF напрямую влияет на успешность вспомогательных репродуктивных технологий (ВРТ)
    • Существующие методы обнаружения нарушают жизнеспособность сперматозоидов и не могут использоваться для последующего лечения
  3. Ограничения существующих методов:
    • Метод TUNEL: требует специального оборудования и подготовленного персонала, отнимает много времени и дорогостоящий, процессы фиксации и окрашивания инактивируют сперматозоиды
    • Несогласованность методов обнаружения: множественные методы (AOT, CMA3, SCSA, COMET, SCD) дают несогласованные результаты
    • Высокая субъективность: ручная интерпретация имеет внутриэксперт и межэксперт различия
  4. Мотивация исследования: Разработать неинвазивный, быстрый и объективный инструмент на основе ИИ для обнаружения SDF, способный сохранять жизнеспособность сперматозоидов для последующих процедур ВРТ.

Основные вклады

  1. Предложена интегрированная модель ИИ, дополненная морфологией: объединяет методы обработки изображений и модель Transformer GC-ViT, используя связь между морфологией сперматозоидов и целостностью ДНК для прогнозирования
  2. Разработан неинвазивный метод обнаружения: использует только изображения фазово-контрастной микроскопии для обнаружения SDF, сохраняя жизнеспособность сперматозоидов для последующего лечения
  3. Создан аннотированный набор данных: содержит 1825 триплетов изображений сперматозоидов (светлое поле, фазовый контраст, флуоресценция) от 35 пациентов
  4. Количественно оценены внутриэксперт различия: цифровой анализ выявил субъективность традиционной ручной оценки (внутриэксперт согласованность только 81%)
  5. Установлены эталоны производительности: валидирована осуществимость инструмента ИИ на уровне чувствительности 60% и специфичности 75%

Подробное описание методов

Определение задачи

  • Входные данные: изображение фазово-контрастной микроскопии сперматозоида
  • Выходные данные: бинарный результат классификации (фрагментация ДНК/отсутствие фрагментации)
  • Ограничения: неинвазивность, обработка в реальном времени, применимость к живым и мёртвым сперматозоидам

Архитектура модели

1. Интегрированная модель (Ensemble Model)

Входные данные: фазово-контрастное изображение + морфологические признаки
     ↓
GC-ViT Transformer → визуальные признаки
     ↓
Извлечение морфологических признаков → морфологические признаки  
     ↓
Модуль слияния признаков → классификационная головка (1024→256 узлов)
     ↓
Выходные данные: вероятность фрагментации ДНК

2. Модели для сравнения

  • Чистая визуальная модель: использует только GC-ViT для обработки фазово-контрастных изображений
  • Чистая морфологическая модель: использует только морфологические параметры, извлечённые из фазово-контрастных изображений

3. Ключевые технические компоненты

  • GC-ViT Transformer: глобальный контекстный визуальный Transformer в качестве основной сети
  • Морфологические признаки: параметры длины и ширины головки, наличие вакуолей, область акросомы и др.
  • Слияние признаков: адаптивный модуль, выбирающий визуальные признаки, морфологические признаки или их комбинацию
  • Классификационная головка: двухслойная полносвязная сеть (1024→256 узлов) с активацией LeakyReLU и регуляризацией Dropout

Технические инновации

  1. Мультимодальное слияние: впервые объединены модель Transformer для визуального анализа с морфологическими признаками сперматозоидов для обнаружения SDF
  2. Неинвазивное обнаружение: преодолены ограничения традиционных химических методов, реализовано обнаружение с сохранением жизнеспособности
  3. Стратегия трансферного обучения: применены иерархическое затухание скорости обучения и ранняя остановка для малых наборов данных
  4. Объективное количественное определение: обеспечивает воспроизводимый количественный анализ, снижающий субъективность человека

Экспериментальная установка

Набор данных

  • Источник образцов: образцы спермы от 35 согласивших пациентов
  • Количество изображений: 1825 триплетов изображений (светлое поле, фазовый контраст, флуоресценция)
  • Распределение аннотаций:
    • Фрагментированные: 512
    • Нефрагментированные: 715
    • Неопределённые: 591 (исключены)
  • Разделение данных:
    • Обучающий набор: 1017 изображений (28 пациентов)
    • Валидационный набор: 210 изображений (7 пациентов)
    • Группировка по пациентам для предотвращения утечки данных

Метрики оценки

  • Чувствительность (Sensitivity/Recall): доля правильно идентифицированных фрагментированных сперматозоидов
  • Специфичность (Specificity): доля правильно идентифицированных нефрагментированных сперматозоидов
  • Точность (Precision): доля истинно фрагментированных среди предсказанных как фрагментированные
  • Точность (Accuracy): общая доля правильной классификации
  • F1-оценка: гармоническое среднее точности и полноты
  • ROC-кривая: кривая характеристики оператора-приёмника

Методы сравнения

  • Чистая визуальная модель GC-ViT
  • Чистая морфологическая модель
  • Интегрированная модель

Детали реализации

  • Оптимизатор: Adam, начальная скорость обучения 5×10⁻⁵
  • Стратегия скорости обучения: иерархическое затухание (коэффициент затухания 0,12), разминка 0,1
  • Функция потерь: бинарная кросс-энтропия
  • Регуляризация: Dropout (0,6, 0,3), ранняя остановка (10 эпох)
  • Увеличение данных: случайные повороты и отражения
  • Количество эпох обучения: максимум 50

Результаты экспериментов

Основные результаты

Тип моделиЧувствительностьСпецифичностьТочностьТочностьF1-оценка
Интегрированная модель0,600,750,600,690,60
Морфологическая модель0,780,440,470,570,59
Чистая визуальная модель0,780,460,480,590,60

Ключевые находки

  1. Лучшая производительность интегрированной модели: превосходит модели с одной модальностью в сбалансированной производительности, достигая хорошего баланса между чувствительностью и специфичностью
  2. Внутриэксперт различия: согласованность при переаннотировании одним экспертом через 10 месяцев составила только 81%, абсолютная средняя разница в процентах SDF на уровне пациента составила 13,7%±19,5%
  3. Стабильность модели: кривые обучения показывают отсутствие явного переобучения, ROC-кривая значительно превосходит случайную классификацию

Анализ случаев

  • Случаи правильной классификации: интегрированная модель уравновешивает визуальную и морфологическую информацию, правильно классифицируя даже при отказе одной модальности
  • Случаи неправильной классификации: в основном вызваны наличием нескольких хвостов сперматозоидов в изображении или размытостью изображения, приводящей к ошибкам морфологических измерений

Связанные работы

Традиционные методы обнаружения SDF

  • Метод TUNEL: золотой стандарт, но разрушает жизнеспособность сперматозоидов
  • Другие методы: AOT, CMA3, SCSA, COMET, SCD и др., дающие несогласованные результаты

Применение ИИ в анализе сперматозоидов

  • Serrano Berenguer и др. (2022): использование случайного леса и CNN для прогнозирования результатов COMET
  • Wang и др. (2019): модели линейной и нелинейной регрессии на основе данных AOT, точность тестирования 82,7%
  • Преимущества данного исследования: неинвазивность, мультимодальное слияние, возможность обработки в реальном времени

Выводы и обсуждение

Основные выводы

  1. Успешно разработан инструмент на основе ИИ для неинвазивного обнаружения SDF
  2. Интегрированная модель достигает сбалансированной производительности с чувствительностью 60% и специфичностью 75%
  3. Предоставляет новое решение для выбора сперматозоидов в технологиях вспомогательной репродукции

Ограничения

  1. Размер набора данных: относительно небольшой набор данных ограничивает дальнейшее улучшение производительности модели
  2. Аннотирование одним экспертом: отсутствие аннотирования несколькими экспертами для оценки межэксперт различий
  3. Чувствительность требует улучшения: 60% чувствительность всё ещё имеет место для совершенствования

Будущие направления

  1. Расширение масштаба обучающего набора данных
  2. Проведение многоцентровой клинической валидации
  3. Интеграция знаний из множественных методов обнаружения SDF
  4. Разработка системы для применения в реальной клинической практике

Глубокая оценка

Преимущества

  1. Значительная клиническая значимость: решает реальные клинические потребности в репродуктивной медицине
  2. Сильная техническая инновативность: впервые объединены модель Transformer с морфологическими признаками сперматозоидов для обнаружения SDF
  3. Строгая методология: группировка по пациентам предотвращает утечку данных, количественно оценены внутриэксперт различия
  4. Высокая практическая ценность: неинвазивное обнаружение сохраняет жизнеспособность сперматозоидов, применимо в клинической практике

Недостатки

  1. Ограничение размера выборки: 1825 образцов относительно малы для моделей глубокого обучения
  2. Исследование в одном центре: отсутствие многоцентровой валидации, способность к обобщению требует проверки
  3. Производительность требует улучшения: 60% чувствительность может быть недостаточна для идеальной клинической практики
  4. Отсутствие анализа затрат-выгод: не предоставлено сравнение экономичности с традиционными методами

Влияние

  1. Академический вклад: предоставляет новые идеи для применения ИИ в репродуктивной медицине
  2. Потенциал клинической трансляции: может улучшить успешность ВРТ, принеся пользу пациентам с бесплодием
  3. Ценность технологического распространения: может быть расширено на другие задачи анализа медицинских изображений

Сценарии применения

  1. Процедуры ЭКО/ИКСИ: предоперационная оценка и выбор качества спермы
  2. Диагностика мужского бесплодия: объективная оценка SDF
  3. Исследования в репродуктивной медицине: стандартизированный инструмент обнаружения SDF
  4. Телемедицина: автоматизированный анализ снижает зависимость от специалистов

Библиография

Данное исследование ссылается на важные работы в области репродуктивной медицины, машинного обучения и обработки изображений, включая руководство ВОЗ по анализу спермы, стандартные протоколы TUNEL, а также недавние исследования применения ИИ в анализе медицинских изображений и другие ключевые ссылки.


Общая оценка: Это междисциплинарное исследование с важной клинической ценностью, применяющее передовые технологии ИИ для решения практических проблем в репродуктивной медицине. Хотя есть место для улучшения в масштабе данных и производительности, инновационная концепция неинвазивного обнаружения и технический подход мультимодального слияния указывают направление развития этой области.