2025-11-13T13:28:10.924524

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

Jacobs, Morris, Shaik et al.
Sperm DNA fragmentation (SDF) is a critical parameter in male fertility assessment that conventional semen analysis fails to evaluate. This study presents the validation of a novel artificial intelligence (AI) tool designed to detect SDF through digital analysis of phase contrast microscopy images, using the terminal deoxynucleotidyl transferase dUTP nick end labeling (TUNEL) assay as the gold standard reference. Utilising the established link between sperm morphology and DNA integrity, the present work proposes a morphology assisted ensemble AI model that combines image processing techniques with state-of-the-art transformer based machine learning models (GC-ViT) for the prediction of DNA fragmentation in sperm from phase contrast images. The ensemble model is benchmarked against a pure transformer `vision' model as well as a `morphology-only` model. Promising results show the proposed framework is able to achieve sensitivity of 60\% and specificity of 75\%. This non-destructive methodology represents a significant advancement in reproductive medicine by enabling real-time sperm selection based on DNA integrity for clinical diagnostic and therapeutic applications.
academic

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

基本信息

  • 论文ID: 2510.11142
  • 标题: Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay
  • 作者: B. A. Jacobs, A. Morris, I. Shaik, F. Lin
  • 分类: cs.CV (Computer Vision)
  • 发表时间: 2025年10月13日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2510.11142v1

摘要

精子DNA碎片化(SDF)是男性生育力评估中的关键参数,但传统精液分析无法评估这一指标。本研究提出并验证了一种新型人工智能工具,通过对相差显微镜图像的数字分析来检测SDF,以末端脱氧核苷酸转移酶dUTP缺口末端标记(TUNEL)检测法作为金标准参考。利用精子形态学与DNA完整性之间的既定联系,本研究提出了一种形态学辅助的集成AI模型,该模型结合了图像处理技术和最先进的基于Transformer的机器学习模型(GC-ViT)来预测相差图像中精子的DNA碎片化情况。该集成模型与纯Transformer视觉模型以及仅基于形态学的模型进行了基准测试。结果显示,所提出的框架能够实现60%的敏感性和75%的特异性。这种非破坏性方法通过实现基于DNA完整性的实时精子选择,为生殖医学的临床诊断和治疗应用带来了重大进展。

研究背景与动机

问题定义

  1. 核心问题: 传统精液分析无法评估精子DNA碎片化(SDF)这一关键生育力参数,而SDF与受精率降低、胚胎发育受损、流产率增加等不良结果密切相关。
  2. 临床重要性:
    • 不孕症影响全球约15%的育龄夫妇,其中男性因素占30-50%
    • SDF直接影响辅助生殖技术(ART)的成功率
    • 现有检测方法破坏精子活力,无法用于后续治疗
  3. 现有方法局限性:
    • TUNEL检测法: 需要专业设备和训练有素的人员,耗时且成本高昂,固定和染色过程使精子失活
    • 检测方法不一致: AOT、CMA3、SCSA、COMET、SCD等多种检测方法结果不一致
    • 主观性强: 人工判读存在专家内和专家间差异
  4. 研究动机: 开发一种基于AI的非破坏性、快速、客观的SDF检测工具,能够保持精子活力用于后续ART程序。

核心贡献

  1. 提出了形态学辅助的集成AI模型: 结合图像处理技术和GC-ViT Transformer模型,利用精子形态学与DNA完整性的关联进行预测
  2. 开发了非破坏性检测方法: 仅使用相差显微镜图像进行SDF检测,保持精子活力用于后续治疗
  3. 构建了标注数据集: 包含1825个精子图像三元组(明场、相差、荧光),来自35名患者
  4. 量化了专家内差异: 通过数字化分析揭示了传统人工评估的主观性问题(专家内一致性仅81%)
  5. 建立了性能基准: 在敏感性60%和特异性75%的水平上验证了AI辅助工具的可行性

方法详解

任务定义

  • 输入: 精子的相差显微镜图像
  • 输出: 二分类结果(DNA碎片化/未碎片化)
  • 约束: 非破坏性、实时处理、适用于活体和死精子

模型架构

1. 集成模型(Ensemble Model)

输入: 相差图像 + 形态学特征
     ↓
GC-ViT Transformer → 视觉特征
     ↓
形态学特征提取 → 形态学特征  
     ↓
特征融合模块 → 分类头(1024→256节点)
     ↓
输出: DNA碎片化概率

2. 对比模型

  • 纯视觉模型: 仅使用GC-ViT处理相差图像
  • 纯形态学模型: 仅使用从相差图像提取的形态学参数

3. 关键技术组件

  • GC-ViT Transformer: 全局上下文视觉Transformer作为骨干网络
  • 形态学特征: 头部长度、宽度、空泡存在、顶体区域等参数
  • 特征融合: 自适应模块选择视觉特征、形态学特征或两者结合
  • 分类头: 两层全连接网络(1024→256节点),使用LeakyReLU激活和Dropout正则化

技术创新点

  1. 多模态融合: 首次将Transformer视觉模型与精子形态学特征结合用于SDF检测
  2. 非破坏性检测: 突破传统化学检测的限制,实现保活检测
  3. 迁移学习策略: 针对小数据集采用层次化学习率衰减和早停策略
  4. 客观量化: 提供可重复的定量分析,减少人为主观性

实验设置

数据集

  • 样本来源: 35名同意患者的精液样本
  • 图像数量: 1825个图像三元组(明场、相差、荧光)
  • 标注分布:
    • 碎片化: 512个
    • 未碎片化: 715个
    • 无法判断: 591个(已排除)
  • 数据划分:
    • 训练集: 1017张图像(28名患者)
    • 验证集: 210张图像(7名患者)
    • 按患者分组避免数据泄露

评价指标

  • 敏感性(Sensitivity/Recall): 正确识别碎片化精子的比例
  • 特异性(Specificity): 正确识别未碎片化精子的比例
  • 精确率(Precision): 预测为碎片化中真正碎片化的比例
  • 准确率(Accuracy): 总体分类正确率
  • F1分数: 精确率和召回率的调和平均数
  • ROC曲线: 受试者工作特征曲线

对比方法

  • GC-ViT纯视觉模型
  • 纯形态学模型
  • 集成模型

实现细节

  • 优化器: Adam,初始学习率5×10⁻⁵
  • 学习率策略: 层次化衰减(衰减因子0.12),预热比例0.1
  • 损失函数: 二元交叉熵
  • 正则化: Dropout(0.6, 0.3),早停(10轮)
  • 数据增强: 随机旋转和翻转
  • 训练轮数: 最大50轮

实验结果

主要结果

模型类型敏感性特异性精确率准确率F1分数
集成模型0.600.750.600.690.60
形态学模型0.780.440.470.570.59
纯视觉模型0.780.460.480.590.60

关键发现

  1. 集成模型表现最佳: 在平衡性能方面优于单一模态模型,实现了敏感性和特异性的良好平衡
  2. 专家内差异: 同一专家在10个月后重新标注的一致性仅为81%,患者水平SDF百分比的绝对平均差异为13.7%±19.5%
  3. 模型稳定性: 学习曲线显示模型未出现明显过拟合,ROC曲线显著优于随机分类

案例分析

  • 正确分类案例: 集成模型能够平衡视觉和形态学信息,在单一模态失效时仍能正确分类
  • 误分类案例: 主要由于图像中存在多个精子尾部或图像模糊导致形态学测量错误

相关工作

传统SDF检测方法

  • TUNEL检测: 金标准但破坏精子活力
  • 其他方法: AOT、CMA3、SCSA、COMET、SCD等,结果不一致

AI在精子分析中的应用

  • Serrano Berenguer等(2022): 使用随机森林和CNN预测COMET结果
  • Wang等(2019): 基于AOT数据的线性和非线性回归模型,测试准确率82.7%
  • 本研究优势: 非破坏性、多模态融合、实时处理能力

结论与讨论

主要结论

  1. 成功开发了基于AI的非破坏性SDF检测工具
  2. 集成模型实现了60%敏感性和75%特异性的平衡性能
  3. 为辅助生殖技术中的精子选择提供了新的解决方案

局限性

  1. 数据集规模: 相对较小的数据集限制了模型性能的进一步提升
  2. 单一专家标注: 缺乏多专家标注来评估专家间差异
  3. 敏感性有待提高: 60%的敏感性仍有改进空间

未来方向

  1. 扩大训练数据集规模
  2. 进行多中心临床验证
  3. 集成多种SDF检测方法的洞察
  4. 开发实时临床应用系统

深度评价

优点

  1. 临床意义重大: 解决了生殖医学中的实际临床需求
  2. 技术创新性强: 首次将Transformer与形态学特征结合用于SDF检测
  3. 方法学严谨: 按患者分组避免数据泄露,量化了专家内差异
  4. 实用价值高: 非破坏性检测保持精子活力,适用于临床应用

不足

  1. 样本量限制: 1825个样本对于深度学习模型相对较小
  2. 单中心研究: 缺乏多中心验证,泛化能力有待验证
  3. 性能仍需提升: 60%敏感性对于临床应用可能不够理想
  4. 缺乏成本效益分析: 未提供与传统方法的经济性比较

影响力

  1. 学术贡献: 为AI在生殖医学中的应用提供了新思路
  2. 临床转化潜力: 有望改善ART成功率,造福不孕患者
  3. 技术推广价值: 可扩展到其他医学图像分析任务

适用场景

  1. IVF/ICSI程序: 术前精子质量评估和选择
  2. 男性不育诊断: 提供客观的SDF评估
  3. 生殖医学研究: 标准化的SDF检测工具
  4. 远程医疗: 自动化分析减少对专业人员的依赖

参考文献

本研究引用了生殖医学、机器学习和图像处理领域的重要文献,包括WHO精液检查手册、TUNEL检测标准协议、以及近年来AI在医学图像分析中的应用研究等关键参考文献。


总体评价: 这是一项具有重要临床价值的跨学科研究,将先进的AI技术应用于解决生殖医学中的实际问题。尽管在数据规模和性能方面还有提升空间,但其非破坏性检测的创新理念和多模态融合的技术路线为该领域的发展指明了方向。