2025-11-13T13:28:10.924524

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

Jacobs, Morris, Shaik et al.
Sperm DNA fragmentation (SDF) is a critical parameter in male fertility assessment that conventional semen analysis fails to evaluate. This study presents the validation of a novel artificial intelligence (AI) tool designed to detect SDF through digital analysis of phase contrast microscopy images, using the terminal deoxynucleotidyl transferase dUTP nick end labeling (TUNEL) assay as the gold standard reference. Utilising the established link between sperm morphology and DNA integrity, the present work proposes a morphology assisted ensemble AI model that combines image processing techniques with state-of-the-art transformer based machine learning models (GC-ViT) for the prediction of DNA fragmentation in sperm from phase contrast images. The ensemble model is benchmarked against a pure transformer `vision' model as well as a `morphology-only` model. Promising results show the proposed framework is able to achieve sensitivity of 60\% and specificity of 75\%. This non-destructive methodology represents a significant advancement in reproductive medicine by enabling real-time sperm selection based on DNA integrity for clinical diagnostic and therapeutic applications.
academic

कृत्रिम बुद्धिमत्ता उपकरण का सत्यापन शुक्राणु DNA विखंडन की पहचान के लिए TUNEL इन सीटू संकरण परीक्षण का उपयोग करते हुए

मूल जानकारी

  • पेपर ID: 2510.11142
  • शीर्षक: कृत्रिम बुद्धिमत्ता उपकरण का सत्यापन शुक्राणु DNA विखंडन की पहचान के लिए TUNEL इन सीटू संकरण परीक्षण का उपयोग करते हुए
  • लेखक: B. A. Jacobs, A. Morris, I. Shaik, F. Lin
  • वर्गीकरण: cs.CV (कंप्यूटर विजन)
  • प्रकाशन तिथि: 13 अक्टूबर 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.11142v1

सारांश

शुक्राणु DNA विखंडन (SDF) पुरुष प्रजनन क्षमता मूल्यांकन में एक महत्वपूर्ण पैरामीटर है, लेकिन पारंपरिक वीर्य विश्लेषण इस संकेतक का मूल्यांकन नहीं कर सकता। यह अध्ययन एक नए कृत्रिम बुद्धिमत्ता उपकरण का प्रस्ताव और सत्यापन करता है जो विभेदक हस्तक्षेप सूक्ष्मदर्शी छवियों के डिजिटल विश्लेषण के माध्यम से SDF का पता लगाता है, जिसमें टर्मिनल डीऑक्सीन्यूक्लिओटिडाइल ट्रांसफेरेज़ dUTP निक एंड लेबलिंग (TUNEL) परीक्षण को स्वर्ण मानक संदर्भ के रूप में उपयोग किया जाता है। शुक्राणु आकृति विज्ञान और DNA अखंडता के बीच स्थापित संबंध का लाभ उठाते हुए, यह अध्ययन एक आकृति विज्ञान-सहायक एकीकृत AI मॉडल प्रस्तावित करता है जो छवि प्रसंस्करण तकनीकों और अत्याधुनिक Transformer-आधारित मशीन लर्निंग मॉडल (GC-ViT) को जोड़ता है ताकि विभेदक छवियों में शुक्राणु के DNA विखंडन की भविष्यवाणी की जा सके। एकीकृत मॉडल की तुलना शुद्ध Transformer दृश्य मॉडल और केवल आकृति विज्ञान-आधारित मॉडल से की गई। परिणाम दर्शाते हैं कि प्रस्तावित ढांचा 60% संवेदनशीलता और 75% विशिष्टता प्राप्त कर सकता है। यह गैर-विनाशकारी विधि DNA अखंडता के आधार पर वास्तविक समय शुक्राणु चयन को सक्षम करके प्रजनन चिकित्सा में नैदानिक और चिकित्सीय अनुप्रयोगों में महत्वपूर्ण प्रगति लाती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

  1. मुख्य समस्या: पारंपरिक वीर्य विश्लेषण शुक्राणु DNA विखंडन (SDF) का मूल्यांकन नहीं कर सकता, जो प्रजनन क्षमता का एक महत्वपूर्ण पैरामीटर है, और SDF निषेचन दर में कमी, भ्रूण विकास में क्षति, गर्भपात दर में वृद्धि आदि से जुड़ा है।
  2. नैदानिक महत्व:
    • बांझपन विश्व स्तर पर लगभग 15% प्रजनन आयु के दंपतियों को प्रभावित करता है, जिनमें से पुरुष कारक 30-50% का प्रतिनिधित्व करते हैं
    • SDF सहायक प्रजनन तकनीक (ART) की सफलता दर को सीधे प्रभावित करता है
    • मौजूदा पहचान विधियां शुक्राणु जीवन शक्ति को नष्ट करती हैं, बाद के उपचार के लिए उपयोग नहीं की जा सकतीं
  3. मौजूदा विधियों की सीमाएं:
    • TUNEL परीक्षण: विशेष उपकरण और प्रशिक्षित कर्मियों की आवश्यकता, समय लेने वाली और महंगी, निर्धारण और रंगाई प्रक्रिया शुक्राणु को निष्क्रिय करती है
    • पहचान विधि असंगति: AOT, CMA3, SCSA, COMET, SCD आदि कई पहचान विधियों के परिणाम असंगत हैं
    • उच्च व्यक्तिपरकता: मैनुअल व्याख्या में विशेषज्ञ के भीतर और विशेषज्ञों के बीच अंतर मौजूद है
  4. अनुसंधान प्रेरणा: AI-आधारित गैर-विनाशकारी, तेज़, उद्देश्यपूर्ण SDF पहचान उपकरण विकसित करना जो बाद के ART प्रक्रियाओं के लिए शुक्राणु जीवन शक्ति को बनाए रख सके।

मुख्य योगदान

  1. आकृति विज्ञान-सहायक एकीकृत AI मॉडल प्रस्तावित किया: छवि प्रसंस्करण तकनीकों और GC-ViT Transformer मॉडल को जोड़ता है, शुक्राणु आकृति विज्ञान और DNA अखंडता के संबंध का उपयोग करके भविष्यवाणी करता है
  2. गैर-विनाशकारी पहचान विधि विकसित की: केवल विभेदक सूक्ष्मदर्शी छवियों का उपयोग करके SDF पहचान, बाद के उपचार के लिए शुक्राणु जीवन शक्ति को बनाए रखता है
  3. टिप्पणीकृत डेटासेट का निर्माण किया: 35 रोगियों से 1825 शुक्राणु छवि त्रिगुण (उज्ज्वल क्षेत्र, विभेदक, प्रतिदीप्ति) युक्त
  4. विशेषज्ञ के भीतर अंतर को परिमाणित किया: डिजिटल विश्लेषण के माध्यम से पारंपरिक मैनुअल मूल्यांकन की व्यक्तिपरकता समस्या को प्रकट किया (विशेषज्ञ के भीतर सहमति केवल 81%)
  5. प्रदर्शन बेंचमार्क स्थापित किए: 60% संवेदनशीलता और 75% विशिष्टता के स्तर पर AI-सहायक उपकरण की व्यवहार्यता को सत्यापित किया

विधि विवरण

कार्य परिभाषा

  • इनपुट: शुक्राणु की विभेदक सूक्ष्मदर्शी छवि
  • आउटपुट: द्विआधारी वर्गीकरण परिणाम (DNA विखंडित/अविखंडित)
  • बाधाएं: गैर-विनाशकारी, वास्तविक समय प्रसंस्करण, जीवंत और मृत शुक्राणु दोनों के लिए लागू

मॉडल आर्किटेक्चर

1. एकीकृत मॉडल (Ensemble Model)

इनपुट: विभेदक छवि + आकृति विज्ञान विशेषताएं
     ↓
GC-ViT Transformer → दृश्य विशेषताएं
     ↓
आकृति विज्ञान विशेषता निष्कर्षण → आकृति विज्ञान विशेषताएं  
     ↓
विशेषता संलयन मॉड्यूल → वर्गीकरण शीर्ष (1024→256 नोड्स)
     ↓
आउटपुट: DNA विखंडन संभावना

2. तुलनात्मक मॉडल

  • शुद्ध दृश्य मॉडल: केवल विभेदक छवि को संसाधित करने के लिए GC-ViT का उपयोग
  • शुद्ध आकृति विज्ञान मॉडल: केवल विभेदक छवि से निकाली गई आकृति विज्ञान पैरामीटर का उपयोग

3. मुख्य तकनीकी घटक

  • GC-ViT Transformer: वैश्विक संदर्भ दृश्य Transformer रीढ़ नेटवर्क के रूप में
  • आकृति विज्ञान विशेषताएं: सिर की लंबाई, चौड़ाई, रिक्तिका उपस्थिति, शीर्ष क्षेत्र आदि पैरामीटर
  • विशेषता संलयन: स्व-अनुकूली मॉड्यूल दृश्य विशेषताएं, आकृति विज्ञान विशेषताएं या दोनों का संयोजन चुनता है
  • वर्गीकरण शीर्ष: दो-स्तरीय पूर्ण कनेक्टेड नेटवर्क (1024→256 नोड्स), LeakyReLU सक्रियण और Dropout नियमितकरण का उपयोग

तकनीकी नवाचार बिंदु

  1. बहु-मोडल संलयन: पहली बार SDF पहचान के लिए Transformer दृश्य मॉडल को शुक्राणु आकृति विज्ञान विशेषताओं के साथ जोड़ा गया
  2. गैर-विनाशकारी पहचान: पारंपरिक रासायनिक पहचान की सीमाओं को तोड़ता है, जीवंत पहचान को सक्षम करता है
  3. स्थानांतरण शिक्षा रणनीति: छोटे डेटासेट के लिए स्तरीय शिक्षण दर क्षय और प्रारंभिक रोक रणनीति को अपनाता है
  4. उद्देश्यपूर्ण परिमाणीकरण: पुनरावृत्तिशील परिमाणात्मक विश्लेषण प्रदान करता है, मानवीय व्यक्तिपरकता को कम करता है

प्रायोगिक सेटअप

डेटासेट

  • नमूना स्रोत: 35 सहमत रोगियों के वीर्य नमूने
  • छवि संख्या: 1825 छवि त्रिगुण (उज्ज्वल क्षेत्र, विभेदक, प्रतिदीप्ति)
  • टिप्पणी वितरण:
    • विखंडित: 512
    • अविखंडित: 715
    • अनिर्धारणीय: 591 (बाहर रखा गया)
  • डेटा विभाजन:
    • प्रशिक्षण सेट: 1017 छवियां (28 रोगी)
    • सत्यापन सेट: 210 छवियां (7 रोगी)
    • डेटा रिसाव से बचने के लिए रोगी स्तर पर विभाजन

मूल्यांकन संकेतक

  • संवेदनशीलता (Sensitivity/Recall): विखंडित शुक्राणु की सही पहचान का अनुपात
  • विशिष्टता (Specificity): अविखंडित शुक्राणु की सही पहचान का अनुपात
  • सटीकता (Precision): विखंडित के रूप में भविष्यवाणी किए गए में वास्तव में विखंडित का अनुपात
  • सही दर (Accuracy): कुल वर्गीकरण सही दर
  • F1 स्कोर: सटीकता और पुनः प्राप्ति दर का हार्मोनिक माध्य
  • ROC वक्र: प्राप्तकर्ता ऑपरेटिंग विशेषता वक्र

तुलनात्मक विधियां

  • GC-ViT शुद्ध दृश्य मॉडल
  • शुद्ध आकृति विज्ञान मॉडल
  • एकीकृत मॉडल

कार्यान्वयन विवरण

  • अनुकूलक: Adam, प्रारंभिक शिक्षण दर 5×10⁻⁵
  • शिक्षण दर रणनीति: स्तरीय क्षय (क्षय कारक 0.12), वार्मअप अनुपात 0.1
  • हानि फ़ंक्शन: द्विआधारी क्रॉस-एंट्रॉपी
  • नियमितकरण: Dropout (0.6, 0.3), प्रारंभिक रोक (10 राउंड)
  • डेटा वृद्धि: यादृच्छिक घुमाव और फ्लिप
  • प्रशिक्षण राउंड: अधिकतम 50 राउंड

प्रायोगिक परिणाम

मुख्य परिणाम

मॉडल प्रकारसंवेदनशीलताविशिष्टतासटीकतासही दरF1 स्कोर
एकीकृत मॉडल0.600.750.600.690.60
आकृति विज्ञान मॉडल0.780.440.470.570.59
शुद्ध दृश्य मॉडल0.780.460.480.590.60

मुख्य निष्कर्ष

  1. एकीकृत मॉडल सर्वश्रेष्ठ प्रदर्शन करता है: संतुलित प्रदर्शन में एकल-मोडल मॉडल से बेहतर है, संवेदनशीलता और विशिष्टता का अच्छा संतुलन प्राप्त करता है
  2. विशेषज्ञ के भीतर अंतर: एक ही विशेषज्ञ द्वारा 10 महीने बाद पुनः टिप्पणी की गई सहमति केवल 81% है, रोगी स्तर SDF प्रतिशत में पूर्ण औसत अंतर 13.7%±19.5% है
  3. मॉडल स्थिरता: शिक्षण वक्र दर्शाते हैं कि मॉडल में स्पष्ट अतिसज्जन नहीं है, ROC वक्र यादृच्छिक वर्गीकरण से महत्वपूर्ण रूप से बेहतर है

केस विश्लेषण

  • सही वर्गीकृत केस: एकीकृत मॉडल दृश्य और आकृति विज्ञान जानकारी को संतुलित कर सकता है, एकल-मोडल विफल होने पर भी सही वर्गीकरण कर सकता है
  • गलत वर्गीकृत केस: मुख्य रूप से छवि में कई शुक्राणु पूंछ या छवि धुंधलापन के कारण आकृति विज्ञान माप त्रुटि के कारण

संबंधित कार्य

पारंपरिक SDF पहचान विधियां

  • TUNEL परीक्षण: स्वर्ण मानक लेकिन शुक्राणु जीवन शक्ति को नष्ट करता है
  • अन्य विधियां: AOT, CMA3, SCSA, COMET, SCD आदि, परिणाम असंगत हैं

AI में शुक्राणु विश्लेषण में अनुप्रयोग

  • Serrano Berenguer et al. (2022): COMET परिणाम की भविष्यवाणी के लिए यादृच्छिक वन और CNN का उपयोग
  • Wang et al. (2019): AOT डेटा पर आधारित रैखिक और गैर-रैखिक प्रतिगमन मॉडल, परीक्षण सटीकता 82.7%
  • इस अध्ययन के लाभ: गैर-विनाशकारी, बहु-मोडल संलयन, वास्तविक समय प्रसंस्करण क्षमता

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. AI-आधारित गैर-विनाशकारी SDF पहचान उपकरण का सफलतापूर्वक विकास किया गया
  2. एकीकृत मॉडल 60% संवेदनशीलता और 75% विशिष्टता का संतुलित प्रदर्शन प्राप्त करता है
  3. सहायक प्रजनन तकनीक में शुक्राणु चयन के लिए नया समाधान प्रदान करता है

सीमाएं

  1. डेटासेट आकार: अपेक्षाकृत छोटा डेटासेट मॉडल प्रदर्शन में और सुधार को सीमित करता है
  2. एकल विशेषज्ञ टिप्पणी: विशेषज्ञों के बीच अंतर का मूल्यांकन करने के लिए बहु-विशेषज्ञ टिप्पणी की कमी
  3. संवेदनशीलता में सुधार की आवश्यकता: 60% संवेदनशीलता में अभी भी सुधार की गुंजाइश है

भविष्य की दिशा

  1. प्रशिक्षण डेटासेट आकार का विस्तार करना
  2. बहु-केंद्र नैदानिक सत्यापन आयोजित करना
  3. कई SDF पहचान विधियों की अंतर्दृष्टि को एकीकृत करना
  4. वास्तविक समय नैदानिक अनुप्रयोग प्रणाली विकसित करना

गहन मूल्यांकन

शक्तियां

  1. नैदानिक महत्व महत्वपूर्ण: प्रजनन चिकित्सा में वास्तविक नैदानिक आवश्यकता को हल करता है
  2. तकनीकी नवाचार मजबूत: पहली बार SDF पहचान के लिए Transformer को आकृति विज्ञान विशेषताओं के साथ जोड़ा गया
  3. पद्धति कठोर: डेटा रिसाव से बचने के लिए रोगी स्तर पर विभाजन, विशेषज्ञ के भीतर अंतर को परिमाणित किया गया
  4. व्यावहारिक मूल्य उच्च: गैर-विनाशकारी पहचान शुक्राणु जीवन शक्ति को बनाए रखता है, नैदानिक अनुप्रयोग के लिए उपयुक्त

कमियां

  1. नमूना मात्रा सीमा: 1825 नमूने गहन शिक्षण मॉडल के लिए अपेक्षाकृत छोटे हैं
  2. एकल-केंद्र अध्ययन: बहु-केंद्र सत्यापन की कमी, सामान्यीकरण क्षमता सत्यापन की आवश्यकता है
  3. प्रदर्शन में सुधार की आवश्यकता: 60% संवेदनशीलता नैदानिक अनुप्रयोग के लिए अपर्याप्त हो सकती है
  4. लागत-प्रभावशीलता विश्लेषण की कमी: पारंपरिक विधियों के साथ आर्थिक तुलना प्रदान नहीं की गई

प्रभाव

  1. शैक्षणिक योगदान: प्रजनन चिकित्सा में AI अनुप्रयोग के लिए नई सोच प्रदान करता है
  2. नैदानिक अनुवाद संभावना: ART सफलता दर में सुधार की संभावना, बांझ रोगियों को लाभान्वित करता है
  3. तकनीकी प्रचार मूल्य: अन्य चिकित्सा छवि विश्लेषण कार्यों तक विस्तारित किया जा सकता है

लागू परिदृश्य

  1. IVF/ICSI प्रक्रिया: शल्य-पूर्व शुक्राणु गुणवत्ता मूल्यांकन और चयन
  2. पुरुष बांझपन निदान: उद्देश्यपूर्ण SDF मूल्यांकन प्रदान करता है
  3. प्रजनन चिकित्सा अनुसंधान: मानकीकृत SDF पहचान उपकरण
  4. दूरस्थ चिकित्सा: स्वचालित विश्लेषण विशेषज्ञ कर्मियों पर निर्भरता को कम करता है

संदर्भ

यह अनुसंधान प्रजनन चिकित्सा, मशीन लर्निंग और छवि प्रसंस्करण क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें WHO वीर्य परीक्षा पुस्तिका, TUNEL पहचान मानक प्रोटोकॉल, और हाल के वर्षों में चिकित्सा छवि विश्लेषण में AI अनुप्रयोग अनुसंधान के मुख्य संदर्भ शामिल हैं।


समग्र मूल्यांकन: यह प्रजनन चिकित्सा में वास्तविक समस्याओं को हल करने के लिए उन्नत AI तकनीक को लागू करने वाला महत्वपूर्ण नैदानिक मूल्य का एक अंतःविषय अनुसंधान है। हालांकि डेटा आकार और प्रदर्शन के संदर्भ में सुधार की गुंजाइश है, इसके गैर-विनाशकारी पहचान की नवीन अवधारणा और बहु-मोडल संलयन की तकनीकी रणनीति इस क्षेत्र के विकास के लिए दिशा निर्धारित करती है।