2025-11-12T18:16:10.275762

A Novel Approach using CapsNet and Deep Belief Network for Detection and Identification of Oral Leukopenia

GV, M, S
Oral cancer constitutes a significant global health concern, resulting in 277,484 fatalities in 2023, with the highest prevalence observed in low- and middle-income nations. Facilitating automation in the detection of possibly malignant and malignant lesions in the oral cavity could result in cost-effective and early disease diagnosis. Establishing an extensive repository of meticulously annotated oral lesions is essential. In this research photos are being collected from global clinical experts, who have been equipped with an annotation tool to generate comprehensive labelling. This research presents a novel approach for integrating bounding box annotations from various doctors. Additionally, Deep Belief Network combined with CAPSNET is employed to develop automated systems that extracted intricate patterns to address this challenging problem. This study evaluated two deep learning-based computer vision methodologies for the automated detection and classification of oral lesions to facilitate the early detection of oral cancer: image classification utilizing CAPSNET. Image classification attained an F1 score of 94.23% for detecting photos with lesions 93.46% for identifying images necessitating referral. Object detection attained an F1 score of 89.34% for identifying lesions for referral. Subsequent performances are documented about classification based on the sort of referral decision. Our preliminary findings indicate that deep learning possesses the capability to address this complex problem.
academic

ওরাল ক্যান্সার সনাক্তকরণ এবং চিহ্নিতকরণের জন্য CapsNet এবং Deep Belief Network ব্যবহার করে একটি উপন্যাস পদ্ধতি

মৌলিক তথ্য

  • পেপার আইডি: 2501.00876
  • শিরোনাম: গভীর শিক্ষা কৌশল ব্যবহার করে ওরাল ক্যান্সারের উন্নত শ্রেণীবিভাগ
  • লেখক: ডক্টর সেন্থিল পান্ডি এস, হিরথিক ম্যাথেশ জিভি, কাভিন চক্রবর্তী এম (রাজলক্ষ্মী ইঞ্জিনিয়ারিং কলেজ, চেন্নাই, ভারত)
  • শ্রেণীবিভাগ: eess.IV cs.CV cs.LG
  • গবেষণা ক্ষেত্র: চিকিৎসা চিত্র প্রক্রিয়াকরণ, গভীর শিক্ষা, কম্পিউটার দৃষ্টিভঙ্গি
  • পেপার লিংক: https://arxiv.org/abs/2501.00876

সারসংক্ষেপ

ওরাল ক্যান্সার বিশ্বব্যাপী একটি গুরুতর স্বাস্থ্য সমস্যা, যা ২০২৩ সালে ২৭৭,৪৮৪ জনের মৃত্যু ঘটিয়েছে এবং মধ্য-নিম্ন আয়ের দেশগুলিতে সর্বোচ্চ ঘটনা রয়েছে। এই গবেষণা CapsNet এবং Deep Belief Network (DBN) একত্রিত করে ওরাল ক্ষত স্বয়ংক্রিয় সনাক্তকরণ এবং শ্রেণীবিভাগের জন্য একটি নতুন পদ্ধতি প্রস্তাব করে। গবেষণা বিশ্বব্যাপী ক্লিনিকাল বিশেষজ্ঞদের থেকে চিত্র ডেটা সংগ্রহ করেছে এবং ব্যাপক লেবেলিংয়ের জন্য টীকা সরঞ্জাম দিয়ে সজ্জিত। এই পদ্ধতি চিত্র শ্রেণীবিভাগ কাজে ক্ষত চিত্র সনাক্তকরণের জন্য ৯৪.২৩% F1 স্কোর এবং রেফারেল প্রয়োজনীয় চিত্র চিহ্নিত করার জন্য ৯৩.৪৬% F1 স্কোর অর্জন করেছে, লক্ষ্য সনাক্তকরণ কাজে ৮৯.৩৪% F1 স্কোর অর্জন করেছে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার গুরুত্ব

১. বৈশ্বিক স্বাস্থ্য বোঝা: ওরাল ক্যান্সার বিশ্বব্যাপী একটি গুরুতর স্বাস্থ্য সমস্যা, ২০২১ সালের GLOBOCAN ৩৮৭,৮৬৪ নতুন কেস এবং ২৩৪,৩৮৪ মৃত্যুর পূর্বাভাস দিয়েছে ২. ভৌগোলিক পার্থক্য: তিন-চতুর্থাংশ কেস নিম্ন আয়ের দেশে ঘটে, আফ্রিকা এবং ভারত বৈশ্বিক কেসের অর্ধেক প্রতিনিধিত্ব করে ३. নির্ণয়ের বিলম্ব: নিম্ন-মধ্যম আয়ের দেশগুলিতে (LMICs), দুই-তৃতীয়াংশেরও বেশি কেস দেরিতে আবিষ্কৃত হয়, যার ফলে বেঁচে থাকার হার কম ४. অর্থনৈতিক বোঝা: ক্যান্সার চিকিৎসার খরচ অত্যন্ত বেশি, বিশেষত দেরিতে নির্ণয়ের ক্ষেত্রে

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

१. পেশাদার ঘাটতি: বিশেষজ্ঞ ডাক্তার এবং চিকিৎসা সংস্থানের অভাব, বিশেষত LMICs অঞ্চলে २. নির্ণয়ের বিষয়গত: ঐতিহ্যবাহী নির্ণয় ক্লিনিকাল চিকিৎসকের অভিজ্ঞতার উপর নির্ভর করে, মানসম্মত পদ্ধতির অভাব ३. সরঞ্জাম প্রয়োজনীয়তা: বিদ্যমান গভীর শিক্ষা পদ্ধতি ব্যয়বহুল সরঞ্জাম বা বিশেষভাবে ডিজাইন করা স্ক্রীনিং প্ল্যাটফর্ম প্রয়োজন ४. অ্যাক্সেসযোগ্যতা সমস্যা: ROI এর উচ্চ বৃদ্ধি পরীক্ষার প্রয়োজনীয়তা ব্যাপক প্রয়োগ সীমিত করে

গবেষণা প্রেরণা

१. খরচ-কার্যকর প্রাথমিক নির্ণয় স্বয়ংক্রিয় সিস্টেম বিকাশ २. মোবাইল ডিভাইস চিত্র ব্যবহার করে টেলিমেডিসিন স্ক্রীনিং ३. স্ক্রীনিং প্রোগ্রামের রেফারেল নির্ভুলতা উন্নত করা ४. বিশেষ সরঞ্জাম এবং কর্মীদের উপর নির্ভরতা হ্রাস করা

মূল অবদান

१. উদ্ভাবনী স্থাপত্য: CapsNet এবং Deep Belief Network (DBN) একত্রিত করে একটি হাইব্রিড গভীর শিক্ষা কাঠামো প্রস্তাব করা २. বহু-ডাক্তার টীকা সংমিশ্রণ: একাধিক ডাক্তার সীমানা বাক্স টীকা একীভূত করার জন্য একটি নতুন পদ্ধতি বিকাশ ३. উচ্চ-কর্মক্ষমতা সনাক্তকরণ: ওরাল ক্ষত সনাক্তকরণ এবং শ্রেণীবিভাগ কাজে উৎকৃষ্ট কর্মক্ষমতা অর্জন ४. ব্যবহারিক ডিজাইন: মোবাইল ডিভাইস চিত্রের জন্য বাস্তব প্রয়োগ দৃশ্যের জন্য ডিজাইন করা

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

  • ইনপুট: ওরাল গহ্বর চিত্র (মোবাইল ডিভাইস বা ক্লিনিকাল ডিভাইস থেকে)
  • আউটপুট: ক্ষত সনাক্তকরণ ফলাফল, শ্রেণীবিভাগ লেবেল, রেফারেল সুপারিশ
  • লক্ষ্য: স্বয়ংক্রিয়ভাবে ওরাল ক্ষত চিহ্নিত করা এবং ম্যালিগন্যান্সি গ্রেড শ্রেণীবিভাগ করা

মডেল স্থাপত্য

१. হাইব্রিড স্থাপত্য ডিজাইন

এই গবেষণা দ্বারা প্রস্তাবিত হাইব্রিড মডেল দুটি মূল উপাদান একত্রিত করে:

  • CapsNet: চিত্র শ্রেণীবিভাগ কাজের জন্য
  • Deep Belief Network (DBN): বৈশিষ্ট্য নিষ্কাশন এবং প্যাটার্ন স্বীকৃতির জন্য

२. CapsNet উপাদান

মূল ধারণা: মানব মস্তিষ্কে "ক্যাপসুল" প্রক্রিয়াকরণ ইউনিট অনুকরণ করা

  • ক্যাপসুল কাঠামো: প্রতিটি ক্যাপসুল চিত্রে একটি নির্দিষ্ট সত্তা প্রতিনিধিত্ব করে, নিউরন অবস্থা সত্তা বৈশিষ্ট্য এনকোড করে
  • ভেক্টর আউটপুট: আউটপুট ভেক্টর দৈর্ঘ্য সত্তা উপস্থিতি সম্ভাবনা প্রতিনিধিত্ব করে, দিক সত্তা বৈশিষ্ট্য প্রতিফলিত করে
  • গতিশীল রুটিং: "সামঞ্জস্য রুটিং" প্রক্রিয়া মাধ্যমে ঐতিহ্যবাহী সর্বাধিক পুলিং প্রতিস্থাপন
  • সংকোচন ফাংশন: ভেক্টর আউটপুটে অরৈখিক রূপান্তর প্রয়োগ করা, উপযুক্ত স্কেল প্রতিনিধিত্ব নিশ্চিত করা

প্রযুক্তিগত সুবিধা:

ঐতিহ্যবাহী CNN: স্তর-স্তর স্ট্যাকিং → বৈশিষ্ট্য হারানো
CapsNet: স্তরযুক্ত নেস্টিং → স্থানিক সম্পর্ক বজায় রাখা

३. Deep Belief Network (DBN)

প্রাক-প্রক্রিয়াকরণ প্রবাহ: १. চিত্র সাদা করা: সংলগ্ন পিক্সেলের মধ্যে সম্পর্ক হ্রাস করা, ভেরিয়েন্স স্ট্যান্ডার্ডাইজ করা २. ছোট ব্যাচ প্রক্রিয়াকরণ: ইনপুট ডেটা র্যান্ডমলি বিভক্ত করা, শব্দ প্রভাব হ্রাস করা

নেটওয়ার্ক কাঠামো:

  • তিন-স্তর DBN স্থাপত্য: নিউরোব্লাস্টোমা হিস্টোলজি চিত্র বৈশিষ্ট্য নিষ্কাশনের জন্য
  • CRBM স্ট্যাকিং: উল্লম্বভাবে স্ট্যাক করা কনভোলিউশনাল সীমাবদ্ধ বোলটজম্যান মেশিন
  • স্তরযুক্ত কাঠামো: দৃশ্যমান স্তর (RK×RK) → লুকানো স্তর (N গ্রুপ MQ×MQ ইউনিট) → পুলিং স্তর

মূল পরামিতি:

  • নিউরন মোট সংখ্যা
  • লুকানো স্তর গ্রুপ সংখ্যা
  • ছোট ব্যাচ আকার

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. ক্যাপসুল নেটওয়ার্ক প্রয়োগ: ওরাল ক্যান্সার সনাক্তকরণে CapsNet এর প্রথম প্রয়োগ, স্থানিক স্তরযুক্ত তথ্য বজায় রাখা २. হাইব্রিড স্থাপত্য: DBN এবং CapsNet এর কার্যকর সংমিশ্রণ, প্রতিটি সুবিধা কাজে লাগানো ३. বহু-ডাক্তার টীকা: সীমানা বাক্স টীকা সংমিশ্রণের উদ্ভাবনী কৌশল ४. শেষ থেকে শেষ শিক্ষা: কাঁচা চিত্র থেকে চূড়ান্ত নির্ণয় সুপারিশ পর্যন্ত সম্পূর্ণ প্রক্রিয়া

পরীক্ষামূলক সেটআপ

ডেটাসেট

  • ডেটা উৎস: বিশ্বব্যাপী ক্লিনিকাল বিশেষজ্ঞদের দ্বারা সংগৃহীত ওরাল চিত্র
  • টীকা পদ্ধতি: বহু-ডাক্তার সীমানা বাক্স টীকা
  • ডেটা বৃদ্ধি: ঘূর্ণন, ফ্লিপিং ইত্যাদি প্রযুক্তি প্রশিক্ষণ সেট প্রসারিত করা
  • প্রাক-প্রক্রিয়াকরণ:
    • রঙ স্ট্যান্ডার্ডাইজেশন রঙ পার্থক্য দূর করা
    • মধ্যম ফিল্টারিং শব্দ হ্রাস করা
    • চিত্র বৃদ্ধি অতিফিটিং হ্রাস করা

মূল্যায়ন মেট্রিক্স

  • F1 স্কোর: নির্ভুলতা এবং স্মরণের সুরেলা গড়
  • নির্ভুলতা (Precision): সঠিক পূর্বাভাসিত ইতিবাচক উদাহরণ সমস্ত পূর্বাভাসিত ইতিবাচক উদাহরণের অনুপাত
  • স্মরণ (Recall): সঠিক পূর্বাভাসিত ইতিবাচক উদাহরণ সমস্ত প্রকৃত ইতিবাচক উদাহরণের অনুপাত
  • নির্ভুলতা (Accuracy): সামগ্রিক সঠিক পূর্বাভাসের অনুপাত

প্রশিক্ষণ কৌশল

  • প্রশিক্ষণ রাউন্ড: প্রাথমিক ১০ রাউন্ড, পরে ৩০ রাউন্ডে প্রসারিত
  • প্রাথমিক থামার কৌশল: ১২ তম রাউন্ডে সর্বোত্তম যাচাইকরণ নির্ভুলতা ৯৭.১% অর্জনের পরে থামা
  • ক্ষতি ফাংশন: প্রশিক্ষণ এবং যাচাইকরণ ক্ষতি উভয়ই হ্রাসমান প্রবণতা এবং স্থিতিশীল হওয়ার দিকে

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

সামগ্রিক কর্মক্ষমতা সূচক

  • চিত্র শ্রেণীবিভাগ:
    • ক্ষত সনাক্তকরণ: F1 স্কোর ৯৪.২৩%
    • রেফারেল স্বীকৃতি: F1 স্কোর ৯३.४६%
  • লক্ষ্য সনাক্তকরণ:
    • রেফারেল ক্ষত স্বীকৃতি: F1 স্কোর ৮९.३४%

বিস্তারিত শ্রেণীবিভাগ ফলাফল

চিত্র বিভাগনির্ভুলতা(%)স্মরণ(%)F1 স্কোর(%)
কোন ক্ষত সনাক্ত নয়90.8691.2380.65
রেফারেল প্রয়োজন নেই93.2690.2194.52
অন্যান্য কারণে পরিদর্শন89.3291.2480.15
নিম্ন ক্যান্সার ঝুঁকি90.8889.2387.21
উচ্চ ক্যান্সার ঝুঁকি94.2490.2184.21

প্রশিক্ষণ প্রক্রিয়া বিশ্লেষণ

  • নির্ভুলতা পরিবর্তন: প্রথম ১२ রাউন্ডে সূচকীয় বৃদ্ধি, পরে স্থিতিশীল
  • চূড়ান্ত প্রশিক্ষণ নির্ভুলতা: ९४.२८%
  • চূড়ান্ত যাচাইকরণ নির্ভুলতা: ९४.५५%
  • ক্ষতি মূল্য: প্রশিক্ষণ ক্ষতি ०.१८४३२, যাচাইকরণ ক্ষতি ०.१६५४३

পরীক্ষামূলক আবিষ্কার

१. সংমিশ্রণ বৈশিষ্ট্য: মডেল ३० রাউন্ডের মধ্যে কার্যকরভাবে সংমিশ্রিত হয় २. সাধারণীকরণ ক্ষমতা: প্রশিক্ষণ এবং যাচাইকরণ বক্ররেখা প্রবণতা সামঞ্জস্যপূর্ণ, ভাল সাধারণীকরণ প্রদর্শন করে ३. স্থিতিশীলতা: ক্ষতি ফাংশন মসৃণভাবে হ্রাস পায়, মডেল প্রশিক্ষণ স্থিতিশীল ४. কর্মক্ষমতা স্তরবিন্যাস: বিভিন্ন ঝুঁকি স্তরের সনাক্তকরণ কর্মক্ষমতায় পার্থক্য রয়েছে

সম্পর্কিত কাজ

ঐতিহ্যবাহী পদ্ধতি বিবর্তন

१. টেক্সচার বৈশিষ্ট্য: প্রাথমিক গবেষণা ধূসর এবং টেক্সচার বৈশিষ্ট্যে কেন্দ্রীভূত २. উচ্চতর প্রযুক্তি: পরবর্তী গবেষণা উচ্চতর ইমেজিং প্রযুক্তি এবং টেক্সচার শক্তি আইন প্রবর্তন করেছে ३. গভীর শিক্ষা: ImageNet প্রতিযোগিতার পরে চিকিৎসা চিত্রে CNN ব্যাপকভাবে প্রয়োগ করা হয়েছে

বিদ্যমান গভীর শিক্ষা পদ্ধতি

१. বহু-মোডাল পদ্ধতি: রোগীর মেটাডেটা একত্রিত করে বহু-মোডাল গভীর শিক্ষা কাঠামো (নির্ভুলতা ८७%) २. Ada Boosting: পাঁচটি রঙ স্থান ব্যবহার করে পদ্ধতি (নির্ভুলতা ९७.२५%) ३. সমষ্টি শিক্ষা: প্রাক-প্রশিক্ষিত CNN সমষ্টি মডেল (নির্ভুলতা ९७.८८%) ४. স্থানান্তর শিক্ষা: ResNet50 ইত্যাদি প্রাক-প্রশিক্ষিত মডেলের প্রয়োগ

এই পত্রের সুবিধা

१. কম সরঞ্জাম প্রয়োজনীয়তা: মোবাইল ডিভাইস চিত্রের জন্য উপযুক্ত, পেশাদার সরঞ্জামের প্রয়োজন নেই २. স্থাপত্য উদ্ভাবন: CapsNet+DBN এর অনন্য সমন্বয় ३. শক্তিশালী ব্যবহারিকতা: বাস্তব ক্লিনিকাল প্রয়োগ দৃশ্যের জন্য ডিজাইন করা

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. প্রযুক্তিগত সম্ভাব্যতা: গভীর শিক্ষা ওরাল ক্যান্সার সনাক্তকরণের জটিল সমস্যা সমাধানের ক্ষমতা রাখে २. উৎকৃষ্ট কর্মক্ষমতা: একাধিক মূল্যায়ন সূচকে ९०% এর উপরে কর্মক্ষমতা অর্জন ३. ক্লিনিকাল মূল্য: প্রাথমিক নির্ণয় এবং রেফারেল সিদ্ধান্ত সমর্থন করতে পারে

সীমাবদ্ধতা

१. ডেটাসেট আকার: ডেটাসেটের নির্দিষ্ট আকার স্পষ্টভাবে বলা হয়নি २. ক্রস-জাতি যাচাইকরণ: বিভিন্ন জনসংখ্যার যাচাইকরণ ফলাফলের অভাব ३. রিয়েল-টাইম কর্মক্ষমতা: মডেল অনুমান সময় এবং গণনামূলক জটিলতা রিপোর্ট করা হয়নি ४. শিরোনাম অসামঞ্জস্য: পত্রের শিরোনাম "Oral Leukopenia" উল্লেখ করে কিন্তু বিষয়বস্তু প্রধানত ওরাল ক্যান্সারের উপর দৃষ্টি নিবদ্ধ করে

ভবিষ্যত দিকনির্দেশনা

१. বহু-মোডাল সংমিশ্রণ: আরও ক্লিনিকাল ডেটা প্রকার একীভূত করা २. জনসংখ্যা সম্প্রসারণ: আরও বিস্তৃত জনসংখ্যায় মডেল কর্মক্ষমতা যাচাই করা ३. রিয়েল-টাইম স্থাপনা: মোবাইল ডিভাইস রিয়েল-টাইম অনুমান সমর্থনের জন্য মডেল অপ্টিমাইজ করা ४. মানসম্মতকরণ: একীভূত মূল্যায়ন মান এবং ডেটাসেট প্রতিষ্ঠা করা

গভীর মূল্যায়ন

শক্তি

१. পদ্ধতি উদ্ভাবন: CapsNet এবং DBN এর সমন্বয় নতুনত্ব রাখে २. বাস্তব চাহিদা: বৈশ্বিক স্বাস্থ্য সমস্যার গুরুত্বপূর্ণ প্রয়োগ ३. উৎকৃষ্ট কর্মক্ষমতা: একাধিক সূচকে উচ্চ স্তর অর্জন ४. ব্যবহারিক ডিজাইন: বাস্তব স্থাপনার সম্ভাব্যতা বিবেচনা করা

অপূর্ণতা

१. তাত্ত্বিক বিশ্লেষণ: হাইব্রিড স্থাপত্যের গভীর তাত্ত্বিক বিশ্লেষণের অভাব २. তুলনামূলক পরীক্ষা: অন্যান্য SOTA পদ্ধতির সাথে তুলনা অপর্যাপ্ত ३. বিলোপন পরীক্ষা: প্রতিটি উপাদানের স্বাধীন অবদান সম্পূর্ণভাবে যাচাই করা হয়নি ४. সাধারণীকরণ যাচাইকরণ: ক্রস-ডেটাসেট যাচাইকরণ ফলাফলের অভাব

প্রভাব

१. একাডেমিক মূল্য: চিকিৎসা চিত্র বিশ্লেষণের জন্য নতুন প্রযুক্তিগত পথ প্রদান করে २. ব্যবহারিক মূল্য: সম্পদ সীমিত অঞ্চলে স্ক্রীনিংয়ে প্রয়োগের সম্ভাবনা ३. পুনরুৎপাদনযোগ্যতা: পুনরুৎপাদন সমর্থনের জন্য আরও বিস্তারিত বাস্তবায়ন বিবরণ প্রয়োজন

প্রযোজ্য দৃশ্যকল্প

१. টেলিমেডিসিন: বিশেষজ্ঞ ডাক্তারের অভাব এমন অঞ্চলের জন্য উপযুক্ত २. প্রাথমিক স্ক্রীনিং: ক্লিনিকাল পরীক্ষার সহায়ক সরঞ্জাম হিসাবে কাজ করতে পারে
३. শিক্ষা প্রশিক্ষণ: চিকিৎসা শিক্ষার্থী এবং সাধারণ চিকিৎসক প্রশিক্ষণে ব্যবহার করা যেতে পারে ४. বৃহৎ-স্কেল স্ক্রীনিং: জনসংখ্যা-স্তরের ওরাল ক্যান্সার স্ক্রীনিং প্রোগ্রাম সমর্থন করে

তথ্যসূত্র

পত্রটি ১५টি সম্পর্কিত গবেষণা উদ্ধৃত করেছে, যা ওরাল ক্যান্সার সনাক্তকরণ, গভীর শিক্ষা প্রয়োগ, বহু-মোডাল পদ্ধতি ইত্যাদি একাধিক দিক কভার করে, এই গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি এবং প্রযুক্তিগত তুলনা প্রদান করে।


সামগ্রিক মূল্যায়ন: এই গবেষণা ওরাল ক্যান্সার সনাক্তকরণের জন্য একটি উদ্ভাবনী হাইব্রিড গভীর শিক্ষা কাঠামো প্রস্তাব করেছে, যার গুরুত্বপূর্ণ ক্লিনিকাল প্রয়োগ মূল্য রয়েছে। যদিও তাত্ত্বিক বিশ্লেষণ এবং পরীক্ষামূলক যাচাইকরণে উন্নতির জায়গা রয়েছে, তবে বাস্তব চাহিদার প্রতি এর ডিজাইন পদ্ধতি এবং উৎকৃষ্ট কর্মক্ষমতা প্রদর্শন এটিকে এই ক্ষেত্রের একটি মূল্যবান অবদান করে তোলে।