এই পেপারটি RL4Seg3D উপস্থাপন করে, যা ২D+সময় অতিক্রম করে ইকোকার্ডিওগ্রাফি সেগমেন্টেশনের জন্য একটি অপর্যবেক্ষিত ডোমেইন অভিযোজন কাঠামো। এই পদ্ধতিটি অনুশীলন শিক্ষার মাধ্যমে স্পেসিও-টেম্পোরাল ডেটায় ডোমেইন অভিযোজন সমস্যার সমাধান করে, বিশেষত ইকোকার্ডিওগ্রাফিতে শিল্পকর্ম এবং শব্দের কারণে সেগমেন্টেশন কর্মক্ষমতা হ্রাসের ক্ষেত্রে। RL4Seg3D উপন্যাস পুরস্কার ফাংশন এবং সংমিশ্রণ প্রক্রিয়া একীভূত করে, সম্পূর্ণ আকারের ইনপুট ভিডিও প্রক্রিয়া করার সময় গুরুত্বপূর্ণ শারীরবৈজ্ঞানিক ল্যান্ডমার্কের নির্ভুলতা বৃদ্ধি করে। এই পদ্ধতিটি শুধুমাত্র নির্ভুলতা, শারীরবৈজ্ঞানিক বৈধতা এবং সময়গত সামঞ্জস্য উন্নত করে না, বরং শক্তিশালী অনিশ্চয়তা অনুমানকারী প্রদান করে যা পরীক্ষার সময় সেগমেন্টেশন কর্মক্ষমতা আরও বৃদ্ধি করতে পারে।
১. ডোমেইন অভিযোজন চ্যালেঞ্জ: ঐতিহ্যবাহী ডোমেইন অভিযোজন পদ্ধতি লক্ষ্য ডোমেইনে অপর্যাপ্ত নির্ভরযোগ্যতা প্রদর্শন করে, যা চিকিৎসা চিত্র বিভাজনে বিশেষভাবে গুরুত্বপূর্ণ কারণ নির্ভুলতা এবং শারীরবৈজ্ঞানিক বৈধতা অত্যন্ত গুরুত্বপূর্ণ २. স্পেসিও-টেম্পোরাল ডেটা জটিলতা: স্পেসিও-টেম্পোরাল ডেটায়, সময়গত সামঞ্জস্যের অভাব সেগমেন্টেশন গুণমান উল্লেখযোগ্যভাবে হ্রাস করে ३. ইকোকার্ডিওগ্রাফির বিশেষত্ব: ইকোকার্ডিওগ্রাফিতে শিল্পকর্ম এবং শব্দ সেগমেন্টেশন কর্মক্ষমতা আরও বাধাগ্রস্ত করে
१. २D পদ্ধতির সময়গত অসামঞ্জস্য: প্রতিটি ফ্রেম স্বাধীনভাবে প্রক্রিয়া করা সময়গত অসংগতি সৃষ্টি করে २. ডাউনস্যাম্পলিং তথ্য হ্রাস: বিদ্যমান পদ্ধতি সাধারণত কম রেজোলিউশন ইনপুটে কাজ করে ३. শারীরবৈজ্ঞানিক সীমাবদ্ধতার অভাব: ঐতিহ্যবাহী পদ্ধতি শারীরবৈজ্ঞানিক বৈধতা নিশ্চিত করতে অসুবিধা পায় ४. ভিত্তি মডেলের সীমাবদ্ধতা: SAM এবং অনুরূপ মডেল ভিডিও বিভাজনে সময়গত অসামঞ্জস্য সমস্যা প্রদর্শন করে
१. অনুশীলন শিক্ষা বিভাজন কাঠামো সম্প্রসারণ: RL4Seg কে ३D স্পেসিও-টেম্পোরাল বিভাজনে সম্প্রসারিত করা, একাধিক সমসাময়িক পুরস্কার প্রক্রিয়া সমর্থন করা २. সম্পূর্ণ আকারের ভিডিও প্রক্রিয়াকরণ: সম্পূর্ণ আকারের ইনপুট ভিডিওর সুসংগত প্রক্রিয়াকরণ বাস্তবায়ন, নতুন সময়গত সামঞ্জস্য এবং গুরুত্বপূর্ণ ল্যান্ডমার্ক নির্ভুলতা পুরস্কার টেমপ্লেট ডিজাইন করা ३. উন্নত অনিশ্চয়তা অনুমান: পুরস্কার নেটওয়ার্কের অনিশ্চয়তা অনুমান ক্ষমতা প্রসারিত করা, পিক্সেল-স্তরের স্পেসিও-টেম্পোরাল বিভাজনের আত্মবিশ্বাস মূল্যায়ন বাস্তবায়ন করা ४. পরীক্ষার সময় অপ্টিমাইজেশন প্রক্রিয়া: অনিশ্চয়তা অনুমান ব্যবহার করে চ্যালেঞ্জিং ভিডিও কর্মক্ষমতা উন্নত করার পরীক্ষার সময় অপ্টিমাইজেশন প্রক্রিয়া প্রবর্তন করা ५. বৃহৎ-স্কেল যাচাইকরণ: ৩০,০০০ এরও বেশি ইকোকার্ডিওগ্রাফি ভিডিওতে পদ্ধতির কার্যকারিতা এবং স্কেলেবিলিটি যাচাই করা
१. অবস্থা সংজ্ঞা: হল २D+সময় চিত্রের সময় স্লাইস, ক্রমাগত সম্পূর্ণ আকারের ফ্রেম সমন্বিত २. ক্রিয়া সংজ্ঞা: হল সংশ্লিষ্ট ক্রমাগত বিভাজন মানচিত্র ३. নীতি নেটওয়ার্ক: , ३D U-Net এর উপর ভিত্তি করে বাস্তবায়িত ४. পুরস্কার ফাংশন: ५. মূল্য ফাংশন:
সুবিধা ফাংশন সংজ্ঞায়িত করা হয়:
যেখানে ন্যূনতম অপারেশন নিশ্চিত করে যে নীতি প্রতিটি পিক্সেলের সবচেয়ে গুরুতর ত্রুটি অনুযায়ী সংশোধন করে।
१. উৎস ডোমেইন (): ৫৭৯টি সম্পূর্ণ মন্তব্যকৃত ইকোকার্ডিওগ্রাফি ভিডিও, ফ্রান্সের লিয়ন বিশ্ববিদ্যালয় হাসপাতাল থেকে
१. বিভাজন গুণমান: ডাইস সহগ, হাউসডর্ফ দূরত্ব (এন্ডোকার্ডিয়াম, এপিকার্ডিয়াম) २. শারীরবৈজ্ঞানিক বৈধতা: १०টি শারীরবৈজ্ঞানিক মান উপর ভিত্তি করে বৈধতা শতাংশ ३. সময়গত বৈধতা: ८টি সময়গত বৈশিষ্ট্য মসৃণতার উপর ভিত্তি করে সামঞ্জস্য শতাংশ ४. ল্যান্ডমার্ক নির্ভুলতা: মাইট্রাল ভালভ কমিসার্ড ল্যান্ডমার্কের "প্রতি চক্র ত্রুটি সংখ্যা (MpC)" সূচক
| পদ্ধতি | Dice(%) ↑ | Hausdorff(mm) ↓ | শারীরবৈজ্ঞানিক বৈধতা(%) ↑ | সময়গত বৈধতা(%) ↑ | MVC ল্যান্ডমার্ক ত্রুটি↓ |
|---|---|---|---|---|---|
| বিশেষজ্ঞ মধ্যে পরিবর্তনশীলতা | 94.9 | 4.6 | 100 | - | - |
| nnU-Net | 93.8 | 7.8 | 48.4 | 46.9 | 0.6 |
| MemSAM | 91.6 | 7.7 | 48.4 | 39.8 | 6.0 |
| MaskedSSL | 93.3 | 6.3 | 64.1 | 56.3 | 3.1 |
| RL4Seg3D | 94.2 | 4.9 | 96.9 | 85.9 | 1.1 |
| RL4Seg3D(TTO) | 94.2 | 4.7 | 99.2 | 93.0 | 1.0 |
१. শুধুমাত্র শারীরবৈজ্ঞানিক পুরস্কার: Dice 93.5%, শারীরবৈজ্ঞানিক বৈধতা 98.4% २. শারীরবৈজ্ঞানিক+ল্যান্ডমার্ক পুরস্কার: Dice 94.2%, ল্যান্ডমার্ক ত্রুটি উল্লেখযোগ্যভাবে 1.1 এ হ্রাস ३. সময়গত শাস্তি যোগ করা: সময়গত বৈধতা 88.3% এ উন্নত ४. পরীক্ষার সময় অপ্টিমাইজেশন: আরও 93.0% সময়গত বৈধতায় উন্নত
१. প্রতিনিধিত্ব শিক্ষা: মুখোশ পুনর্নির্মাণ, বৈপরীত্য শিক্ষা २. ছদ্ম লেবেল পদ্ধতি: স্ব-শিক্ষা, শিক্ষক-শিক্ষার্থী স্থাপত্য, আত্মবিশ্বাস থ্রেশহোল্ড ३. চিত্র থেকে চিত্র রূপান্তর: বিস্তার মডেল, GAN পদ্ধতি
१. SAM সিরিজ: চিকিৎসা চিত্রে MedSAM, SAMUS প্রয়োগ २. ভিডিও SAM: MemSAM স্মৃতি মডিউলের মাধ্যমে সময়গত সামঞ্জস্য উন্নত করা
१. ল্যান্ডমার্ক সনাক্তকরণ: বহু-স্কেল গভীর অনুশীলন শিক্ষা २. RLHF: মানব প্রতিক্রিয়া থেকে শিক্ষা, ChatGPT এর মতো প্রশিক্ষণ পদ্ধতি ३. RL4Seg: २D বিভাজনের অনুশীলন শিক্ষা কাঠামো
१. RL4Seg3D একাধিক সূচকে সর্বোত্তম কর্মক্ষমতা অর্জন করেছে, বিশেষজ্ঞ মধ্যে পরিবর্তনশীলতার উপরের সীমার কাছাকাছি २. বহুগুণ পুরস্কার সংমিশ্রণ প্রক্রিয়া বিভিন্ন ধরনের বিভাজন ত্রুটি কার্যকরভাবে উন্নত করে ३. ३D কনভোলিউশন এবং সময়গত সীমাবদ্ধতা সময়গত সামঞ্জস্য উল্লেখযোগ্যভাবে উন্নত করে ४. অনিশ্চয়তা অনুমান এবং পরীক্ষার সময় অপ্টিমাইজেশন পদ্ধতির ব্যবহারিকতা আরও বৃদ্ধি করে
१. গণনা সম্পদের প্রয়োজন: বিতরণকৃত প্রশিক্ষণের জন্য বিশাল GPU প্রয়োজন २. ব্যাচ আকার সীমাবদ্ধতা: পরিবর্তনশীল চিত্র আকারের কারণে, ব্যাচ আকার १ এ সীমাবদ্ধ ३. সময় জটিলতা: প্রান্ত থেকে প্রান্ত প্রশিক্ষণের জন্য প্রায় २ দিন সময় প্রয়োজন ४. অবশিষ্ট ত্রুটি: প্রধানত দ্রুত হৃদস্পন্দন গতির কারণে সামান্য সময়গত অসামঞ্জস্য
१. আরও ব্যাপক সময়গত পুরস্কার প্রক্রিয়া: দ্রুত হৃদস্পন্দন গতি পরিচালনা করা २. ভলিউম ডেটায় সম্প্রসারণ: ३D চিকিৎসা চিত্র বিভাজন ३. বহু-মোডেলিটি সংমিশ্রণ: অন্যান্য চিকিৎসা ইমেজিং মোডেলিটি একত্রিত করা ४. রিয়েল-টাইম প্রয়োগ: ক্লিনিকাল রিয়েল-টাইম প্রয়োগ সমর্থনের জন্য অনুমান গতি অপ্টিমাইজ করা
१. পদ্ধতি উদ্ভাবনী: প্রথমবারের মতো অনুশীলন শিক্ষা ३D স্পেসিও-টেম্পোরাল চিকিৎসা চিত্র বিভাজনে সম্প্রসারিত, চতুর পুরস্কার সংমিশ্রণ প্রক্রিয়া ডিজাইন করা २. পরীক্ষা সম্পূর্ণতা: ३०,०००ের বেশি ভিডিওতে যাচাই, একাধিক তুলনা পদ্ধতি এবং বিস্তারিত বিলোপন পরীক্ষা অন্তর্ভুক্ত ३. ক্লিনিকাল প্রাসঙ্গিকতা: শারীরবৈজ্ঞানিক বৈধতা, সময়গত সামঞ্জস্য ইত্যাদি ক্লিনিকাল মূল সূচকে মনোযোগ দেওয়া ४. প্রযুক্তি সম্পূর্ণতা: অনিশ্চয়তা অনুমান এবং পরীক্ষার সময় অপ্টিমাইজেশন ইত্যাদি ব্যবহারিক কার্যকারিতা প্রদান করা
१. গণনা জটিলতা উচ্চ: বিশাল গণনা সম্পদের প্রয়োজন, ব্যবহারিক প্রয়োগ সীমাবদ্ধ করতে পারে २. ডেটা নির্ভরতা: যদিও অপর্যবেক্ষিত ডোমেইন অভিযোজন, তবুও উৎস ডোমেইনের উচ্চ-মানের মন্তব্যের প্রয়োজন ३. মূল্যায়ন সীমাবদ্ধতা: পরীক্ষা সেট তুলনামূলকভাবে ছোট (१२८টি ভিডিও), ফলাফলের সাধারণীকরণকে প্রভাবিত করতে পারে ४. পদ্ধতি জটিলতা: একাধিক উপাদানের সমন্বয় সামঞ্জস্য কঠিনতা বৃদ্ধি করতে পারে
१. একাডেমিক অবদান: চিকিৎসা চিত্র ডোমেইন অভিযোজনের জন্য নতুন অনুশীলন শিক্ষা প্যারাডাইম প্রদান করা २. ব্যবহারিক মূল্য: ক্লিনিকাল ইকোকার্ডিওগ্রাফি বিশ্লেষণে সরাসরি প্রয়োগ করা যায় ३. পুনরুৎপাদনযোগ্যতা: সম্পূর্ণ কোড বাস্তবায়ন প্রদান করা ४. অনুপ্রেরণা: অন্যান্য স্পেসিও-টেম্পোরাল চিকিৎসা চিত্র কাজের জন্য রেফারেন্স কাঠামো প্রদান করা
१. চিকিৎসা চিত্র বিভাজন: বিশেষত সময়গত সামঞ্জস্যের প্রয়োজন এমন গতিশীল চিকিৎসা চিত্র २. ডোমেইন অভিযোজন কাজ: হাসপাতাল জুড়ে, ডিভাইস জুড়ে চিকিৎসা চিত্র বিশ্লেষণ ३. গুণমান নিয়ন্ত্রণ: অনিশ্চয়তা অনুমান ব্যবহার করে স্বয়ংক্রিয় গুণমান মূল্যায়ন ४. ক্লিনিকাল সহায়ক নির্ণয়: ক্লিনিকাল সিদ্ধান্ত সমর্থন করার জন্য নির্ভরযোগ্য বিভাজন ফলাফল প্রদান করা
१. Judge et al. "Domain adaptation of echocardiography segmentation via reinforcement learning." MICCAI 2024. २. Painchaud et al. "Echocardiography segmentation with enforced temporal consistency." IEEE TMI 2022. ३. Kirillov et al. "Segment anything." ICCV 2023. ४. Isensee et al. "nnU-Net: a self-configuring method for deep learning-based biomedical image segmentation." Nature Methods 2021.
সারসংক্ষেপ: এই পেপারে প্রস্তাবিত RL4Seg3D চিকিৎসা চিত্র বিভাজন ক্ষেত্রের একটি গুরুত্বপূর্ণ অবদান, যা অনুশীলন শিক্ষা কাঠামোর মাধ্যমে স্পেসিও-টেম্পোরাল চিকিৎসা চিত্রের ডোমেইন অভিযোজন সমস্যা চতুরভাবে সমাধান করে। পদ্ধতিটি প্রযুক্তিগতভাবে উদ্ভাবনী, পরীক্ষা যাচাইকরণ সম্পূর্ণ, ফলাফল বিশ্বাসযোগ্য। যদিও গণনা জটিলতা উচ্চ ইত্যাদি সীমাবদ্ধতা রয়েছে, তবে ক্লিনিকাল প্রয়োগে এর সম্ভাবনা এবং ক্ষেত্র উন্নয়নে এর প্রচারমূলক ভূমিকা অস্বীকার করা যায় না।