2025-11-14T10:40:11.215635

MSM-Seg: A Modality-and-Slice Memory Framework with Category-Agnostic Prompting for Multi-Modal Brain Tumor Segmentation

Luo, Xu, Huang et al.
Multi-modal brain tumor segmentation is critical for clinical diagnosis, and it requires accurate identification of distinct internal anatomical subregions. While the recent prompt-based segmentation paradigms enable interactive experiences for clinicians, existing methods ignore cross-modal correlations and rely on labor-intensive category-specific prompts, limiting their applicability in real-world scenarios. To address these issues, we propose a MSM-Seg framework for multi-modal brain tumor segmentation. The MSM-Seg introduces a novel dual-memory segmentation paradigm that synergistically integrates multi-modal and inter-slice information with the efficient category-agnostic prompt for brain tumor understanding. To this end, we first devise a modality-and-slice memory attention (MSMA) to exploit the cross-modal and inter-slice relationships among the input scans. Then, we propose a multi-scale category-agnostic prompt encoder (MCP-Encoder) to provide tumor region guidance for decoding. Moreover, we devise a modality-adaptive fusion decoder (MF-Decoder) that leverages the complementary decoding information across different modalities to improve segmentation accuracy. Extensive experiments on different MRI datasets demonstrate that our MSM-Seg framework outperforms state-of-the-art methods in multi-modal metastases and glioma tumor segmentation. The code is available at https://github.com/xq141839/MSM-Seg.
academic

MSM-Seg: বহু-মোডাল ব্রেইন টিউমার সেগমেন্টেশনের জন্য মোডালিটি-এবং-স্লাইস মেমরি ফ্রেমওয়ার্ক এবং ক্যাটাগরি-অজ্ঞেয় প্রম্পটিং

মৌলিক তথ্য

  • পেপার আইডি: 2510.10679
  • শিরোনাম: MSM-Seg: A Modality-and-Slice Memory Framework with Category-Agnostic Prompting for Multi-Modal Brain Tumor Segmentation
  • লেখক: Yuxiang Luo, Qing Xu, Hai Huang, Yuqi Ouyang, Zhen Chen, Wenting Duan
  • শ্রেণীবিভাগ: cs.CV (কম্পিউটার ভিশন)
  • প্রকাশিত জার্নাল: IEEE Transactions on Medical Imaging
  • পেপার লিঙ্ক: https://arxiv.org/abs/2510.10679
  • কোড লিঙ্ক: https://github.com/xq141839/MSM-Seg

সারসংক্ষেপ

বহু-মোডাল ব্রেইন টিউমার সেগমেন্টেশন ক্লিনিক্যাল ডায়াগনসিসের জন্য অত্যন্ত গুরুত্বপূর্ণ এবং বিভিন্ন অভ্যন্তরীণ শারীরিক উপ-অঞ্চলগুলির সঠিক চিহ্নিতকরণের প্রয়োজন। যদিও সম্প্রতি প্রম্পট-ভিত্তিক সেগমেন্টেশন প্যারাডাইম ক্লিনিশিয়ানদের জন্য ইন্টারঅ্যাক্টিভ অভিজ্ঞতা প্রদান করেছে, বিদ্যমান পদ্ধতিগুলি ক্রস-মোডালিটি সম্পর্ক উপেক্ষা করে, শ্রম-নিবিড় ক্যাটাগরি-নির্দিষ্ট প্রম্পটের উপর নির্ভর করে এবং বাস্তব পরিস্থিতিতে এর প্রয়োগযোগ্যতা সীমিত করে। এই সমস্যাগুলি সমাধানের জন্য, আমরা বহু-মোডাল ব্রেইন টিউমার সেগমেন্টেশনের জন্য MSM-Seg ফ্রেমওয়ার্ক প্রস্তাব করি। MSM-Seg একটি উপন্যাস দ্বৈত-মেমরি সেগমেন্টেশন প্যারাডাইম প্রবর্তন করে যা দক্ষ ক্যাটাগরি-অজ্ঞেয় প্রম্পটিংয়ের সাথে বহু-মোডাল এবং স্লাইস-মধ্যস্থ তথ্য সহযোগিতামূলকভাবে একীভূত করে ব্রেইন টিউমার বোঝার জন্য।

গবেষণা পটভূমি এবং প্রেরণা

মূল সমস্যা

  1. বহু-মোডাল ব্রেইন টিউমার সেগমেন্টেশনের জটিলতা: একযোগে বিষমজাতীয় টিউমার উপাদান চিহ্নিত করার প্রয়োজন, যার মধ্যে রয়েছে বৈপরীত্য-বর্ধিত মূল, নেক্রোটিক অঞ্চল এবং পেরিটিউমোরাল এডিমা, প্রতিটি টিউমার গ্রেডিং এবং চিকিৎসা সিদ্ধান্তের জন্য বিভিন্ন ক্লিনিক্যাল বায়োমার্কার প্রদান করে।
  2. বিদ্যমান পদ্ধতির সীমাবদ্ধতা:
    • ক্লাসিক্যাল 3D বহু-মোডাল সেগমেন্টেশন ফ্রেমওয়ার্ক ভলিউম প্রসেসিংয়ের অন্তর্নিহিত গণনামূলক অদক্ষতার দ্বারা সীমাবদ্ধ
    • সংলগ্ন স্লাইসগুলির মধ্যে প্রাকৃতিক ক্রমিক সম্পর্ক উপেক্ষা করে
    • SAM2 এর মতো পদ্ধতিগুলি প্রম্পট হিসাবে ক্যাটাগরি-নির্দিষ্ট টীকা নির্ভর করে, যা শ্রম-নিবিড় ম্যানুয়াল টীকা প্রয়োজন
    • বিদ্যমান পদ্ধতিগুলি সাধারণত বিভিন্ন MRI মোডালিটি স্বাধীনভাবে প্রক্রিয়া করে বা সাধারণ পূর্ববর্তী সংযোগের মাধ্যমে, মোডালিটি জুড়ে সমৃদ্ধ পরিপূরক তথ্য সম্পূর্ণভাবে ব্যবহার করতে ব্যর্থ

গবেষণা প্রেরণা

বিভিন্ন MRI মোডালিটির শক্তিশালী পরিপূরক সম্পর্ক রয়েছে: FLAIR সিকোয়েন্স পেরিটিউমোরাল এডিমা এবং উচ্চ-সংকেত ক্ষত প্রদর্শনে পারদর্শী, যখন T1c সিকোয়েন্স সক্রিয় টিউমার অঞ্চল এবং রক্ত-মস্তিষ্ক বাধা ব্যাহতের বৈপরীত্য-বর্ধিত ভিজ্যুয়ালাইজেশন প্রদান করে। এই পরিপূরক সম্পর্ক একটি একীভূত ফ্রেমওয়ার্ক বিকাশের প্রয়োজনীয়তা অনুপ্রাণিত করে যা কার্যকরভাবে ক্রস-মোডালিটি সম্পর্ক এবং স্থানিক ধারাবাহিকতা ক্যাপচার করতে পারে।

মূল অবদান

  1. দ্বৈত-মেমরি সেগমেন্টেশন প্যারাডাইম প্রস্তাব: ইনপুট স্ক্যানে ক্রস-মোডালিটি এবং স্লাইস-মধ্যস্থ সম্পর্ক ব্যবহার করে টিউমার উপ-অঞ্চলের ব্যাপক বোঝাপড়া অর্জন করে
  2. মোডালিটি এবং স্লাইস মেমরি অ্যাটেনশন মেকানিজম (MSMA) ডিজাইন করা: ক্রস-মোডালিটি এবং স্লাইস-মধ্যস্থ সম্পর্ক দক্ষতার সাথে ব্যবহার করে বহু-মোডাল বৈশিষ্ট্য প্রতিনিধিত্ব উন্নত করে
  3. মাল্টি-স্কেল ক্যাটাগরি-অজ্ঞেয় প্রম্পট এনকোডার (MCP-Encoder) বিকাশ করা: টিউমার অঞ্চল নির্দেশনা প্রদান করে এবং মোডালিটি-অভিযোজিত ফিউশন ডিকোডার (MF-Decoder) ডিজাইন করে
  4. গ্লিওমা এবং মেটাস্ট্যাটিক টিউমার ডেটাসেটে উল্লেখযোগ্য কর্মক্ষমতা উন্নতি অর্জন করা: বিদ্যমান অত্যাধুনিক সেগমেন্টেশন পদ্ধতিকে অতিক্রম করে

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

বহু-মোডাল MRI স্ক্যান {X_{t,m}} দেওয়া, যেখানে t ∈ {1,...,T} স্লাইস সূচক নির্দেশ করে, m ∈ {1,...,M} মোডালিটি সূচক নির্দেশ করে, লক্ষ্য হল সঠিক ব্রেইন টিউমার সেগমেন্টেশন মাস্ক তৈরি করা যা বর্ধিত টিউমার (ET), টিউমার মূল (TC) এবং সম্পূর্ণ টিউমার (WT) তিনটি শ্রেণিবদ্ধ অঞ্চল চিহ্নিত করে।

মডেল আর্কিটেকচার

1. দ্বৈত-মেমরি সেগমেন্টেশন প্যারাডাইম

মূল ধারণা হল ক্রমবর্ধমান মেমরি একীকরণ প্রতিষ্ঠা করা যা সম্পূর্ণ টিউমার কাঠামোর প্রতি বোঝাপড়া ক্রমান্বয়ে পরিমার্জিত করে। ইনপুট স্লাইস X_{t,m} দেওয়া, মডেল সম্ভাব্য অবস্থা S_{t,m} ∈ R^{C×H×W} বজায় রাখে, আপডেট নিয়ম হল:

{S_{t,m} = R(X_{t,m}, θ_{t,m}, S_{t,≺m}, S_{≺t})
{Ŷ_{t,m} = P(S_{t,m})

যেখানে:

  • R(·) হল অবস্থা আপডেট ফাংশন
  • P(·) হল সেগমেন্টেশন পূর্বাভাস হেড
  • S_{t,≺m} বর্তমান স্লাইস t এর পূর্ববর্তী মোডালিটির ক্রস-মোডালিটি প্রসঙ্গ প্রতিনিধিত্ব করে
  • S_{≺t} পূর্ববর্তী স্লাইসের স্লাইস-মধ্যস্থ প্রসঙ্গ প্রতিনিধিত্ব করে
  • θ_{t,m} হল দক্ষ ক্যাটাগরি-অজ্ঞেয় প্রম্পট

2. মোডালিটি এবং স্লাইস মেমরি অ্যাটেনশন (MSMA)

চ্যানেল মাত্রা বরাবর ইমেজ এম্বেডিং F সমানভাবে বিভক্ত করুন:

[F_slice, F_modal] = Split(F)

স্ব-অ্যাটেনশনের মাধ্যমে এম্বেডিং আপডেট করুন:

Q_slice = SA(φ(F_slice)), Q_modal = SA(φ(F_modal))

মেমরি লাইব্রেরি তথ্য একীভূত করতে ক্রস-অ্যাটেনশন প্রয়োগ করুন:

Z = CA(Q=Q_slice, K=V=S_{≺t}) + CA(Q=Q_modal, K=V=S_{≺t,m})

3. মাল্টি-স্কেল ক্যাটাগরি-অজ্ঞেয় প্রম্পট এনকোডার (MCP-Encoder)

দুটি মোড সমর্থন করে:

  • ক্যাটাগরি-অজ্ঞেয় প্রম্পট মোড: শুধুমাত্র সম্পূর্ণ টিউমার অঞ্চল কভার করে এমন একটি একক সীমানা বাক্স প্রয়োজন
  • স্বয়ংক্রিয় মোড: কোনো ম্যানুয়াল টীকা প্রয়োজন নেই, স্বাধীনভাবে টিউমার অঞ্চল নির্দেশনা উৎপন্ন করে

মাল্টি-স্কেল ফিউশন প্রক্রিয়া:

F^fusion_i = {
    Concat(F^fusion_{i-1}, F_i, G_i), if prompt available
    Concat(F^fusion_{i-1}, F_i), otherwise
}

চূড়ান্ত টিউমার অঞ্চল নির্দেশনা:

P = DS(σ(φ(F^fusion_l)))

4. মোডালিটি-অভিযোজিত ফিউশন ডিকোডার (MF-Decoder)

প্রতিটি মোডালিটি m এ স্লাইস t এর জন্য, মেমরি-বর্ধিত এম্বেডিং Z_{t,m} এবং সংশ্লিষ্ট টিউমার নির্দেশনা P_{t,m} গ্রহণ করে। উপাদান-স্তরের যোগের মাধ্যমে প্রম্পট এম্বেডিং ফিউজ করুন:

H_{t,m} = Z_{t,m} ⊕ P_{t,m}

মোডালিটি-নির্দিষ্ট পূর্বাভাস উৎপন্ন করুন:

Ŷ_{t,m} = P_pd(H_{t,m}) ⊗ P_mlp(E_{t,m})

চূড়ান্ত সেগমেন্টেশন মাস্ক অভিযোজিত ওজন কৌশলের মাধ্যমে অর্জিত হয়:

Ŷ_t = Σ_{m=1}^M w_m · Ŷ_{t,m}

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

  1. দ্বৈত-মেমরি মেকানিজম: প্রথমবারের মতো একযোগে ক্রস-মোডালিটি এবং স্লাইস-মধ্যস্থ সম্পর্ক মডেল করে, মোডালিটি এবং স্লাইসের মধ্যে বিচ্ছিন্নতা ভাঙে
  2. ক্যাটাগরি-অজ্ঞেয় প্রম্পট: শ্রম-নিবিড় ক্যাটাগরি-নির্দিষ্ট টীকা থেকে মুক্ত হয়, ক্লিনিক্যাল প্রয়োগযোগ্যতা বৃদ্ধি করে
  3. মোডালিটি-অভিযোজিত ফিউশন: প্রতিটি ভক্সেলের জন্য গতিশীলভাবে সবচেয়ে তথ্যপূর্ণ মোডালিটি নির্বাচন করে
  4. মেমরি-বর্ধিত অ্যাটেনশন: দীর্ঘ-দূরত্বের নির্ভরতা এবং প্রসঙ্গ তথ্য কার্যকরভাবে ক্যাপচার করে

পরীক্ষামূলক সেটআপ

ডেটাসেট

BraTS-METS: ব্রেইন মেটাস্ট্যাটিক টিউমার সেগমেন্টেশন ডেটাসেট, 652টি মাল্টি-কন্ট্রাস্ট MRI পরীক্ষা অন্তর্ভুক্ত করে, T1, T1c, T2, FLAIR চারটি মোডালিটি জুড়ে বিস্তৃত

BraTS-AGPT: প্রাপ্তবয়স্ক চিকিৎসা-পরবর্তী গ্লিওমা সেগমেন্টেশন ডেটাসেট, 1,349টি কেস অন্তর্ভুক্ত করে, চিকিৎসা হস্তক্ষেপের পরে অবশিষ্ট বা পুনরাবৃত্ত গ্লিওমা সেগমেন্টেশনে ফোকাস করে

মূল্যায়ন মেট্রিক্স

  • Dice সাদৃশ্য সহগ: সেগমেন্টেশন গুণমান পরিমাপ করে, উচ্চতর মান ভাল কর্মক্ষমতা নির্দেশ করে
  • 95% হাউসডর্ফ দূরত্ব (HD95): সীমানা বর্ণনার নির্ভুলতা মূল্যায়ন করে, নিম্ন মান আরও সঠিক সীমানা নির্দেশ করে

তিনটি শ্রেণিবদ্ধ টিউমার অঞ্চল মূল্যায়ন করুন:

  • বর্ধিত টিউমার (ET): বর্ধিত টিউমার অঞ্চল
  • টিউমার মূল (TC): ET এবং চারপাশের অ-বর্ধিত FLAIR উচ্চ-সংকেতের সংমিশ্রণ
  • সম্পূর্ণ টিউমার (WT): TC এবং অ-বর্ধিত টিউমার মূলের সংমিশ্রণ

তুলনামূলক পদ্ধতি

ঐতিহ্যবাহী পদ্ধতি (TransBTS, EoFormer, 3D-TransUNet, UNETR++, nnUnet-V2, SegMamba-V2) এবং প্রম্পট-ভিত্তিক পদ্ধতি (SAM, MA-SAM, SAM2, MedSAM-2, SAM2-Adapter, SAMed-2) অন্তর্ভুক্ত করে

বাস্তবায়ন বিবরণ

  • হার্ডওয়্যার: NVIDIA A6000 GPU
  • অপ্টিমাইজার: AdamW (β1=0.9, β2=0.999)
  • শেখার হার: 1×10^-4, ওজন ক্ষয় 0.01
  • ব্যাচ আকার: 16, প্রশিক্ষণ যুগ: 300
  • ইমেজ আকার: 256×256
  • মোডালিটি মেমরি লাইব্রেরি k=3, স্লাইস মেমরি লাইব্রেরি n=7

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

BraTS-METS ডেটাসেট:

  • MSM-Seg 79.51% গড় Dice স্কোর অর্জন করে, সর্বোত্তম ঐতিহ্যবাহী পদ্ধতি SegMamba-V2 (73.92%) কে 5.59% অতিক্রম করে
  • সর্বোত্তম প্রম্পট পদ্ধতি SAMed-2 (77.47%) এর তুলনায় 2.04% উন্নতি
  • HD95 SAMed-2 এর 14.27mm থেকে 13.75mm এ হ্রাস পায়

BraTS-AGPT ডেটাসেট:

  • MSM-Seg 83.84% গড় Dice স্কোর অর্জন করে, SegMamba-V2 (76.49%) কে 7.35% অতিক্রম করে
  • SAMed-2 (81.44%) এর তুলনায় 2.40% উন্নতি
  • HD95 SAMed-2 এর 6.12mm থেকে 5.56mm এ হ্রাস পায়

অ্যাবলেশন পরীক্ষা

সিস্টেমেটিক অ্যাবলেশন গবেষণা প্রতিটি উপাদানের অবদান যাচাই করে:

  1. MSMA: 0.65% এবং 0.81% Dice উন্নতি প্রদান করে
  2. MCP-Encoder: অতিরিক্ত 0.87% এবং 1.07% উন্নতিতে অবদান রাখে
  3. MF-Decoder: আরও 1.08% এবং 1.33% বৃদ্ধি করে
  4. দ্বৈত-মেমরি প্যারাডাইম: সবচেয়ে উল্লেখযোগ্য অবদান, গড় 1.73% এবং 2.08% উন্নতি

মেমরি ক্ষমতা বিশ্লেষণ

মোডালিটি মেমরি ক্ষমতা: k=0 থেকে k=3 পর্যন্ত বৃদ্ধি ক্রমাগত কর্মক্ষমতা উন্নতি দেখায়, k=3 সর্বোত্তম ফলাফল অর্জন করে, গড় Dice 5.13% এবং 3.98% উন্নতি

স্লাইস মেমরি ক্ষমতা: n=0 থেকে n=16 পর্যন্ত উল্লেখযোগ্য উন্নতি দেখায়, n=8 নির্ভুলতা এবং দক্ষতার সর্বোত্তম ভারসাম্য প্রদান করে

মোডালিটি সিকোয়েন্স দৃঢ়তা

t-পরীক্ষা বিশ্লেষণ বিভিন্ন মোডালিটি ইনপুট সিকোয়েন্সের মধ্যে কোনো উল্লেখযোগ্য পার্থক্য দেখায় না (P মান > 0.05), MSM-Seg এর মোডালিটি সিকোয়েন্স পরিবর্তনের প্রতি উল্লেখযোগ্য দৃঢ়তা প্রমাণ করে।

সম্পর্কিত কাজ

বহু-মোডাল ব্রেইন টিউমার সেগমেন্টেশন

প্রাথমিক গবেষণা 3D CNN এর সাথে U-আকৃতির এনকোডার-ডিকোডার ফ্রেমওয়ার্ক গ্রহণ করেছে। সাম্প্রতিক পদ্ধতিগুলি স্থানীয় স্থানিক প্যাটার্ন এবং বৈশ্বিক প্রসঙ্গ তথ্য ক্যাপচার করতে 3D CNN কে ভিশন ট্রান্সফর্মারের সাথে একীভূত করে। বর্তমান গবেষণা ভিশন Mamba এবং RWKV দিয়ে ViT প্রতিস্থাপন অন্বেষণ করে রৈখিক গণনামূলক জটিলতার সাথে দীর্ঘ-দূরত্বের নির্ভরতা মডেল করতে।

মেমরি-ভিত্তিক প্রম্পট সেগমেন্টেশন

মেমরি মেকানিজম ভিডিও অবজেক্ট সেগমেন্টেশন কাজে ব্যাপকভাবে প্রয়োগ করা হয়। SAM2 জটিল মেমরি লাইব্রেরি এবং মেমরি অ্যাটেনশন মেকানিজম প্রবর্তন করে ভলিউম স্ক্যানে ক্রমিক স্লাইসের মধ্যে পূর্বাভাস সামঞ্জস্য উন্নত করতে। পরবর্তী কাজ যেমন ReSurgSAM2, Medical SAM2 ইত্যাদি মেমরি লাইব্রেরি স্টোরেজ এবং সাদৃশ্য পরিমাপ অপ্টিমাইজ করে।

উপসংহার এবং আলোচনা

প্রধান উপসংহার

MSM-Seg দ্বৈত-মেমরি সেগমেন্টেশন প্যারাডাইমের মাধ্যমে কার্যকরভাবে ক্রস-মোডালিটি এবং স্লাইস-মধ্যস্থ তথ্য একীভূত করে, ক্যাটাগরি-অজ্ঞেয় প্রম্পট ডিজাইনের সাথে মিলিত হয়ে, বহু-মোডাল ব্রেইন টিউমার সেগমেন্টেশন কাজে উল্লেখযোগ্য কর্মক্ষমতা উন্নতি অর্জন করে, ক্লিনিক্যাল প্রয়োগের জন্য একটি দক্ষ এবং ব্যবহারিক সমাধান প্রদান করে।

সীমাবদ্ধতা

  1. গণনামূলক ওভারহেড: দ্বৈত-মেমরি মেকানিজম অনুমান বিলম্ব বৃদ্ধি করে, 3.86s থেকে 4.17s পর্যন্ত
  2. মেমরি ক্ষমতা সীমাবদ্ধতা: বৃহত্তর মেমরি ক্ষমতার প্রান্তিক রিটার্ন হ্রাস পায়
  3. ডেটাসেট স্কেল: শুধুমাত্র দুটি BraTS ডেটাসেটে যাচাই করা হয়েছে, আরও বিস্তৃত ডেটাসেট যাচাইকরণের প্রয়োজন

ভবিষ্যত দিকনির্দেশনা

  1. গণনামূলক ওভারহেড হ্রাস করতে আরও দক্ষ মেমরি মেকানিজম অন্বেষণ করা
  2. অন্যান্য চিকিৎসা চিত্র সেগমেন্টেশন কাজে প্রসারিত করা
  3. অভিযোজিত মেমরি ক্ষমতা নির্বাচন কৌশল গবেষণা করা

গভীর মূল্যায়ন

শক্তি

  1. শক্তিশালী প্রযুক্তিগত উদ্ভাবনীতা: দ্বৈত-মেমরি প্যারাডাইম এবং ক্যাটাগরি-অজ্ঞেয় প্রম্পট ডিজাইন উল্লেখযোগ্য উদ্ভাবনীতা প্রদর্শন করে
  2. ব্যাপক পরীক্ষা: সম্পূর্ণ অ্যাবলেশন পরীক্ষা এবং তুলনামূলক পরীক্ষা পদ্ধতির কার্যকারিতা যাচাই করে
  3. উচ্চ ব্যবহারিক মূল্য: টীকা বোঝা হ্রাস করে, ক্লিনিক্যাল প্রয়োগযোগ্যতা বৃদ্ধি করে
  4. উল্লেখযোগ্য কর্মক্ষমতা উন্নতি: একাধিক মেট্রিকে বিদ্যমান অত্যাধুনিক পদ্ধতি অতিক্রম করে

অপূর্ণতা

  1. গণনামূলক জটিলতা বিশ্লেষণ অপর্যাপ্ত: বিস্তারিত সময় এবং স্থান জটিলতা বিশ্লেষণের অভাব
  2. ক্রস-ডেটাসেট সাধারণীকরণ যাচাইকরণ অপর্যাপ্ত: শুধুমাত্র BraTS সিরিজ ডেটাসেটে যাচাই করা হয়েছে
  3. ব্যর্থতা কেস বিশ্লেষণ অনুপস্থিত: পদ্ধতি ব্যর্থতার নির্দিষ্ট কেস বিশ্লেষণ প্রদান করা হয়নি

প্রভাব

এই কাজ বহু-মোডাল চিকিৎসা চিত্র সেগমেন্টেশনের জন্য একটি নতুন প্রযুক্তিগত প্যারাডাইম প্রদান করে, দ্বৈত-মেমরি মেকানিজম এবং ক্যাটাগরি-অজ্ঞেয় প্রম্পট ডিজাইন ব্যাপক প্রয়োগ সম্ভাবনা রাখে, চিকিৎসা চিত্র বিশ্লেষণ ক্ষেত্রে গুরুত্বপূর্ণ প্রভাব ফেলার প্রত্যাশা করা হয়।

প্রয়োগযোগ্য পরিস্থিতি

  1. ক্লিনিক্যাল ব্রেইন টিউমার নির্ণয়: ডাক্তারের টীকা কাজের চাপ হ্রাস করে
  2. বহু-মোডাল চিকিৎসা চিত্র সেগমেন্টেশন: অন্যান্য অঙ্গ এবং রোগে প্রসারিত করা যায়
  3. কম্পিউটার-সহায়ক নির্ণয় সিস্টেম: উচ্চ-নির্ভুলতা সেগমেন্টেশন ভিত্তি প্রদান করে

তথ্যসূত্র

পেপারটি বহু-মোডাল সেগমেন্টেশন, ভিশন ট্রান্সফর্মার, SAM সিরিজ পদ্ধতি ইত্যাদি মূল ক্ষেত্রের গুরুত্বপূর্ণ কাজ সহ 45টি সম্পর্কিত তথ্যসূত্র উদ্ধৃত করে, এই গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।