Reconstruction-based methods, particularly those leveraging autoencoders, have been widely adopted for anomaly detection task in brain MRI. Unlike most existing works try to improve the task accuracy through architectural or algorithmic innovations, we tackle this task from image quality assessment (IQA) perspective, an under-explored direction in the field. Due to the limitations of conventional metrics such as l1 in capturing the nuanced differences in reconstructed images for medical anomaly detection, we propose fusion quality, a novel metric that wisely integrates the structure-level sensitivity of Structural Similarity Index Measure (SSIM) with the pixel-level precision of l1. The metric offers a more comprehensive assessment of reconstruction quality, considering intensity (subtractive property of l1 and divisive property of SSIM), contrast, and structural similarity. Furthermore, the proposed metric makes subtle regional variations more impactful in the final assessment. Thus, considering the inherent divisive properties of SSIM, we design an average intensity ratio (AIR)-based data transformation that amplifies the divisive discrepancies between normal and abnormal regions, thereby enhancing anomaly detection. By fusing the aforementioned two components, we devise the IQA approach. Experimental results on two distinct brain MRI datasets show that our IQA approach significantly enhances medical anomaly detection performance when integrated with state-of-the-art baselines.
- পেপার আইডি: 2408.08228
- শিরোনাম: মস্তিষ্ক MRI তে চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণ পুনর্বিবেচনা: একটি চিত্র গুণমান মূল্যায়ন দৃষ্টিভঙ্গি
- লেখক: Zixuan Pan, Jun Xia, Zheyu Yan, Guoyue Xu, Yifan Qin, Xueyang Li, Yawen Wu, Zhenge Jia, Jianxu Chen, Yiyu Shi
- শ্রেণীবিভাগ: eess.IV cs.CV
- প্রকাশনার সময়: ২০২৪ সালের আগস্ট (arXiv প্রাক-প্রিন্ট)
- পেপার লিঙ্ক: https://arxiv.org/abs/2408.08228
এই পেপারটি চিত্র গুণমান মূল্যায়ন (IQA) এর দৃষ্টিভঙ্গি থেকে মস্তিষ্ক MRI তে অসামান্যতা সনাক্তকরণ কাজ পুনর্বিবেচনা করে। ঐতিহ্যবাহী ℓ1 ক্ষতি পুনর্নির্মাণ চিত্রের সূক্ষ্ম পার্থক্য ক্যাপচার করার সীমাবদ্ধতার সমাধানে, এটি সংমিশ্রণ গুণমান (fusion quality) মেট্রিক প্রস্তাব করে যা কাঠামোগত সাদৃশ্য সূচক (SSIM) এর কাঠামো-স্তরের সংবেদনশীলতাকে ℓ1 এর পিক্সেল-স্তরের নির্ভুলতার সাথে চতুরভাবে একত্রিত করে। এই মেট্রিকটি তীব্রতা, বৈসাদৃশ্য এবং কাঠামোগত সাদৃশ্যের তিনটি মাত্রা থেকে আরও ব্যাপক পুনর্নির্মাণ গুণমান মূল্যায়ন প্রদান করে। অতিরিক্তভাবে, SSIM এর অন্তর্নিহিত বিভাজন বৈশিষ্ট্য বিবেচনা করে, এটি গড় তীব্রতা অনুপাত (AIR) ভিত্তিক ডেটা রূপান্তর ডিজাইন করে সাধারণ এবং অসামান্য অঞ্চলের মধ্যে পার্থক্য বৃদ্ধি করতে। পরীক্ষামূলক ফলাফল দেখায় যে এই IQA পদ্ধতি চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণ কর্মক্ষমতা উল্লেখযোগ্যভাবে উন্নত করে।
মস্তিষ্ক MRI অসামান্যতা সনাক্তকরণ (যেমন টিউমার চিহ্নিতকরণ) চিকিৎসা বিজ্ঞান সম্পর্কিত চিত্র বিশ্লেষণের একটি গুরুত্বপূর্ণ কাজ। ঐতিহ্যবাহী তত্ত্বাবধানপ্রাপ্ত শিক্ষা পদ্ধতি বিপুল পরিমাণ মন্তব্যকৃত ডেটা প্রয়োজন, যখন চিকিৎসা চিত্রের নির্ভুল মন্তব্য (যেমন টিউমার বিভাজন মুখোশ) অর্জন করা কঠিন এবং ব্যয়বহুল।
- মন্তব্যকৃত ডেটা স্বল্পতা: চিকিৎসা চিত্র মন্তব্য বিশেষজ্ঞ জ্ঞান প্রয়োজন, উচ্চ খরচ এবং সময়সাপেক্ষ
- বিদ্যমান পদ্ধতির সীমাবদ্ধতা: পুনর্নির্মাণ-ভিত্তিক অসামান্যতা সনাক্তকরণ পদ্ধতি প্রধানত স্থাপত্য এবং অ্যালগরিদম উদ্ভাবনে মনোনিবেশ করে, পুনর্নির্মাণ গুণমান মূল্যায়ন মেট্রিক্সের গুরুত্ব উপেক্ষা করে
- মূল্যায়ন মেট্রিক্স অপর্যাপ্ত: ঐতিহ্যবাহী ℓ1 ক্ষতি পিক্সেল স্বাধীনতা অনুমান করে, স্থানিক সম্পর্ক উপেক্ষা করে, সূক্ষ্ম অসামান্যতা ক্যাপচার করতে কঠিন
চিত্র 1 এ দেখানো হয়েছে, একই পুনর্নির্মাণ ফলাফল ব্যবহার করেও, SSIM ব্যবহার করে গণনা করা অসামান্যতা মানচিত্র ℓ1 ক্ষতি ব্যবহার করার চেয়ে টিউমার অঞ্চল আরও ভালভাবে চিহ্নিত করতে পারে, যা IQA দৃষ্টিভঙ্গি থেকে অসামান্যতা সনাক্তকরণ পুনর্বিবেচনার প্রয়োজনীয়তা অনুপ্রাণিত করে।
- প্রথমবারের জন্য IQA দৃষ্টিভঙ্গি প্রস্তাব: চিত্র গুণমান মূল্যায়ন চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণে প্রবর্তন করে, সংমিশ্রণ গুণমান ক্ষতি (fusion quality loss) প্রস্তাব করে
- উপন্যাস মূল্যায়ন মেট্রিক: SSIM এবং ℓ1 ক্ষতির সুবিধা একত্রিত করে, আরও ব্যাপক পুনর্নির্মাণ গুণমান মূল্যায়ন প্রদান করে
- ডেটা বৃদ্ধি কৌশল: AIR-ভিত্তিক রূপান্তর ডিজাইন করে, সাধারণ এবং অসামান্য অঞ্চলের পার্থক্য বৃদ্ধি করে
- উল্লেখযোগ্য কর্মক্ষমতা উন্নতি: BraTS21 T2 তে DICE 15.86% বৃদ্ধি, MSLUB T2 তে 21.41% বৃদ্ধি
- ভাল সাধারণীকরণ: পদ্ধতি বিভিন্ন মোডালিটি এবং বিভিন্ন ভিত্তিরেখা মডেলে প্রয়োগ করা যায়
সাধারণ ডেটাসেট Xn={xin∈Xn}i=1N দেওয়া, পুনর্নির্মাণ মডেল fθ(⋅) প্রশিক্ষণ দিন:
minθN1∑i=1NLtrain(xin,x^in),x^in=fθ(xin′)
পরীক্ষার সময়, অসামান্যতা স্কোর মানচিত্র সংজ্ঞায়িত করা হয়:
Λj=Ltest(xja,x^ja),x^ja=fθ∗(xja′)
SSIM উজ্জ্বলতা, বৈসাদৃশ্য এবং কাঠামোর তিনটি মাত্রা মূল্যায়ন করে:
l(x,y)=μx2+μy2+C12μxμy+C1,c(x,y)=σx2+σy2+C22σxσy+C2s(x,y)=σxσy+C3σxy+C3
SSIM(x,y)=l(x,y)⋅c(x,y)⋅s(x,y)
স্থানীয় SSIM ক্ষতি:
LSSIM(x,x^)=21−K1∑k=1KSSIM(xk,x^k)
SSIM এবং ℓ1 ক্ষতির সুবিধা একত্রিত করে:
LFQ=αLSSIM+(1−α)Lℓ1,α∈[0,1]
যেখানে α = 0.84, এই প্যারামিটার পছন্দ পূর্ববর্তী গবেষণা 21 এর সুপারিশ অনুসরণ করে।
AIR(X)=(μXa+μXn)−∣μXa−μXn∣(μXa+μXn)+∣μXa−μXn∣
যেখানে μXa এবং μXn যথাক্রমে অসামান্য এবং সাধারণ অঞ্চলের গড় পিক্সেল তীব্রতা।
BraTS ডেটাসেটের চার ধরনের মোডালিটির পরিসংখ্যান বিশ্লেষণের উপর ভিত্তি করে:
- 0<μXn<μXa<1 সমস্ত মোডালিটিতে বৈধ
- T1, FLAIR এবং T1-CE তে μXn>0.5
- T2 তে μXa<0.5
রূপান্তর ফাংশন ডিজাইন করুন:
p(x)=x⋅I(μXn≤0.5)+(1−x)⋅I(0.5<μXn)
এই রূপান্তর নিশ্চিত করে AIR(Xˉ)≥AIR(X)।
- বহু-মাত্রা গুণমান মূল্যায়ন: পিক্সেল-স্তর (ℓ1) এবং কাঠামো-স্তর (SSIM) তথ্য সংমিশ্রণ করে
- স্ব-অভিযোজিত ওজন প্রক্রিয়া: SSIM এর বিভাজন বৈশিষ্ট্য কাঠামো সম্পর্ক আরও গুরুত্বপূর্ণ করে তোলে
- ডেটা-চালিত প্রাক-প্রক্রিয়াকরণ: ডেটাসেট পরিসংখ্যান বৈশিষ্ট্যের উপর ভিত্তি করে রূপান্তর কৌশল ডিজাইন করে
- শেষ থেকে শেষ অপ্টিমাইজেশন: প্রশিক্ষণ এবং অনুমান পর্যায়ে একীভূতভাবে সংমিশ্রণ গুণমান ক্ষতি ব্যবহার করে
- BraTS21: 1251টি মস্তিষ্ক টিউমার MRI স্ক্যান, T1, T1-CE, T2, FLAIR চার ধরনের মোডালিটি অন্তর্ভুক্ত
- MSLUB: 30 জন একাধিক স্ক্লেরোসিস রোগীর T1, T2, FLAIR স্ক্যান
- IXI: 560টি স্বাস্থ্যকর মস্তিষ্কের T1-T2 স্ক্যান জোড়া
- ক্রস-ডেটাসেট সেটআপ: IXI স্বাস্থ্যকর ডেটায় প্রশিক্ষণ, BraTS21 এবং MSLUB তে পরীক্ষা
- ডেটাসেট-অভ্যন্তরীণ সেটআপ: BraTS21 এর FLAIR এবং T1-CE তে পাঁচ-ভাঁজ ক্রস-যাচাইকরণ
- প্রাক-প্রক্রিয়াকরণ: পুনঃনমুনা, মাথার খুলি অপসারণ, নিবন্ধন
- DICE সহগ: বিভাজন নির্ভুলতা পরিমাপ করে
- AUPRC: নির্ভুলতা-স্মরণ বক্ররেখার নিচে এলাকা
Thresh, AE, VAE, SVAE, DAE, f-AnoGAN, DDPM, mDDPM, pDDPM ইত্যাদি 9টি ভিত্তিরেখা পদ্ধতি
- অপ্টিমাইজার: Adam, শেখার হার 1e-4, ব্যাচ আকার 32
- প্রশিক্ষণ যুগ: 1600 যুগ
- শব্দ স্তর: BraTS21(T2) 500, অন্যান্য 750
- পোস্ট-প্রক্রিয়াকরণ: মধ্যম ফিল্টার (কার্নেল আকার 5) + মস্তিষ্ক মুখোশ ক্ষয় (3 পুনরাবৃত্তি)
ক্রস-ডেটাসেট সেটআপে T2 মোডালিটি ফলাফল:
| পদ্ধতি | BraTS21 (T2) | | MSLUB (T2) | |
|---|
| DICE % | AUPRC % | DICE % | AUPRC % |
| pDDPM | 49.41±0.66 | 54.76±0.83 | 10.65±1.05 | 10.37±0.51 |
| pDDPM-IQA | 59.45±0.37 | 62.99±0.37 | 12.93±0.67 | 11.51±0.50 |
| আপেক্ষিক উন্নতি | +20.32% | +15.03% | +21.41% | +10.99% |
BraTS T1, MSLUB T1, BraTS FLAIR এবং T1-CE ইত্যাদি একাধিক মোডালিটিতে, pDDPM-IQA সমস্ত উল্লেখযোগ্য উন্নতি অর্জন করে (p < 0.05)।
- শুধুমাত্র LFQ: ভিত্তিরেখার তুলনায় উল্লেখযোগ্য উন্নতি
- LFQ + AIR: আরও কর্মক্ষমতা উন্নতি
- দুটি উপাদানের সহযোগিতামূলক প্রভাব সর্বোত্তম
IQA পদ্ধতি DDPM ভিত্তিরেখায় প্রয়োগ করে (DDPM-IQA), সমস্ত পরীক্ষিত ডেটাসেট এবং মোডালিটিতে সামঞ্জস্যপূর্ণ কর্মক্ষমতা উন্নতি অর্জন করে।
α প্যারামিটারের সংবেদনশীলতা বিশ্লেষণ দেখায় যে, এমনকি সাব-অপ্টিমাল α = 0.84 ব্যবহার করেও, পদ্ধতি শক্তিশালী কর্মক্ষমতা বজায় রাখে।
চিত্র 3 গুণগত ফলাফল প্রদর্শন করে, pDDPM-IQA দ্বারা উত্পাদিত অসামান্যতা মানচিত্র অন্যান্য পদ্ধতির চেয়ে টিউমার অঞ্চল আরও নির্ভুলভাবে স্থানীয়করণ করে, সীমানা আরও স্পষ্ট, মিথ্যা ইতিবাচক কম।
- স্বয়ংএনকোডার পদ্ধতি: AE, VAE পুনর্নির্মাণ অস্পষ্টতা সমস্যা বিদ্যমান
- উন্নত কৌশল: ভেক্টর কোয়ান্টাইজেশন VAE, প্রতিকূল স্বয়ংএনকোডার, ডিনোইজিং স্বয়ংএনকোডার
- GAN পদ্ধতি: AnoGAN, f-AnoGAN, কিন্তু স্থিতিশীলতা সমস্যা বিদ্যমান
- বিস্তার মডেল: anoDDPM, pDDPM, mDDPM ইত্যাদি সর্বশেষ অগ্রগতি
- শিল্প ত্রুটি সনাক্তকরণে ℓ2 ক্ষতির পরিবর্তে SSIM ব্যবহার
- সুপ্ত স্থান SSIM ক্ষতি
- একীভূত SSIM পদ্ধতি
চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণে প্রথমবারের জন্য SSIM এবং ℓ1 ক্ষতি সম্পূর্ণ প্রশিক্ষণ এবং অনুমান প্রক্রিয়ায় একত্রিত করে।
- IQA দৃষ্টিভঙ্গি কার্যকর: চিত্র গুণমান মূল্যায়ন কোণ থেকে অসামান্যতা সনাক্তকরণ কর্মক্ষমতা উল্লেখযোগ্যভাবে উন্নত করতে পারে
- সংমিশ্রণ কৌশল উচ্চতর: SSIM এবং ℓ1 একত্রিত সংমিশ্রণ গুণমান ক্ষতি একক মেট্রিক্সের চেয়ে উচ্চতর
- ডেটা রূপান্তর গুরুত্বপূর্ণ: AIR-ভিত্তিক রূপান্তর কার্যকরভাবে সাধারণ এবং অসামান্য অঞ্চলের পার্থক্য বৃদ্ধি করে
- ব্যাপক প্রযোজ্যতা: পদ্ধতি একাধিক মোডালিটি এবং ভিত্তিরেখায় কার্যকর
- প্যারামিটার নির্ধারিত: α = 0.84 বিভিন্ন সেটিংসের জন্য অপ্টিমাইজ করা হয়নি
- রূপান্তর নির্দিষ্টতা: AIR রূপান্তর নির্দিষ্ট ডেটাসেট পরিসংখ্যান ডিজাইনের উপর ভিত্তি করে
- গণনামূলক জটিলতা: SSIM গণনা নির্দিষ্ট গণনামূলক ওভারহেড যোগ করে
- তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: সংমিশ্রণ গুণমান ক্ষতির তাত্ত্বিক সংগ্রহ বিশ্লেষণ অভাব
- নতুন মেট্রিক্স অন্বেষণ: বর্তমান সংমিশ্রণ গুণমান ক্ষতির চেয়ে ভাল অসামান্যতা ক্যাপচার মেট্রিক্স গবেষণা করে
- স্ব-অভিযোজিত ওজন: α গতিশীলভাবে সামঞ্জস্য করার প্রক্রিয়া ডিজাইন করে
- তাত্ত্বিক বিশ্লেষণ: সংমিশ্রণ ক্ষতির তাত্ত্বিক গ্যারান্টি প্রদান করে
- প্রসারিত প্রয়োগ: অন্যান্য চিকিৎসা বিজ্ঞান সম্পর্কিত চিত্র কাজে সাধারণীকরণ করে
- উদ্ভাবনী দৃষ্টিভঙ্গি: প্রথমবারের জন্য সিস্টেমেটিকভাবে IQA কোণ থেকে চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণ গবেষণা করে
- পদ্ধতি সরল কার্যকর: সংমিশ্রণ গুণমান ক্ষতি ডিজাইন যুক্তিসঙ্গত, বাস্তবায়ন সহজ
- পরীক্ষা সম্পূর্ণ: একাধিক ডেটাসেট, একাধিক মোডালিটি, একাধিক ভিত্তিরেখার ব্যাপক যাচাইকরণ
- কর্মক্ষমতা উল্লেখযোগ্য উন্নতি: আপেক্ষিক উন্নতি 15-20% অতিক্রম করে, ব্যবহারিক মূল্য রয়েছে
- ভাল সাধারণীকরণ: বিভিন্ন স্থাপত্য এবং মোডালিটিতে প্রয়োগ করা যায়
- তাত্ত্বিক ভিত্তি দুর্বল: কেন SSIM + ℓ1 সমন্বয় কার্যকর তার গভীর তাত্ত্বিক বিশ্লেষণ অভাব
- প্যারামিটার পছন্দ বিষয়গত: α = 0.84 এর পছন্দ পর্যাপ্ত যাচাইকরণ অভাব
- গণনামূলক ওভারহেড বিশ্লেষণ অনুপস্থিত: অতিরিক্ত গণনা সময় খরচ রিপোর্ট করা হয়নি
- AIR রূপান্তর সীমাবদ্ধতা: রূপান্তর কৌশল নির্দিষ্ট ডেটাসেট পরিসংখ্যান বৈশিষ্ট্যের উপর অত্যধিক নির্ভরশীল
- তুলনা অপর্যাপ্ত: অন্যান্য IQA মেট্রিক্স (যেমন LPIPS) এর সাথে তুলনা অভাব
- একাডেমিক মূল্য: চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণের নতুন গবেষণা দিক উন্মোচন করে
- ব্যবহারিক মূল্য: উল্লেখযোগ্য কর্মক্ষমতা উন্নতি ক্লিনিক্যাল প্রয়োগ সম্ভাবনা রয়েছে
- পদ্ধতি সার্বজনীনতা: অন্যান্য চিকিৎসা বিজ্ঞান সম্পর্কিত চিত্র কাজে সাধারণীকরণ করা যায়
- পুনরুৎপাদনযোগ্যতা: কোড বাস্তবায়ন প্রদান করে, পুনরুৎপাদন এবং সম্প্রসারণ সুবিধাজনক করে
- চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণ: মস্তিষ্ক টিউমার, একাধিক স্ক্লেরোসিস ইত্যাদি রোগ সনাক্তকরণ
- অতত্ত্বাবধানপ্রাপ্ত শিক্ষা: মন্তব্যকৃত ডেটা স্বল্প চিকিৎসা বিজ্ঞান সম্পর্কিত চিত্র কাজ
- গুণমান মূল্যায়ন: চিকিৎসা বিজ্ঞান সম্পর্কিত চিত্র পুনর্নির্মাণ গুণমান মূল্যায়ন
- পদ্ধতি উন্নতি: বিদ্যমান পুনর্নির্মাণ-ভিত্তিক পদ্ধতির কর্মক্ষমতা উন্নতি
পেপারটি 42টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, গভীর শিক্ষা, চিকিৎসা বিজ্ঞান সম্পর্কিত চিত্র বিশ্লেষণ, অসামান্যতা সনাক্তকরণ, চিত্র গুণমান মূল্যায়ন ইত্যাদি একাধিক ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি চিকিৎসা বিজ্ঞান সম্পর্কিত অসামান্যতা সনাক্তকরণ ক্ষেত্রে উদ্ভাবনী এবং ব্যবহারিক মূল্য সহ একটি কাজ। IQA দৃষ্টিভঙ্গি প্রবর্তন করে, SSIM এবং ℓ1 ক্ষতি চতুরভাবে একত্রিত করে, একাধিক ডেটাসেটে উল্লেখযোগ্য কর্মক্ষমতা উন্নতি অর্জন করে। যদিও তাত্ত্বিক বিশ্লেষণ এবং প্যারামিটার পছন্দের দিক থেকে নির্দিষ্ট অপূর্ণতা রয়েছে, তবে এর অগ্রগামী গবেষণা চিন্তাভাবনা এবং ভাল পরীক্ষামূলক ফলাফল এটিকে এই ক্ষেত্রের একটি গুরুত্বপূর্ণ অবদান করে তোলে।