থার্মোইলেকট্রিক উপকরণ বর্জ্য তাপকে বৈদ্যুতিক শক্তিতে রূপান্তরের জন্য টেকসই পথ প্রদান করে। তবে নির্ভরযোগ্য ডাটাবেসের অভাবের কারণে, এই উপকরণগুলির ডেটা-চালিত আবিষ্কার এবং অপ্টিমাইজেশন চ্যালেঞ্জের সম্মুখীন। এই গবেষণা ৭,১২৩টি থার্মোইলেকট্রিক যৌগ সম্বলিত একটি ব্যাপক ডাটাবেস তৈরি করেছে, যাতে রাসায়নিক সংমিশ্রণ, কাঠামোগত বিবরণ, সিবেক সহগ, বৈদ্যুতিক পরিবাহিতা এবং তাপীয় পরিবাহিতা, শক্তি ফ্যাক্টর এবং মেধা ফ্যাক্টর (ZT) এর মতো মূল তথ্য রয়েছে। গবেষণা বৃহৎ ভাষা মডেল-চালিত GPTArticleExtractor কর্মপ্রবাহ ব্যবহার করে Elsevier জার্নালে প্রকাশিত বৈজ্ঞানিক সাহিত্য থেকে স্বয়ংক্রিয়ভাবে ডেটা নিষ্কাশন এবং সংগঠিত করে। এই প্রক্রিয়া কাঠামোগত ডাটাবেস তৈরি অর্জন করে, ম্যানুয়াল ডেটা সংগ্রহের চ্যালেঞ্জগুলি সমাধান করে। এই উন্মুক্ত অ্যাক্সেস ডাটাবেস ডেটা-চালিত গবেষণাকে উদ্দীপিত করতে পারে এবং থার্মোইলেকট্রিক উপকরণ বিশ্লেষণ এবং আবিষ্কারকে এগিয়ে নিয়ে যেতে পারে।
১. শক্তি রূপান্তর চাহিদা: বৈশ্বিক শক্তি চ্যালেঞ্জ এবং পরিবেশগত সমস্যা বৃদ্ধির সাথে সাথে, থার্মোইলেকট্রিক উপকরণ তাপ শক্তিকে বৈদ্যুতিক শক্তিতে সরাসরি রূপান্তরের মূল প্রযুক্তি হিসাবে গুরুত্ব পায় ২. ডেটা স্বল্পতা সমস্যা: বিদ্যমান থার্মোইলেকট্রিক উপকরণ ডাটাবেসে উল্লেখযোগ্য সীমাবদ্ধতা রয়েছে:
থার্মোইলেকট্রিক উপকরণের কর্মক্ষমতা মাত্রাহীন মেধা ফ্যাক্টর ZT দ্বারা পরিমাপ করা হয়:
ZT = S²σT/κ
যেখানে S হল সিবেক সহগ, σ হল বৈদ্যুতিক পরিবাহিতা, T হল পরম তাপমাত্রা, κ হল তাপীয় পরিবাহিতা। ZT অপ্টিমাইজ করার জন্য এই পারস্পরিক সম্পর্কিত বৈশিষ্ট্যগুলি একযোগে বিবেচনা করা প্রয়োজন, যা উপকরণ ডিজাইনকে অত্যন্ত চ্যালেঞ্জিং করে তোলে।
১. ঐতিহ্যবাহী পদ্ধতি: পরীক্ষামূলক ত্রুটি-সংশোধন এবং তাত্ত্বিক সিমুলেশন (DFT, MD) এর উপর নির্ভর করে, সময়সাপেক্ষ এবং গণনা খরচ বেশি २. বিদ্যমান ডাটাবেস:
१. বৃহৎ-স্কেল ডাটাবেস নির্মাণ: ৭,१२३টি থার্মোইলেকট্রিক যৌগ সম্বলিত একটি ব্যাপক ডাটাবেস তৈরি করা, যা মূল থার্মোইলেকট্রিক বৈশিষ্ট্য এবং কাঠামোগত তথ্য কভার করে २. স্বয়ংক্রিয় ডেটা নিষ্কাশন: GPTArticleExtractor কর্মপ্রবাহ গ্রহণ করা, বৈজ্ঞানিক সাহিত্য থেকে কাঠামোগত ডেটা স্বয়ংক্রিয়ভাবে নিষ্কাশন করতে বৃহৎ ভাষা মডেল ব্যবহার করা ३. ডেটা গুণমান নিশ্চিতকরণ: পরীক্ষামূলক এবং তাত্ত্বিক ডেটা সনাক্তকরণ অন্তর্ভুক্ত, প্রায় ৬৬% পরীক্ষামূলক ডেটা, ডেটা নির্ভরযোগ্যতা উন্নত করা ४. উন্মুক্ত অ্যাক্সেস সম্পদ: nemad.org এ উন্মুক্ত অ্যাক্সেস প্রদান করা, ডেটা-চালিত থার্মোইলেকট্রিক উপকরণ গবেষণা সমর্থন করা ५. কাঠামো-সম্পত্তি সম্পর্ক: থার্মোইলেকট্রিক উপকরণ ডাটাবেসে প্রথমবারের মতো কাঠামোগত তথ্য পদ্ধতিগতভাবে অন্তর্ভুক্ত করা, গ্রাফ নিউরাল নেটওয়ার্ক এর মতো উন্নত পদ্ধতি সমর্থন করা
বৈজ্ঞানিক সাহিত্য থেকে থার্মোইলেকট্রিক উপকরণের সম্পত্তি ডেটা এবং কাঠামোগত তথ্য স্বয়ংক্রিয়ভাবে নিষ্কাশন করা, মানক কাঠামোগত ডাটাবেস নির্মাণ করা, যাতে অন্তর্ভুক্ত থাকে:
१. LLM-চালিত স্বয়ংক্রিয়করণ: ঐতিহ্যবাহী NLP সরঞ্জামের তুলনায়, GPT-4 জটিল বৈজ্ঞানিক পাঠ বোঝার ক্ষেত্রে উন্নত কর্মক্ষমতা প্রদর্শন করে २. বহু-উপকরণ প্রক্রিয়াকরণ ক্ষমতা: বহু যৌগ এবং তাদের বৈশিষ্ট্য বর্ণনা করে এমন নিবন্ধ সঠিকভাবে প্রক্রিয়া করতে পারা ३. ডেটা মানকীকরণ: ডেটা পরিষ্কার স্ক্রিপ্ট বিকাশ করা, বিভিন্ন সাহিত্যে ইউনিট একীভূত করা ४. গুণমান নিয়ন্ত্রণ: পরীক্ষামূলক এবং তাত্ত্বিক ডেটা পার্থক্য করা, ডাটাবেস নির্ভরযোগ্যতা উন্নত করা
१. XML থেকে CSV রূপান্তর: PDF সংস্করণের মূল সামগ্রী সংরক্ষণ করা २. GPT-4 নিষ্কাশন: সাবধানে ডিজাইন করা প্রম্পট ব্যবহার করে তথ্য নিষ্কাশন করা ३. ডেটা পরিষ্কার: ইউনিট এবং ডেটা ফর্ম্যাট একীভূত করা ४. গুণমান যাচাইকরণ: মূল ডেটা পয়েন্ট ম্যানুয়াল পরীক্ষা করা
१. সিবেক সহগ বিতরণ
२. বৈদ্যুতিক পরিবাহিতা বিতরণ
३. তাপীয় পরিবাহিতা বিতরণ
४. শক্তি ফ্যাক্টর বিতরণ
५. মেধা ফ্যাক্টর (ZT) বিতরণ
চিত্র २ অনুযায়ী, বিভিন্ন সম্পত্তির ডেটা কভারেজ হার পার্থক্য রয়েছে, যা সাহিত্যে রিপোর্ট করা সম্পত্তির অসম্পূর্ণতা প্রতিফলিত করে, এটি প্রকৃত বৈজ্ঞানিক গবেষণায় একটি সাধারণ ঘটনা।
१. গণনা ডাটাবেস: Materials Project, JARVIS ইত্যাদি প্রধানত DFT গণনার উপর ভিত্তি করে २. পরীক্ষামূলক ডাটাবেস: ছোট স্কেল, যেমন Gaultois এবং অন্যদের হাতে তৈরি ডাটাবেস ३. স্বয়ংক্রিয় নিষ্কাশন: Sierepeklis এবং Cole ChemDataExtractor ব্যবহার করে १०,६४१টি যৌগের ডাটাবেস তৈরি করেছেন
१. ডেটা গুণমান: উন্নত LLM ব্যবহার করে নিষ্কাশন নির্ভুলতা উন্নত করা २. কাঠামোগত তথ্য: থার্মোইলেকট্রিক উপকরণ ডাটাবেসে প্রথমবারের মতো স্ফটিক কাঠামো, স্থান গ্রুপ ইত্যাদি তথ্য পদ্ধতিগতভাবে অন্তর্ভুক্ত করা ३. ডেটা সনাক্তকরণ: পরীক্ষামূলক এবং তাত্ত্বিক ডেটা স্পষ্টভাবে পার্থক্য করা ४. ক্রমাগত আপডেট: স্কেলেবল স্বয়ংক্রিয় প্রক্রিয়া প্রতিষ্ঠা করা
१. সফলভাবে বর্তমানে সবচেয়ে ব্যাপক থার্মোইলেকট্রিক উপকরণ ডাটাবেসগুলির একটি নির্মাণ করা হয়েছে, যাতে ७,१२३টি যৌগ রয়েছে २. GPTArticleExtractor বৈজ্ঞানিক ডেটা নিষ্কাশনে LLM এর কার্যকারিতা প্রমাণ করেছে ३. ডাটাবেস কম কর্মক্ষমতা থেকে উচ্চ কর্মক্ষমতা (ZT~४) পর্যন্ত বিস্তৃত উপকরণ পরিসীমা কভার করে ४. কাঠামোগত তথ্যের অন্তর্ভুক্তি ভবিষ্যতের মেশিন লার্নিং অ্যাপ্লিকেশনের জন্য ভিত্তি স্থাপন করে
१. ডেটা সম্পূর্ণতা: সমস্ত যৌগের সম্পূর্ণ সম্পত্তি ডেটা নেই २. উৎস সীমাবদ্ধতা: শুধুমাত্র Elsevier জার্নালে সীমাবদ্ধ, প্রকাশনা পক্ষপাত থাকতে পারে ३. গুণমান নিয়ন্ত্রণ: যদিও LLM ব্যবহার করে নির্ভুলতা উন্নত করা হয়েছে, তবুও ম্যানুয়াল যাচাইকরণ প্রয়োজন ४. গতিশীল আপডেট: সর্বশেষ গবেষণা ফলাফল অন্তর্ভুক্ত করার জন্য ক্রমাগত রক্ষণাবেক্ষণ প্রয়োজন
१. আরও জার্নাল এবং ডেটা উৎসে সম্প্রসারণ করা २. এই ডাটাবেসের উপর ভিত্তি করে মেশিন লার্নিং মডেল বিকাশ করা ३. কাঠামোগত তথ্য ব্যবহার করতে গ্রাফ নিউরাল নেটওয়ার্ক একীভূত করা ४. সম্প্রদায় অবদান প্রক্রিয়া প্রতিষ্ঠা করা
१. প্রযুক্তিগত উদ্ভাবন: বৈজ্ঞানিক ডেটা নিষ্কাশনে LLM প্রয়োগ, স্বয়ংক্রিয়করণ মাত্রা এবং নির্ভুলতা উল্লেখযোগ্যভাবে উন্নত করা २. ডেটা মূল্য: থার্মোইলেকট্রিক উপকরণ ক্ষেত্রে বৃহৎ-স্কেল পরীক্ষামূলক ডাটাবেসের অভাব পূরণ করা ३. ব্যবহারিকতা: উন্মুক্ত অ্যাক্সেস এবং মানক ফর্ম্যাট, গবেষণা সম্প্রদায়ের ব্যবহার সহজ করা ४. দূরদর্শিতা: কাঠামোগত তথ্য অন্তর্ভুক্তি উন্নত মেশিন লার্নিং পদ্ধতি প্রয়োগের পথ সুগম করা ५. পদ্ধতি পুনরুৎপাদনযোগ্যতা: কর্মপ্রবাহ বিস্তারিত বর্ণনা, ভাল পুনরুৎপাদনযোগ্যতা
१. যাচাইকরণ প্রক্রিয়া: নিষ্কাশন নির্ভুলতা পরিমাপ করার জন্য পদ্ধতিগত ম্যানুয়াল যাচাইকরণ অনুপস্থিত २. পক্ষপাত সমস্যা: শুধুমাত্র Elsevier জার্নাল ব্যবহার প্রকাশনা এবং নির্বাচন পক্ষপাত প্রবর্তন করতে পারে ३. ডেটা গুণমান মূল্যায়ন: বিভিন্ন উৎস ডেটা গুণমানের পরিমাণগত তুলনা প্রদান করা হয়নি ४. আপডেট প্রক্রিয়া: ডাটাবেসের দীর্ঘমেয়াদী রক্ষণাবেক্ষণ এবং আপডেট কৌশল বিস্তারিতভাবে বর্ণনা করা হয়নি
१. একাডেমিক মূল্য: থার্মোইলেকট্রিক উপকরণের ডেটা-চালিত গবেষণার জন্য গুরুত্বপূর্ণ সম্পদ প্রদান করা २. পদ্ধতি উদাহরণ: GPTArticleExtractor কর্মপ্রবাহ অন্যান্য উপকরণ বিজ্ঞান ক্ষেত্রে প্রসারিত করা যেতে পারে ३. শিল্প প্রয়োগ: থার্মোইলেকট্রিক ডিভাইসের শিল্পায়ন উন্নয়ন এবং অপ্টিমাইজেশন সমর্থন করা ४. শিক্ষামূলক মূল্য: সম্পর্কিত কোর্স এবং গবেষণার জন্য মানক ডেটাসেট প্রদান করা
१. মেশিন লার্নিং গবেষণা: থার্মোইলেকট্রিক সম্পত্তি পূর্বাভাস মডেল প্রশিক্ষণ করা २. উপকরণ স্ক্রিনিং: নির্দিষ্ট সম্পত্তি সহ প্রার্থী উপকরণ দ্রুত সনাক্ত করা ३. কাঠামো-সম্পত্তি সম্পর্ক গবেষণা: কাঠামোগত তথ্য ব্যবহার করে ডিজাইন নিয়ম অন্বেষণ করা ४. বেঞ্চমার্ক পরীক্ষা: নতুন গণনা পদ্ধতির জন্য যাচাইকরণ ডেটাসেট প্রদান করা
পেপার ৪০টি সম্পর্কিত তথ্যসূত্র উদ্ধৃত করে, যা থার্মোইলেকট্রিক উপকরণ মৌলিক তত্ত্ব, গণনা পদ্ধতি, বিদ্যমান ডাটাবেস এবং মেশিন লার্নিং অ্যাপ্লিকেশন কভার করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি এবং পর্যাপ্ত পটভূমি গবেষণা প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের আন্তঃশৃঙ্খলাবদ্ধ গবেষণা পত্র, যা কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি সফলভাবে উপকরণ বিজ্ঞান ডেটা ব্যবস্থাপনায় প্রয়োগ করে, থার্মোইলেকট্রিক উপকরণ গবেষণা সম্প্রদায়ের জন্য মূল্যবান সম্পদ প্রদান করে। যদিও কিছু সীমাবদ্ধতা রয়েছে, তবে এর উদ্ভাবনী পদ্ধতি এবং ব্যবহারিক অবদান এটিকে গুরুত্বপূর্ণ একাডেমিক এবং ব্যবহারিক মূল্য প্রদান করে।