এই পেপারটি গাইয়া ডিআর৩ ডেটা ব্যবহার করে বিস্তৃত দ্বিতারকা সিস্টেম সনাক্তকরণের জন্য একটি মেশিন লার্নিং কাঠামো প্রস্তাব করে। প্রতিষ্ঠিত বিস্তৃত দ্বিতারকা ক্যাটালগে তত্ত্বাবধানকৃত মেশিন লার্নিং মডেল প্রশিক্ষণের মাধ্যমে, গবেষকরা দক্ষতার সাথে বিস্তৃত দ্বিতারকাগুলি শ্রেণীবদ্ধ করেছেন এবং ক্লাস্টারিং এবং নিকটতম প্রতিবেশী অনুসন্ধান ব্যবহার করে প্রার্থী সিস্টেমগুলি যুক্ত করেছেন। এই পদ্ধতিটি এসএমওটিই, সম্পর্ক বিশ্লেষণ এবং পিসিএ সহ ডেটা পূর্ব-প্রক্রিয়াকরণ কৌশলগুলি একীভূত করে, বিস্তৃত দ্বিতারকা শ্রেণীবিভাগ কাজে উচ্চ নির্ভুলতা এবং স্মরণ হার অর্জন করে। গবেষণা দ্বারা প্রদত্ত উন্মুক্ত কোড দ্রুত, স্কেলেবল এবং কাস্টমাইজযোগ্য উপায়ে বিস্তৃত দ্বিতারকা বিশ্লেষণ সক্ষম করে, ঐতিহ্যবাহী বিশ্লেষণ পদ্ধতির জন্য কার্যকর পরিপূরক এবং ভবিষ্যত জ্যোতির্বিজ্ঞান গবেষণার জন্য মূল্যবান সম্পদ প্রদান করে।
বিস্তৃত দ্বিতারকা সিস্টেম হল দুটি তারকার জোড়া যা হাজার থেকে দশ হাজার জ্যোতির্বৈজ্ঞানিক ইউনিট দূরত্বে মহাকর্ষীয়ভাবে আবদ্ধ। এই সিস্টেমগুলি কম ত্বরণ পরিবেশে কাজ করে এবং সংশোধিত মহাকর্ষ তত্ত্ব এবং মান মহাকর্ষ বিচ্যুতি পরীক্ষা করার জন্য আদর্শ পরীক্ষাগার।
১. জ্যোতির্বৈজ্ঞানিক মূল্য: বিস্তৃত দ্বিতারকা তারকা বিবর্তন, গতিশীলতা এবং ছায়াপথের কাঠামো অধ্যয়নের জন্য ব্যবহার করা যেতে পারে २. মহাকর্ষ তত্ত্ব পরীক্ষা: কম ত্বরণ পরিবেশে সংশোধিত মহাকর্ষ প্রভাবের লক্ষণ প্রকাশ পেতে পারে ३. গাইয়া ডেটা সুযোগ: গাইয়া ডিআর৩ অভূতপূর্ব উচ্চ নির্ভুলতার ডেটা প্রদান করে যা সম্পূর্ণ ছায়াপথ জুড়ে বিস্তৃত
१. গণনামূলক জটিলতা: ঐতিহ্যবাহী পরিসংখ্যানগত পদ্ধতি মন্টে কার্লো সিমুলেশন এবং জটিল সম্ভাব্যতা বিশ্লেষণের উপর নির্ভর করে, যা উচ্চ গণনামূলক খরচ বহন করে २. শব্দ এবং দূষণ: প্রকৃত মহাকর্ষীয়ভাবে আবদ্ধ জোড়া চিহ্নিত করা এবং তাদের গতিশীল অস্বাভাবিকতা সনাক্ত করা শব্দ, দূষণ এবং ডেটা স্কেল দ্বারা জটিল প্রভাবের সম্মুখীন হয় ३. আকস্মিক সারিবদ্ধতা: বিচ্ছিন্নতার দূরত্ব বৃদ্ধির সাথে সাথে আকস্মিক সারিবদ্ধতার সংখ্যা বৃদ্ধি পায়, যা নির্ভুল সনাক্তকরণে চ্যালেঞ্জ সৃষ্টি করে
মেশিন লার্নিং পদ্ধতি স্কেলেবল বিকল্প প্রদান করতে পারে, ক্লাস্টারিং অ্যালগরিদম এবং নিকটতম প্রতিবেশী অনুসন্ধান কৌশলের মাধ্যমে, শব্দ পটভূমি জনসংখ্যা থেকে দক্ষতার সাথে দ্বিতারকা সিস্টেম পূর্বাভাস দিতে, নতুন পদার্থবিজ্ঞান অনুসন্ধানের জন্য সরঞ্জাম প্রদান করে।
१. মেশিন লার্নিং কাঠামো: গাইয়া ডিআর৩ ডেটাসেটে বিস্তৃত দ্বিতারকা শ্রেণীবিভাগ সমস্যায় মেশিন লার্নিং-সহায়ক অনুসন্ধান প্রথমবার প্রবর্তন করা २. ডেটা পূর্ব-প্রক্রিয়াকরণ পাইপলাইন: এসএমওটিই ভারসাম্য, সম্পর্ক বিশ্লেষণ এবং পিসিএ সহ পূর্ব-প্রক্রিয়াকরণ কৌশল একীভূত করা ३. বহু-অ্যালগরিদম তুলনা: একাধিক তত্ত্বাবধানকৃত শেখার অ্যালগরিদমের কর্মক্ষমতা পদ্ধতিগতভাবে মূল্যায়ন করা ४. উন্মুক্ত সরঞ্জাম: কাস্টমাইজযোগ্য উন্মুক্ত কোড সরঞ্জাম প্রদান করা (https://github.com/DespCAP/G-ML) ५. উচ্চ-কর্মক্ষমতা শ্রেণীবিভাগ: বিস্তৃত দ্বিতারকা শ্রেণীবিভাগ কাজে ৯৯.৮% নির্ভুলতা এবং ৯२.३% স্মরণ হার অর্জন করা
ইনপুট: গাইয়া ডিআর३ কাঁচা ডেটায় তারকা রেকর্ড আউটপুট: দ্বিমুখী শ্রেণীবিভাগ লেবেল (বিস্তৃত দ্বিতারকা সিস্টেমের সদস্য কিনা) + দ্বিতারকা যুগলন সীমাবদ্ধতা: এল-বাদ্রি এবং অন্যান্যদের দ্বারা প্রতিষ্ঠিত বিস্তৃত দ্বিতারকা ক্যাটালগের উপর ভিত্তি করে তত্ত্বাবধানকৃত শেখা
গবেষণা একাধিক অ্যালগরিদম পরীক্ষা করেছে:
কাঁচা ডেটা বিতরণ অত্যন্ত ভারসাম্যহীন (४९४,६६४ বনাম ५,३३६), এসএমওটিই প্রযুক্তি ইন্টারপোলেশনের মাধ্যমে সিন্থেটিক সংখ্যালঘু শ্রেণীর নমুনা তৈরি করে, মডেল কর্মক্ষমতা উল্লেখযোগ্যভাবে উন্নত করে।
३डी কার্টেসিয়ান সমন্বয় সিস্টেম ব্যবহার করে নিকটতম প্রতিবেশী অনুসন্ধান:
D3D = √[(xA - xB)² + (yA - yB)² + (zA - zB)²]
প্রথমে ক্লাস্টারিং মাত্রা হ্রাস করা, তারপর প্রতিটি ক্লাস্টারের মধ্যে নিকটতম প্রতিবেশী অনুসন্ধান করা, কার্যকরভাবে O(n²) যুগলন জটিলতা হ্রাস করা।
এল-বাদ্রি এবং অন্যান্যদের মান উপর ভিত্তি করে: १. প্রজেক্টেড বিচ্ছিন্নতা শর্ত: s ≤ १ পিসি २. প্যারালাক্স শর্ত: |ω̃₁ - ω̃₂| < b√(σ²ω̃,१ + σ²ω̃,२) ३. কক্ষীয় স্ব-গতি শর্ত: স্ব-গতি পার্থক্য কেপলারীয় কক্ষীয় সীমাবদ্ধতা মেনে চলতে হবে
| অ্যালগরিদম | নির্ভুলতা | স্মরণ | F१ স্কোর | নির্ভুলতা |
|---|---|---|---|---|
| RFC(কাঁচা) | ०.३७५ | ०.००८ | ०.०१६ | ०.९८९ |
| RFC(SMOTE) | ०.९१७ | ०.९२३ | ०.९२० | ०.९९८ |
| অ্যালগরিদম | সত্য ইতিবাচক | সত্য ইতিবাচক হার(%) | ভুল শ্রেণীবিভাগ | ভুল শ্রেণীবিভাগ হার(%) |
|---|---|---|---|---|
| RFC(কাঁচা) | ९ | ०.८२ | १०९९ | १००.५ |
| RFC(SMOTE) | १००९ | ९२.३१ | १७५ | १६.०१ |
এসএমওটিই ভারসাম্য প্রযুক্তির প্রভাব উল্লেখযোগ্য:
१. র্যান্ডম ফরেস্ট: সর্বোত্তম কর্মক্ষমতা, এসএমওটিই ভারসাম্যের পরে ९९.८% নির্ভুলতা অর্জন করা २. সিদ্ধান্ত গাছ: দ্বিতীয় সেরা পছন্দ, ९०.०% স্মরণ হার ३. ব্যাগিং শ্রেণীবিভাজক: তৃতীয় স্থান, ८३.९% স্মরণ হার ४. অন্যান্য অ্যালগরিদম: ভারসাম্যহীন ডেটায় দুর্বল কর্মক্ষমতা
१. পরিসংখ্যানগত পদ্ধতি: এল-বাদ্রি এবং অন্যান্যরা মন্টে কার্লো সিমুলেশন ব্যবহার করে আকস্মিক সারিবদ্ধতা বাদ দেওয়া २. স্ব-গতি বিশ্লেষণ: চানামে এবং গুল্ড স্ব-গতি তথ্য প্রবর্তন করে সনাক্তকরণ নির্ভুলতা উন্নত করা ३. প্যারালাক্স সীমাবদ্ধতা: অ্যান্ড্রুজ এবং অন্যরা প্যারালাক্স এবং রেডিয়াল বেগ ব্যবহার করা
१. তারকা শ্রেণীবিভাগ: কোডি এবং অন্যরা সিম্বাড ডাটাবেসে প্রয়োগ २. কৃষ্ণ গহ্বর অ্যাক্রিশন অবস্থা: শ্রীহারি এবং নন্দীর শ্রেণীবিভাগ গবেষণা ३. মহাকর্ষ তরঙ্গ সনাক্তকরণ: কলোনিয়ারি এবং অন্যদের পরামিতি অনুমান
१. প্রথম পদ্ধতিগত: গাইয়া ডিআর३ বিস্তৃত দ্বিতারকার জন্য প্রথম এমএল কাঠামো २. শেষ থেকে শেষ সমাধান: শ্রেণীবিভাগ থেকে যুগলন পর্যন্ত সম্পূর্ণ প্রক্রিয়া ३. উন্মুক্ত উৎস সরঞ্জাম: পুনঃব্যবহারযোগ্য কোড সম্পদ প্রদান করা
१. প্রযুক্তিগত সম্ভাব্যতা: মেশিন লার্নিং পদ্ধতি বিস্তৃত দ্বিতারকা সনাক্তকরণে চমৎকার কর্মক্ষমতা প্রদর্শন করে २. এসএমওটিই গুরুত্ব: ডেটা ভারসাম্য প্রযুক্তি কর্মক্ষমতা উন্নতির জন্য গুরুত্বপূর্ণ ३. র্যান্ডম ফরেস্ট সর্বোত্তম: একাধিক অ্যালগরিদমের মধ্যে সর্বোত্তম কর্মক্ষমতা ४. ব্যবহারিক মূল্য: দ্রুত, স্কেলেবল বিশ্লেষণ সরঞ্জাম প্রদান করা
१. মন্তব্য গুণমানের উপর নির্ভরতা: মডেল কর্মক্ষমতা প্রশিক্ষণ ডেটা গুণমান দ্বারা সীমাবদ্ধ २. দূরত্ব অনিশ্চয়তা: ३डी দূরত্ব গণনায় ত্রুটি প্রসার বিদ্যমান ३. বৈশিষ্ট্য প্রকৌশল: গুরুত্বপূর্ণ শারীরিক বৈশিষ্ট্য মিস করা সম্ভব ४. সাধারণীকরণ ক্ষমতা: বিভিন্ন আকাশী অঞ্চলে কর্মক্ষমতা যাচাই করা প্রয়োজন
१. অস্বাভাবিকতা সনাক্তকরণ: এমএল তত্ত্বাবধানকৃত অস্বাভাবিকতা সনাক্তকরণ সমস্যায় প্রসারিত করা २. মহাকর্ষ তত্ত্ব পরীক্ষা: নিউটনীয় মহাকর্ষ থেকে বিচ্যুত অস্বাভাবিক বিস্তৃত দ্বিতারকা সনাক্ত করা ३. বহু-উৎস ডেটা সংমিশ্রণ: কর্মক্ষমতা উন্নত করতে আরও পর্যবেক্ষণ ডেটা একীভূত করা ४. গভীর শেখা: আরও জটিল স্নায়ু নেটওয়ার্ক আর্কিটেকচার অন্বেষণ করা
१. পদ্ধতি উদ্ভাবন: গাইয়া ডিআর३ বিস্তৃত দ্বিতারকা সনাক্তকরণে এমএল প্রথম পদ্ধতিগত প্রয়োগ २. প্রযুক্তি ব্যাপক: একাধিক পূর্ব-প্রক্রিয়াকরণ এবং শ্রেণীবিভাগ কৌশল একীভূত করা ३. কর্মক্ষমতা চমৎকার: মূল মেট্রিক্সে উল্লেখযোগ্য উন্নতি অর্জন করা ४. ব্যবহারিক মূল্য: উন্মুক্ত সরঞ্জাম ক্ষেত্র উন্নয়ন প্রচার করা ५. পরীক্ষা পর্যাপ্ত: বহু-অ্যালগরিদম তুলনা এবং বিস্তারিত কর্মক্ষমতা বিশ্লেষণ
१. তাত্ত্বিক বিশ্লেষণ: জ্যোতির্বিজ্ঞান প্রয়োগে এমএল পদ্ধতির তাত্ত্বিক গ্যারান্টির অভাব २. যাচাইকরণ পরিসীমা: একক ক্যাটালগে যাচাইকরণ, সাধারণীকরণ ক্ষমতা নিশ্চিত করা প্রয়োজন ३. শারীরিক ব্যাখ্যা: এমএল সিদ্ধান্তের শারীরিক অর্থের ব্যাখ্যা অপর্যাপ্ত ४. শব্দ মডেলিং: পর্যবেক্ষণ শব্দের প্রভাব সম্পূর্ণভাবে বিবেচনা করা হয়নি
१. একাডেমিক অবদান: জ্যোতির্বিজ্ঞান বিগ ডেটা বিশ্লেষণে নতুন চিন্তাভাবনা প্রদান করা २. ব্যবহারিক মূল্য: সরঞ্জাম সরাসরি বৈজ্ঞানিক অনুশীলনে ব্যবহার করা যায় ३. পুনরুৎপাদনযোগ্যতা: কোড উন্মুক্ত উৎস ফলাফল পুনরুৎপাদন নিশ্চিত করে ४. ক্ষেত্র প্রচার: জ্যোতির্বিজ্ঞানে এমএল প্রয়োগ প্রচার করা
१. বৃহৎ-স্কেল জ্যোতির্বৈজ্ঞানিক সমীক্ষা: গাইয়া এর মতো বড় ডেটাসেটে প্রযোজ্য २. দ্রুত স্ক্রীনিং: বিস্তৃত দ্বিতারকা প্রার্থী সিস্টেমের প্রাথমিক স্ক্রীনিং ३. সহায়ক বিশ্লেষণ: ঐতিহ্যবাহী পদ্ধতির সাথে যাচাইকরণের জন্য সহায়তা করা ४. শিক্ষা গবেষণা: এমএল জ্যোতির্বিজ্ঞান প্রয়োগের উদাহরণ হিসাবে
१. এল-বাদ্রি এবং অন্যরা (२०२१) - বিস্তৃত দ্বিতারকা ক্যাটালগ নির্মাণের ভিত্তি কাজ २. চাওয়া এবং অন্যরা (२००२) - এসএমওটিই প্রযুক্তির মূল পেপার ३. ব্রেইম্যান (२००१) - র্যান্ডম ফরেস্ট অ্যালগরিদম ४. ব্যারন (२०१९) - জ্যোতির্বিজ্ঞানে মেশিন লার্নিং প্রয়োগ পর্যালোচনা
সামগ্রিক মূল্যায়ন: এটি একটি প্রযুক্তিগতভাবে দৃঢ় এবং উচ্চ ব্যবহারিক মূল্যের প্রয়োগ-ভিত্তিক পেপার। লেখকরা মেশিন লার্নিং প্রযুক্তি জ্যোতির্বিজ্ঞানের একটি নির্দিষ্ট সমস্যায় সফলভাবে প্রয়োগ করেছেন এবং উল্লেখযোগ্য কর্মক্ষমতা উন্নতি অর্জন করেছেন। যদিও তাত্ত্বিক উদ্ভাবনে তুলনামূলকভাবে সীমিত, তবে এর উন্মুক্ত সরঞ্জাম এবং পদ্ধতিগত পদ্ধতি ক্ষেত্র উন্নয়নে বাস্তব অবদান রাখে। এই কাজ পরবর্তী মহাকর্ষ তত্ত্ব পরীক্ষা এবং অস্বাভাবিক বিস্তৃত দ্বিতারকা সনাক্তকরণের জন্য একটি গুরুত্বপূর্ণ ভিত্তি স্থাপন করে।