Detecting wide binaries using machine learning algorithms
Ashesh, Kaur, Aashish
We present a machine learning (ML) framework for the detection of wide binary star systems using Gaia DR3 data. By training supervised ML models on established wide binary catalogues, we efficiently classify wide binaries and employ clustering and nearest neighbour search to pair candidate systems. Our approach incorporates data preprocessing techniques such as SMOTE, correlation analysis, and PCA, and achieves high accuracy and recall in the task of wide binary classification. The resulting publicly available code enables rapid, scalable, and customizable analysis of wide binaries, complementing conventional analyses and providing a valuable resource for future astrophysical studies.
academic
मशीन लर्निंग एल्गोरिदम का उपयोग करके विस्तृत बाइनरी का पता लगाना
शीर्षक: मशीन लर्निंग एल्गोरिदम का उपयोग करके विस्तृत बाइनरी का पता लगाना
लेखक: अमॉय अशेष (भारतीय प्रौद्योगिकी संस्थान पटना & ट्रिनिटी कॉलेज डबलिन), हरसिमरन कौर (भारतीय प्रौद्योगिकी संस्थान पटना), संदीप आशीष (भारतीय प्रौद्योगिकी संस्थान पटना)
यह पेपर Gaia DR3 डेटा का उपयोग करके विस्तृत बाइनरी सिस्टम का पता लगाने के लिए एक मशीन लर्निंग ढांचा प्रस्तावित करता है। स्थापित विस्तृत बाइनरी कैटलॉग पर पर्यवेक्षित मशीन लर्निंग मॉडल को प्रशिक्षित करके, शोधकर्ताओं ने विस्तृत बाइनरी का कुशलतापूर्वक वर्गीकरण किया है, और क्लस्टरिंग तथा निकटतम पड़ोसी खोज का उपयोग करके उम्मीदवार सिस्टम को जोड़ा है। यह विधि SMOTE, सहसंबंध विश्लेषण और PCA जैसी डेटा पूर्व-प्रसंस्करण तकनीकों को एकीकृत करती है, विस्तृत बाइनरी वर्गीकरण कार्य में उच्च सटीकता और रिकॉल प्राप्त करती है। यह अनुसंधान प्रदान किया गया सार्वजनिक कोड विस्तृत बाइनरी के तेजी से, स्केलेबल और अनुकूलन योग्य विश्लेषण को सक्षम बनाता है, पारंपरिक विश्लेषण विधियों के लिए एक प्रभावी पूरक प्रदान करता है, और भविष्य के खगोल भौतिकी अनुसंधान के लिए मूल्यवान संसाधन प्रदान करता है।
विस्तृत बाइनरी सिस्टम दो तारों की जोड़ी हैं जो हजारों से लेकर दसियों हजार खगोलीय इकाइयों की दूरी पर गुरुत्वाकर्षण से बंधे होते हैं। ये सिस्टम कम त्वरण वाले वातावरण में संचालित होते हैं, और संशोधित गुरुत्वाकर्षण सिद्धांत और मानक गुरुत्वाकर्षण विचलन का परीक्षण करने के लिए आदर्श प्रयोगशाला हैं।
कम्प्यूटेशनल जटिलता: पारंपरिक सांख्यिकीय विधियां मोंटे कार्लो सिमुलेशन और जटिल संभाव्यता विश्लेषण पर निर्भर करती हैं, जिनकी कम्प्यूटेशनल लागत अधिक है
शोर और प्रदूषण: वास्तविक गुरुत्वाकर्षण-बंधे जोड़ों की पहचान करना और उनके गतिशील विसंगतियों का पता लगाना शोर, प्रदूषण और डेटा पैमाने के जटिल प्रभाव से प्रभावित होता है
संयोगवश संरेखण: अलगाव दूरी बढ़ने के साथ, संयोगवश संरेखण की संख्या बढ़ती है, जो सटीक पहचान में चुनौती पेश करती है
मशीन लर्निंग विधियां क्लस्टरिंग एल्गोरिदम और निकटतम पड़ोसी खोज तकनीकों के माध्यम से, शोर पृष्ठभूमि जनसंख्या से बाइनरी सिस्टम को कुशलतापूर्वक भविष्यवाणी करने के लिए स्केलेबल विकल्प प्रदान करती हैं, नई भौतिकी की खोज के लिए उपकरण प्रदान करती हैं।
इनपुट: Gaia DR3 कच्चे डेटा में तारकीय रिकॉर्ड
आउटपुट: बाइनरी वर्गीकरण लेबल (विस्तृत बाइनरी सिस्टम सदस्य है या नहीं) + बाइनरी जोड़ी
बाधा: El-Badry आदि द्वारा स्थापित विस्तृत बाइनरी कैटलॉग पर आधारित पर्यवेक्षित शिक्षण
कच्चे डेटा वितरण अत्यंत असंतुलित है (494,664 vs 5,336), SMOTE तकनीक प्रक्षेप के माध्यम से सिंथेटिक अल्पसंख्यक वर्ग नमूने उत्पन्न करती है, मॉडल प्रदर्शन में उल्लेखनीय सुधार करती है।
El-Badry et al. (2021) - विस्तृत बाइनरी कैटलॉग निर्माण का मूल कार्य
Chawla et al. (2002) - SMOTE तकनीक का मूल पेपर
Breiman (2001) - रैंडम फॉरेस्ट एल्गोरिदम
Baron (2019) - खगोल विज्ञान में मशीन लर्निंग अनुप्रयोग सर्वेक्षण
समग्र मूल्यांकन: यह एक तकनीकी रूप से ठोस और व्यावहारिक मूल्य वाला अनुप्रयोग-उन्मुख पेपर है। लेखकों ने खगोल भौतिकी की एक विशिष्ट समस्या में मशीन लर्निंग तकनीक को सफलतापूर्वक लागू किया है, महत्वपूर्ण प्रदर्शन सुधार प्राप्त किए हैं। हालांकि सैद्धांतिक नवाचार के मामले में अपेक्षाकृत सीमित है, लेकिन इसका खुला स्रोत उपकरण और व्यवस्थित विधि क्षेत्र विकास में वास्तविक योगदान देती है। यह कार्य बाद के गुरुत्वाकर्षण सिद्धांत परीक्षण और असामान्य विस्तृत बाइनरी पहचान के लिए एक महत्वपूर्ण आधार स्थापित करता है।