Detecting wide binaries using machine learning algorithms
Ashesh, Kaur, Aashish
We present a machine learning (ML) framework for the detection of wide binary star systems using Gaia DR3 data. By training supervised ML models on established wide binary catalogues, we efficiently classify wide binaries and employ clustering and nearest neighbour search to pair candidate systems. Our approach incorporates data preprocessing techniques such as SMOTE, correlation analysis, and PCA, and achieves high accuracy and recall in the task of wide binary classification. The resulting publicly available code enables rapid, scalable, and customizable analysis of wide binaries, complementing conventional analyses and providing a valuable resource for future astrophysical studies.
academic
كشف النجوم الثنائية الواسعة باستخدام خوارزميات التعلم الآلي
العنوان: كشف النجوم الثنائية الواسعة باستخدام خوارزميات التعلم الآلي
المؤلفون: أموي أشيش (معهد الهند للتكنولوجيا فرع باتنا وكلية ترينيتي دبلن)، هارسيمران كاور (معهد الهند للتكنولوجيا فرع باتنا)، ساندييب آشيش (معهد الهند للتكنولوجيا فرع باتنا)
يقدم هذا البحث إطار عمل قائم على التعلم الآلي لكشف أنظمة النجوم الثنائية الواسعة باستخدام بيانات Gaia DR3. من خلال تدريب نماذج التعلم الآلي الموجهة على فهارس النجوم الثنائية الواسعة المعروفة، يصنف الباحثون النجوم الثنائية الواسعة بكفاءة، ويستخدمون التجميع والبحث عن أقرب الجيران لمطابقة الأنظمة المرشحة. تدمج الطريقة تقنيات معالجة البيانات الأولية مثل SMOTE وتحليل الارتباط و PCA، محققة دقة واستدعاء عاليين في مهمة تصنيف النجوم الثنائية الواسعة. يوفر البحث رمزاً مفتوح المصدر يمكّن من تحليل سريع وقابل للتوسع وقابل للتخصيص للنجوم الثنائية الواسعة، مما يوفر تكملة فعالة للطرق التحليلية التقليدية وموارد قيمة للأبحاث الفيزيائية الفلكية المستقبلية.
أنظمة النجوم الثنائية الواسعة تتكون من زوج من النجوم المرتبطة بالجاذبية على مسافات تتراوح من آلاف إلى عشرات آلاف الوحدات الفلكية. تعمل هذه الأنظمة في بيئات منخفضة التسارع، مما يجعلها مختبراً مثالياً لاختبار نظريات الجاذبية المعدلة والانحرافات عن الجاذبية القياسية.
توفر طرق التعلم الآلي بدائل قابلة للتوسع، حيث تتنبأ بكفاءة بأنظمة النجوم الثنائية من السكان الخلفيين الضوضائيين من خلال خوارزميات التجميع وتقنيات البحث عن أقرب الجيران، مما يوفر أدوات للبحث عن فيزياء جديدة.
الإدخال: سجلات النجوم من بيانات Gaia DR3 الخام
الإخراج: تسميات التصنيف الثنائي (عضوية نظام النجوم الثنائية الواسعة أم لا) + مطابقة النجوم الثنائية
القيود: التعلم الموجه بناءً على فهرس النجوم الثنائية الواسعة الذي أنشأه El-Badry وآخرون
توزيع البيانات الأصلية غير متوازن بشكل كبير (494,664 مقابل 5,336)، حيث تقوم تقنية SMOTE بإنشاء عينات اصطناعية من الفئة الأقلية من خلال الاستيفاء، مما يحسن أداء النموذج بشكل كبير.
El-Badry et al. (2021) - العمل الأساسي لبناء فهرس النجوم الثنائية الواسعة
Chawla et al. (2002) - الورقة الأصلية لتقنية SMOTE
Breiman (2001) - خوارزمية الغابة العشوائية
Baron (2019) - مراجعة شاملة لتطبيقات التعلم الآلي في الفلك
التقييم الإجمالي: هذا بحث تطبيقي متين وعملي القيمة. طبق المؤلفون بنجاح تقنيات التعلم الآلي على مشكلة محددة في الفيزياء الفلكية، محققين تحسينات أداء كبيرة. على الرغم من أن الابتكار النظري محدود نسبياً، فإن الأداة مفتوحة المصدر والطريقة المنهجية تقدمان مساهمات جوهرية لتطور المجال. يضع هذا العمل أساساً مهماً للتحقق اللاحق من نظريات الجاذبية واكتشاف النجوم الثنائية الواسعة الشاذة.