2025-11-16T00:07:11.969314

Automatic Piecewise Linear Regression for Predicting Student Learning Satisfaction

Choi, Nadarajan

Although student learning satisfaction has been widely studied, modern techniques such as interpretable machine learning and neural networks have not been sufficiently explored. This study demonstrates that a recent model that combines boosting with interpretability, automatic piecewise linear regression(APLR), offers the best fit for predicting learning satisfaction among several state-of-the-art approaches. Through the analysis of APLR's numerical and visual interpretations, students' time management and concentration abilities, perceived helpfulness to classmates, and participation in offline courses have the most significant positive impact on learning satisfaction. Surprisingly, involvement in creative activities did not positively affect learning satisfaction. Moreover, the contributing factors can be interpreted on an individual level, allowing educators to customize instructions according to student profiles.

academic

छात्र शिक्षण संतुष्टि की भविष्यवाणी के लिए स्वचालित खंडवार रैखिक प्रतिगमन

मूल जानकारी

पेपर ID: 2510.10639
शीर्षक: Automatic Piecewise Linear Regression for Predicting Student Learning Satisfaction
लेखक: Haemin Choi, Gayathri Nadarajan (सेंगक्योंगवन विश्वविद्यालय डेटा विज्ञान विभाग)
वर्गीकरण: cs.AI cs.LG
प्रकाशन तिथि: 12 अक्टूबर 2025
पेपर लिंक: https://arxiv.org/abs/2510.10639

सारांश

यह अनुसंधान छात्र शिक्षण संतुष्टि की भविष्यवाणी के लिए स्वचालित खंडवार रैखिक प्रतिगमन (APLR) के अनुप्रयोग की खोज करता है। यद्यपि छात्र शिक्षण संतुष्टि का व्यापक रूप से अध्ययन किया गया है, आधुनिक व्याख्यायोग्य मशीन लर्निंग और तंत्रिका नेटवर्क तकनीकों का पर्याप्त रूप से अन्वेषण नहीं किया गया है। अनुसंधान से पता चलता है कि बूस्टिंग एल्गोरिदम और व्याख्यायोग्यता को जोड़ने वाला APLR मॉडल कई अत्याधुनिक विधियों में सर्वश्रेष्ठ प्रदर्शन करता है। APLR के संख्यात्मक और दृश्य व्याख्या विश्लेषण के माध्यम से, यह पाया गया कि छात्रों का समय प्रबंधन क्षमता, ध्यान केंद्रित करने की क्षमता, सहपाठियों की सहायता की धारणा और ऑफलाइन पाठ्यक्रम भागीदारी शिक्षण संतुष्टि पर सबसे महत्वपूर्ण सकारात्मक प्रभाव डालते हैं। आश्चर्यजनक रूप से, रचनात्मक गतिविधि भागीदारी ने शिक्षण संतुष्टि पर सकारात्मक प्रभाव नहीं डाला।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

यह अनुसंधान COVID-19 महामारी के दौरान छात्र शिक्षण संतुष्टि की भविष्यवाणी और प्रभावशाली कारकों की पहचान की समस्या को हल करने का लक्ष्य रखता है। दो साल की ऑनलाइन शिक्षा के अनुभव के बाद, छात्रों की विभिन्न शिक्षण विधियों के प्रति प्राथमिकताएं बदल गई हैं, जिससे शिक्षण संतुष्टि को प्रभावित करने वाले मुख्य कारकों को गहराई से समझने की आवश्यकता है।

अनुसंधान का महत्व

शिक्षा व्यवहार मार्गदर्शन: शिक्षकों और संस्थानों को समग्र शिक्षण अनुभव को बेहतर बनाने के लिए बेहतर शिक्षण विधियों को अनुकूलित करने में सहायता करना
व्यक्तिगतकृत शिक्षा: व्यक्तिगतकृत शिक्षण के लिए वैज्ञानिक आधार प्रदान करना
महामारी प्रभाव विश्लेषण: महामारी के दौरान विशेष शिक्षण वातावरण के शिक्षण संतुष्टि पर प्रभाव को गहराई से समझना

मौजूदा विधियों की सीमाएं

पारंपरिक सांख्यिकीय विधियां: मुख्य रूप से संरचनात्मक समीकरण मॉडलिंग (SEM) और सांख्यिकीय परिकल्पना परीक्षण का उपयोग करती हैं, पूर्वानुमान क्षमता की कमी है
अधूरी विशेषता विचार: मौजूदा अनुसंधान भावनात्मक स्थिति और शिक्षण वातावरण कारकों पर शायद ही विचार करते हैं
अपर्याप्त व्याख्यायोग्यता: आधुनिक व्याख्यायोग्य मशीन लर्निंग तकनीकों के अनुप्रयोग की कमी है

मुख्य योगदान

विधि प्रदर्शन श्रेष्ठता: APLR 5 मूल्यांकन मेट्रिक्स में से 4 पर प्रतिनिधि बैगिंग और बूस्टिंग ट्री मॉडल, व्याख्यायोग्य योजक मॉडल और Transformer-आधारित गहन शिक्षण मॉडल से बेहतर है
व्यापक व्याख्यायोग्यता विश्लेषण: वैश्विक और स्थानीय व्याख्या प्रदान करता है, समग्र जनसंख्या और व्यक्तिगत छात्रों की शिक्षण संतुष्टि प्रभावशाली कारकों के लिए मूल्यवान अंतर्दृष्टि प्रदान करता है
व्यक्तिगतकृत शिक्षा समर्थन: व्यक्तिगतकृत शिक्षा के लिए मार्ग प्रशस्त करता है, शिक्षकों को छात्र प्रोफाइल के अनुसार शिक्षण को अनुकूलित करने में सक्षम बनाता है
डेटासेट और कोड ओपन सोर्स: अनुसंधान समुदाय के उपयोग के लिए पूर्ण कार्यान्वयन कोड और डेटासेट प्रदान करता है

विधि विवरण

कार्य परिभाषा

इनपुट: 47 विशेषताएं, जिनमें जनसांख्यिकीय जानकारी, शिक्षण विधियां, कथित प्रदर्शन, आत्म-प्रभावकारिता, प्रेरणा, भागीदारी, भावनात्मक स्थिति, तनाव मुकाबला तंत्र और शिक्षण वातावरण शामिल हैं आउटपुट: द्विआधारी वर्गीकरण कार्य, छात्र शिक्षण संतुष्टि की भविष्यवाणी (संतुष्ट/असंतुष्ट) बाधाएं: 7 मुख्य विशेषताओं के आधार पर लक्ष्य चर का निर्माण, कुल स्कोर ≥4 संतुष्ट है, अन्यथा असंतुष्ट है

मॉडल आर्किटेक्चर

APLR मुख्य तंत्र

APLR ग्रेडिएंट बूस्टिंग और बहुभिन्न अनुकूली प्रतिगमन स्पलाइन (MARS) के लाभों को जोड़ता है:

घटक-वार ग्रेडिएंट बूस्टिंग: प्रत्येक सरल आधार शिक्षार्थी एक भविष्यवाणी चर को अनुकूलित करता है, सबसे अधिक हानि फ़ंक्शन को कम करने में सहायक शिक्षार्थी को चुनता है

बूस्टिंग चरण (m = 1 से M):

नकारात्मक ग्रेडिएंट गणना: u_m = y - f̂_{m-1}(C_{m-1})
अवरोधन अद्यतन: u_m के भारित माध्य को सीखने की दर v से गुणा करके उपयोग करें
आधार फ़ंक्शन चयन: प्रत्येक उम्मीदवार e_j के लिए सर्वोत्तम APLR आधार फ़ंक्शन h_m(u_m, e_j) खोजें
पद चयन: सबसे कम हानि वाले पद को उम्मीदवार के रूप में चुनें
गुणांक अद्यतन: प्रतिगमन गुणांक β को अद्यतन करें

प्रतिगमन गुणांक अनुमान: $β = v \cdot \frac{\sum_{i=1}^{n_{eff}} f(x_i) \cdot w_i \cdot u_{m,i}}{\sum_{i=1}^{n_{eff}} f(x_i)^2 \cdot w_i}$

तकनीकी नवाचार बिंदु

खंडवार रैखिक प्रसंस्करण: EBM के योजक चिकनी कार्यों की तुलना में, APLR डेटा को खंडों में विभाजित करता है और प्रत्येक खंड के लिए रैखिक मॉडल को फिट करता है
अंतःक्रिया पद विचार: स्वचालित रूप से विशेषताओं के बीच अंतःक्रिया संबंधों की पहचान और मॉडलिंग करता है
कम्प्यूटेशनल दक्षता: EBM की तुलना में अधिक कुशल, यादृच्छिक वन और बूस्टिंग ट्री की तुलना में अधिक उपयोग में आसान
दोहरी व्याख्यायोग्यता: वैश्विक विशेषता महत्व और स्थानीय योगदान व्याख्या दोनों प्रदान करता है

प्रयोगात्मक सेटअप

डेटासेट

आकार: सेंगक्योंगवन विश्वविद्यालय के 302 छात्र
समय अवधि: 2021 के अंत से 2022 के अंत तक (4 सेमेस्टर की ऑनलाइन शिक्षा के बाद)
संरचना: 88% पूर्णकालिक छात्र, 12% विनिमय छात्र
विषय वितरण: STEM (41.4%), मानविकी और सामाजिक विज्ञान (40.6%), मिश्रित श्रेणी (18%)
पाठ्यक्रम मोड: 76.82% ऑनलाइन पाठ्यक्रम, 23.18% ऑफलाइन पाठ्यक्रम

डेटा पूर्व-प्रसंस्करण

एन्कोडिंग विधि: 5-बिंदु लिकर्ट स्केल को संख्यात्मक (-2 से 2) में परिवर्तित करें
लक्ष्य चर निर्माण: 7 मुख्य विशेषताओं के भारित योग के आधार पर
डेटा विभाजन: प्रशिक्षण सेट 241 नमूने, परीक्षण सेट 61 नमूने (8:2 अनुपात)
संतुलन प्रसंस्करण: वर्ग असंतुलन को संभालने के लिए SMOTE तकनीक का उपयोग करें

मूल्यांकन मेट्रिक्स

सटीकता (Accuracy)
F1 स्कोर
परिशुद्धता (Precision)
रिकॉल (Recall)
AUC (ROC वक्र के अंतर्गत क्षेत्र)

तुलनात्मक विधियां

यादृच्छिक वन (Random Forest): बैगिंग एल्गोरिदम प्रतिनिधि
LightGBM: कुशल ग्रेडिएंट बूस्टिंग एल्गोरिदम
व्याख्यायोग्य बूस्टिंग मशीन (EBM): व्याख्यायोग्य मशीन लर्निंग बेंचमार्क
TabNet: Transformer-आधारित गहन शिक्षण मॉडल

हाइपरपैरामीटर ट्यूनिंग

यादृच्छिक वन: ग्रिड खोज + 5-गुना क्रॉस-सत्यापन
LightGBM: बेयेसियन अनुकूलन (Optuna पैकेज)
APLR: 5-गुना क्रॉस-सत्यापन ग्रिड खोज के लिए अंतर्निहित APLRTuner
EBM और TabNet: डिफ़ॉल्ट अनुशंसित पैरामीटर का उपयोग करें

प्रयोगात्मक परिणाम

मुख्य परिणाम

मॉडल	सटीकता	F1 स्कोर	परिशुद्धता	रिकॉल	AUC
APLR	0.885	0.909	0.921	0.897	0.926
Random Forest	0.820	0.853	0.889	0.820	0.947
LightGBM	0.803	0.846	0.846	0.846	0.889
EBM	0.820	0.853	0.889	0.821	0.918
TabNet	0.836	0.872	0.872	0.872	0.818

मुख्य निष्कर्ष:

APLR 5 मेट्रिक्स में से 4 पर सर्वश्रेष्ठ प्रदर्शन प्राप्त करता है
केवल AUC मेट्रिक पर यादृच्छिक वन से थोड़ा कम (0.926 बनाम 0.947)
अन्य व्याख्यायोग्य मॉडल (EBM) से महत्वपूर्ण रूप से बेहतर

मॉडल व्याख्या विश्लेषण

वैश्विक विशेषता महत्व (शीर्ष 5)

समय प्रबंधन क्षमता (m_timeManage): 0.534
ध्यान केंद्रित करने की क्षमता (m_concentrate): 0.516
सहपाठियों के प्रति सहायता की भावना (m_helpful): 0.365
पाठ्यक्रम बोरियत और समय प्रबंधन अंतःक्रिया: 0.297
ऑफलाइन पाठ्यक्रम भागीदारी (mode_Offline): 0.297

मुख्य निष्कर्ष

सकारात्मक कारक: समय प्रबंधन, ध्यान केंद्रित करने की क्षमता, सहायता की भावना, ऑफलाइन शिक्षा भागीदारी
नकारात्मक कारक: रचनात्मक गतिविधि भागीदारी (गुणांक -0.15)
अंतःक्रिया प्रभाव: कई विशेषताओं के बीच महत्वपूर्ण अंतःक्रिया संबंध

केस विश्लेषण

संतुष्ट छात्र केस

अधिकतम योगदान कारक: सहायता की भावना (0.681), बोरियत न महसूस करना (0.553)
समर्थन कारक: समय प्रबंधन (0.447), ध्यान केंद्रित करने की क्षमता (0.444)
नकारात्मक कारक: रचनात्मक गतिविधि भागीदारी (-0.390)

असंतुष्ट छात्र केस

मुख्य समस्या: खराब समय प्रबंधन (1.255), दूसरों की सहायता न कर पाना (0.681)
शमन कारक: ध्यान केंद्रित करने की क्षमता ठीक है (-0.444, नकारात्मक योगदान असंतुष्टि को कम करने का संकेत देता है)

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

विधि प्रभावकारिता: APLR छात्र शिक्षण संतुष्टि भविष्यवाणी कार्य पर उत्कृष्ट प्रदर्शन करता है
मुख्य प्रभावशाली कारक: समय प्रबंधन, ध्यान केंद्रित करने की क्षमता, सहायता की भावना और ऑफलाइन भागीदारी मुख्य सकारात्मक कारक हैं
आश्चर्यजनक खोज: रचनात्मक गतिविधि भागीदारी शिक्षण संतुष्टि पर सकारात्मक प्रभाव नहीं डालती है
व्यक्तिगतकरण संभावना: स्थानीय व्याख्या व्यक्तिगतकृत शिक्षण रणनीति तैयार करने का समर्थन करती है

सीमाएं

डेटा आकार: केवल 302 नमूने, परिणामों की सामान्यीकरण क्षमता को प्रभावित कर सकते हैं
भौगोलिक प्रतिबंध: केवल दक्षिण कोरिया के एक विश्वविद्यालय के छात्रों तक सीमित
समय विशिष्टता: विशेष रूप से महामारी अवधि के लिए, महामारी के बाद की अवधि में प्रयोज्यता सत्यापन की आवश्यकता है
वर्गीकरण कार्य सत्यापन: APLR पर वर्गीकरण कार्य पर कठोर परीक्षण अपेक्षाकृत सीमित है

भविष्य की दिशाएं

महामारी के बाद की तुलनात्मक अनुसंधान: महामारी से पहले और बाद में मुख्य कारकों में परिवर्तन की तुलना करें
बहु-आयामी विस्तार: शिक्षण प्रेरणा, शैक्षणिक प्रदर्शन आदि अन्य आयामों का अनुसंधान करें
क्रॉस-क्षेत्रीय सत्यापन: विभिन्न सांस्कृतिक पृष्ठभूमि में मॉडल प्रभावकारिता को सत्यापित करें
वास्तविक समय अनुप्रयोग: वास्तविक समय शिक्षण संतुष्टि निगरानी प्रणाली विकसित करें

गहन मूल्यांकन

शक्तियां

विधि नवाचार: शिक्षा डेटा माइनिंग के क्षेत्र में APLR का पहला अनुप्रयोग, व्याख्यायोग्य AI का मूल्य प्रदर्शित करता है
कठोर प्रयोगात्मक डिजाइन: व्यापक हाइपरपैरामीटर ट्यूनिंग और बहु-मॉडल तुलना
समृद्ध व्याख्यायोग्यता: वैश्विक और स्थानीय दोहरी व्याख्या प्रदान करता है, व्यावहारिक अनुप्रयोग मूल्य है
आश्चर्यजनक खोज मूल्यवान: रचनात्मक गतिविधि और शिक्षण संतुष्टि के बीच नकारात्मक संबंध गहन अनुसंधान के योग्य है

कमियां

नमूना प्रतिनिधित्व: एकल विश्वविद्यालय नमूना चयन पूर्वाग्रह मौजूद हो सकता है
कारण संबंध: अनुप्रस्थ अनुसंधान कारण संबंध स्थापित नहीं कर सकता है
विशेषता इंजीनियरिंग: लक्ष्य चर निर्माण विधि की तर्कसंगतता को अधिक सत्यापन की आवश्यकता है
गहन विश्लेषण अपर्याप्त: आश्चर्यजनक खोज (जैसे रचनात्मक गतिविधि का नकारात्मक प्रभाव) के लिए गहन अन्वेषण की कमी है

प्रभाव

शैक्षणिक योगदान: शिक्षा डेटा माइनिंग क्षेत्र में नई व्याख्यायोग्य AI विधि का परिचय
व्यावहारिक मूल्य: शिक्षकों को व्यक्तिगतकृत शिक्षण के लिए वैज्ञानिक आधार प्रदान करता है
पुनरुत्पादनीयता: ओपन सोर्स कोड और डेटासेट अनुसंधान पुनरुत्पादन और विस्तार को बढ़ावा देते हैं
अंतर-विषय संभावना: APLR विधि अन्य छोटे आकार की संरचित डेटा परिस्थितियों पर लागू हो सकती है

प्रयोज्य परिदृश्य

छोटे आकार की शिक्षा डेटा: विशेष रूप से सीमित नमूना आकार वाले शिक्षा अनुसंधान के लिए उपयुक्त
व्याख्यायोग्यता की आवश्यकता वाले भविष्यवाणी कार्य: शिक्षा निर्णय को व्याख्यायोग्य AI समर्थन की आवश्यकता है
व्यक्तिगतकृत शिक्षा: छात्र विशेषताओं के आधार पर अनुकूलित शिक्षण रणनीति का समर्थन करता है
नीति निर्माण: शिक्षा नीति के लिए डेटा-संचालित निर्णय समर्थन प्रदान करता है

संदर्भ

पेपर ने 35 संबंधित संदर्भों का हवाला दिया है, जिसमें शिक्षण संतुष्टि अनुसंधान, व्याख्यायोग्य मशीन लर्निंग, शिक्षा प्रौद्योगिकी और अन्य क्षेत्रों के महत्वपूर्ण कार्य शामिल हैं, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं।

समग्र मूल्यांकन: यह शिक्षा डेटा माइनिंग क्षेत्र में व्याख्यायोग्य AI के अनुप्रयोग का एक उच्च-गुणवत्ता वाला अनुसंधान पत्र है, विधि नवाचारी है, प्रयोग कठोर है, परिणाम मूल्यवान हैं, लेकिन नमूना आकार और सामान्यीकरण क्षमता के संदर्भ में कुछ सीमाएं हैं। अनुसंधान व्यक्तिगतकृत शिक्षा के लिए मूल्यवान तकनीकी उपकरण और अनुभवजन्य अंतर्दृष्टि प्रदान करता है।