2025-11-16T00:07:11.969314

Automatic Piecewise Linear Regression for Predicting Student Learning Satisfaction

Choi, Nadarajan

Although student learning satisfaction has been widely studied, modern techniques such as interpretable machine learning and neural networks have not been sufficiently explored. This study demonstrates that a recent model that combines boosting with interpretability, automatic piecewise linear regression(APLR), offers the best fit for predicting learning satisfaction among several state-of-the-art approaches. Through the analysis of APLR's numerical and visual interpretations, students' time management and concentration abilities, perceived helpfulness to classmates, and participation in offline courses have the most significant positive impact on learning satisfaction. Surprisingly, involvement in creative activities did not positively affect learning satisfaction. Moreover, the contributing factors can be interpreted on an individual level, allowing educators to customize instructions according to student profiles.

academic

الانحدار الخطي المتعدد المراحل التلقائي للتنبؤ برضا الطلاب عن التعلم

المعلومات الأساسية

معرّف الورقة البحثية: 2510.10639
العنوان: الانحدار الخطي المتعدد المراحل التلقائي للتنبؤ برضا الطلاب عن التعلم
المؤلفون: Haemin Choi, Gayathri Nadarajan (قسم علوم البيانات، جامعة سونغكيونكوان)
التصنيف: cs.AI cs.LG
تاريخ النشر: 12 أكتوبر 2025
رابط الورقة: https://arxiv.org/abs/2510.10639

الملخص

تستكشف هذه الدراسة تطبيق الانحدار الخطي المتعدد المراحل التلقائي (APLR) في التنبؤ برضا الطلاب عن التعلم. على الرغم من أن رضا الطلاب عن التعلم قد تمت دراسته على نطاق واسع، إلا أن تقنيات التعلم الآلي القابل للتفسير الحديثة والشبكات العصبية لم تُستكشف بشكل كافٍ. تُظهر الدراسة أن نموذج APLR الذي يجمع بين خوارزميات التعزيز والقابلية للتفسير يحقق أفضل أداء بين العديد من الطرق المتقدمة. من خلال التحليل العددي والبصري للتفسيرات التي يوفرها APLR، تم اكتشاف أن إدارة الوقت لدى الطلاب والقدرة على التركيز والشعور بمساعدة الزملاء والمشاركة في الدروس غير المتزامنة لها التأثير الإيجابي الأكثر أهمية على رضا التعلم. وبشكل مفاجئ، لم تؤثر المشاركة في الأنشطة الإبداعية بشكل إيجابي على رضا التعلم.

السياق البحثي والدافع

تعريف المشكلة

تهدف هذه الدراسة إلى حل مشكلة التنبؤ برضا الطلاب عن التعلم وتحديد العوامل المؤثرة عليه خلال جائحة كوفيد-19. بعد تجربة سنتين من التعلم عبر الإنترنت، تغيرت تفضيلات الطلاب لأساليب التعلم المختلفة، مما يتطلب فهماً عميقاً للعوامل الرئيسية المؤثرة على رضا التعلم.

أهمية البحث

التوجيه التربوي العملي: مساعدة المعلمين والمؤسسات على تخصيص أساليب تدريس أفضل لتحسين تجربة التعلم الشاملة
التعلم الشخصي: توفير أساس علمي للتدريس الشخصي
تحليل تأثير الجائحة: فهم عميق لتأثير بيئة التدريس الخاصة خلال الجائحة على رضا التعلم

قيود الطرق الموجودة

الطرق الإحصائية التقليدية: تعتمد بشكل أساسي على نمذجة المعادلات البنيوية (SEM) والاختبارات الإحصائية، وتفتقر إلى القدرة التنبؤية
عدم اكتمال اعتبار الميزات: تندر الدراسات الموجودة التي تأخذ في الاعتبار الحالة العاطفية وعوامل بيئة التعلم
نقص القابلية للتفسير: غياب تطبيق تقنيات التعلم الآلي القابل للتفسير الحديثة

المساهمات الأساسية

تفوق الأداء المنهجي: يتفوق APLR على 4 من 5 مقاييس تقييم على نماذج الأشجار المعززة والمحزومة الممثلة والنماذج الإضافية القابلة للتفسير ونماذج التعلم العميق القائمة على Transformer
تحليل قابلية التفسير الشامل: توفير تفسيرات عامة وموضعية، مما يوفر رؤى قيمة حول العوامل المؤثرة على رضا التعلم للمجموعة الكلية والطلاب الأفراد
دعم التعلم الشخصي: تمهيد الطريق للتعلم الشخصي، مما يمكّن المعلمين من تخصيص التدريس بناءً على ملف الطالب
فتح المصدر للبيانات والأكواد: توفير أكواد التنفيذ الكاملة ومجموعات البيانات لاستخدام المجتمع البحثي

شرح الطريقة

تعريف المهمة

الإدخال: 47 ميزة، تشمل المعلومات الديموغرافية وأساليب التعلم والأداء المدرك والكفاءة الذاتية والدافعية والمشاركة والحالة العاطفية وآليات التعامل مع الضغط وبيئة التعلم وغيرها الإخراج: مهمة تصنيف ثنائي، التنبؤ برضا الطلاب عن التعلم (راضٍ/غير راضٍ) القيود: بناء متغير الهدف على أساس 7 ميزات أساسية، الدرجة الإجمالية ≥ 4 تعني راضٍ، وإلا فهو غير راضٍ

معمارية النموذج

آلية APLR الأساسية

يجمع APLR بين مزايا التعزيز المتدرج والأشرطة الانحدار التكيفية متعددة المتغيرات (MARS):

التعزيز المتدرج المكون: يناسب كل متعلم أساسي بسيط متغيراً تنبؤياً واحداً، ويختار المتعلم الذي يساهم بشكل أكبر في تقليل دالة الخسارة

خطوات التعزيز (m = 1 إلى M):

حساب التدرج السالب: u_m = y - f̂_{m-1}(C_{m-1})
تحديث الجزء المقطوع: استخدام المتوسط المرجح لـ u_m مضروباً في معدل التعلم v
اختيار الدالة الأساسية: العثور على أفضل دالة أساسية APLR لكل مرشح e_j
اختيار الحد: اختيار الحد ذو الخسارة الأقل كمرشح
تحديث المعاملات: تحديث معاملات الانحدار β

تقدير معاملات الانحدار: $β = v \cdot \frac{\sum_{i=1}^{n_{eff}} f(x_i) \cdot w_i \cdot u_{m,i}}{\sum_{i=1}^{n_{eff}} f(x_i)^2 \cdot w_i}$

نقاط الابتكار التقني

معالجة الخطية المتعددة المراحل: بدلاً من الدوال الإضافية الملساء في EBM، يقسم APLR البيانات ويناسب نموذج خطي لكل قسم
اعتبار حدود التفاعل: تحديد وتصميم العلاقات التفاعلية بين الميزات تلقائياً
الكفاءة الحسابية: أكثر كفاءة من EBM وأسهل استخداماً من الغابات العشوائية وأشجار التعزيز
القابلية المزدوجة للتفسير: توفير أهمية الميزات العامة والتفسيرات المساهمة الموضعية

إعداد التجربة

مجموعة البيانات

الحجم: 302 طالب من جامعة سونغكيونكوان
الفترة الزمنية: نهاية 2021 - نهاية 2022 (بعد تجربة 4 فصول دراسية من التعلم عبر الإنترنت)
التكوين: 88% طلاب بدوام كامل، 12% طلاب تبادل
توزيع التخصصات: STEM (41.4%)، العلوم الإنسانية والاجتماعية (40.6%)، فئات مختلطة (18%)
أنماط الدورات: 76.82% دورات عبر الإنترنت، 23.18% دورات غير متزامنة

معالجة البيانات المسبقة

طريقة الترميز: تحويل مقياس ليكرت الخماسي إلى قيم رقمية (-2 إلى 2)
بناء متغير الهدف: بناءً على المجموع المرجح لـ 7 ميزات أساسية
تقسيم البيانات: 241 عينة في مجموعة التدريب، 61 عينة في مجموعة الاختبار (نسبة 8:2)
معالجة عدم التوازن: استخدام تقنية SMOTE للتعامل مع عدم توازن الفئات

مقاييس التقييم

الدقة (Accuracy)
درجة F1
الدقة (Precision)
الاستدعاء (Recall)
AUC (المساحة تحت منحنى ROC)

الطرق المقارنة

الغابة العشوائية (Random Forest): ممثل خوارزمية التحزيم
LightGBM: خوارزمية التعزيز المتدرج الفعالة
آلة التعزيز القابلة للتفسير (EBM): معيار التعلم الآلي القابل للتفسير
TabNet: نموذج التعلم العميق القائم على Transformer

ضبط المعاملات الفائقة

الغابة العشوائية: البحث الشبكي + التحقق المتقاطع 5 أضعاف
LightGBM: التحسين البايزي (حزمة Optuna)
APLR: البحث الشبكي للتحقق المتقاطع 5 أضعاف باستخدام APLRTuner المدمج
EBM و TabNet: استخدام المعاملات الافتراضية الموصى بها

نتائج التجربة

النتائج الرئيسية

النموذج	الدقة	درجة F1	الدقة	الاستدعاء	AUC
APLR	0.885	0.909	0.921	0.897	0.926
الغابة العشوائية	0.820	0.853	0.889	0.820	0.947
LightGBM	0.803	0.846	0.846	0.846	0.889
EBM	0.820	0.853	0.889	0.821	0.918
TabNet	0.836	0.872	0.872	0.872	0.818

الاكتشافات الرئيسية:

يحقق APLR أفضل أداء على 4 من 5 مقاييس
أقل قليلاً من الغابة العشوائية فقط في مقياس AUC (0.926 مقابل 0.947)
يتفوق بشكل ملحوظ على نماذج قابلة للتفسير أخرى (EBM)

تحليل تفسير النموذج

أهمية الميزات العامة (أفضل 5)

إدارة الوقت (m_timeManage): 0.534
القدرة على التركيز (m_concentrate): 0.516
الشعور بمساعدة الزملاء (m_helpful): 0.365
التفاعل بين ملل الدورة وإدارة الوقت: 0.297
المشاركة في الدروس غير المتزامنة (mode_Offline): 0.297

الاكتشافات الرئيسية

العوامل الإيجابية: إدارة الوقت والقدرة على التركيز والشعور بمساعدة الآخرين والمشاركة في التعلم غير المتزامن
العوامل السلبية: المشاركة في الأنشطة الإبداعية (معامل -0.15)
تأثيرات التفاعل: وجود علاقات تفاعلية ملحوظة بين ميزات متعددة

تحليل الحالات

حالة طالب راضٍ

أكبر عوامل مساهمة: الشعور بمساعدة الآخرين (0.681)، عدم الشعور بالملل (0.553)
عوامل داعمة: إدارة الوقت (0.447)، القدرة على التركيز (0.444)
عوامل سلبية: المشاركة في الأنشطة الإبداعية (-0.390)

حالة طالب غير راضٍ

المشاكل الرئيسية: إدارة وقت ضعيفة (1.255)، عدم القدرة على مساعدة الآخرين (0.681)
عوامل تخفيفية: القدرة على التركيز معقولة (-0.444، المساهمة السلبية تشير إلى التخفيف من عدم الرضا)

الأعمال ذات الصلة

أبحاث رضا التعلم

أبحاث الكفاءة الذاتية: أظهرت دراسات متعددة ارتباطاً إيجابياً بين الكفاءة الذاتية ورضا التعلم عبر الإنترنت
مشاركة الطلاب: للمشاركة تأثير إيجابي على رضا التعلم عبر الإنترنت
العلاقات التفاعلية: للتفاعل بين المتعلمين والتفاعل بين المعلم والطالب تأثيرات إيجابية على الرضا

تطور الطرق التقنية

الطرق التقليدية: تعتمد بشكل أساسي على نمذجة المعادلات البنيوية (SEM)
الاختبارات الإحصائية: الاختبارات الإحصائية كمكون تحليلي رئيسي
الذكاء الاصطناعي الحديث: تطبيق غير كافٍ لتقنيات التعلم الآلي القابل للتفسير والتعلم العميق

الخلاصة والمناقشة

الاستنتاجات الرئيسية

فعالية الطريقة: يحقق APLR أداءً ممتازاً في مهمة التنبؤ برضا الطلاب عن التعلم
العوامل المؤثرة الرئيسية: إدارة الوقت والقدرة على التركيز والشعور بمساعدة الآخرين والمشاركة غير المتزامنة هي العوامل الإيجابية الأساسية
الاكتشافات المفاجئة: المشاركة في الأنشطة الإبداعية لا تؤثر بشكل إيجابي على رضا التعلم
الإمكانية الشخصية: التفسيرات الموضعية تدعم صياغة استراتيجيات التدريس الشخصي

القيود

حجم البيانات: 302 عينة فقط، قد يؤثر على قابلية التعميم
القيود الجغرافية: مقتصر على طلاب جامعة واحدة في كوريا
الخصوصية الزمنية: موجه خصيصاً لفترة الجائحة، وتطبيقه في فترة ما بعد الجائحة يحتاج إلى التحقق
اختبار مهام التصنيف: الاختبار الصارم لـ APLR في مهام التصنيف نسبياً محدود

الاتجاهات المستقبلية

دراسات المقارنة بعد الجائحة: مقارنة التغييرات في العوامل الرئيسية قبل وبعد الجائحة
التوسع متعدد الأبعاد: دراسة أبعاد أخرى مثل دافعية التعلم والأداء الأكاديمي
التحقق عبر المناطق الجغرافية: التحقق من فعالية النموذج في خلفيات ثقافية مختلفة
التطبيق في الوقت الفعلي: تطوير نظام مراقبة رضا التعلم في الوقت الفعلي

التقييم المتعمق

المزايا

الابتكار المنهجي: أول تطبيق لـ APLR في التنقيب عن البيانات التعليمية، يعرض قيمة الذكاء الاصطناعي القابل للتفسير
تصميم تجريبي صارم: ضبط معاملات فائقة شامل ومقارنة نماذج متعددة
تفسيرية غنية: توفير تفسيرات عامة وموضعية مزدوجة ذات قيمة تطبيقية عملية
قيمة الاكتشافات المفاجئة: العلاقة السلبية بين الأنشطة الإبداعية ورضا التعلم تستحق دراسة متعمقة

أوجه القصور

تمثيل العينة: قد تحتوي عينة جامعة واحدة على انحياز الاختيار
العلاقات السببية: الدراسة المقطعية لا يمكنها إنشاء علاقات سببية
هندسة الميزات: تحتاج طريقة بناء متغير الهدف إلى التحقق من صحتها بشكل أكبر
نقص التحليل المتعمق: افتقار إلى استكشاف متعمق للاكتشافات المفاجئة (مثل التأثير السلبي للأنشطة الإبداعية)

التأثير

المساهمة الأكاديمية: إدخال طريقة ذكاء اصطناعي قابل للتفسير جديدة لمجال التنقيب عن البيانات التعليمية
القيمة العملية: توفير أساس علمي للمعلمين لاستراتيجيات التدريس الشخصي
قابلية الاستنساخ: تعزيز الأكواد والبيانات مفتوحة المصدر لتسهيل الاستنساخ والتوسع
الإمكانية عبر المجالات: قد تكون طريقة APLR قابلة للتطبيق على سيناريوهات بيانات منظمة أخرى بحجم صغير

المراجع

تستشهد الورقة بـ 35 مرجعاً ذا صلة، تغطي أبحاث رضا التعلم والتعلم الآلي القابل للتفسير وتكنولوجيا التعليم والعديد من المجالات الأخرى ذات الصلة، مما يوفر أساساً نظرياً قوياً للبحث.

التقييم الشامل: هذه ورقة بحثية عالية الجودة تطبق الذكاء الاصطناعي القابل للتفسير في مجال التنقيب عن البيانات التعليمية، بطريقة مبتكرة وتجارب صارمة ونتائج ذات قيمة، لكنها تواجه بعض القيود من حيث حجم العينة وقابلية التعميم. يوفر البحث أداة تقنية قيمة ورؤى تجريبية للتعليم الشخصي.