Automatic Piecewise Linear Regression for Predicting Student Learning Satisfaction
Choi, Nadarajan
Although student learning satisfaction has been widely studied, modern techniques such as interpretable machine learning and neural networks have not been sufficiently explored. This study demonstrates that a recent model that combines boosting with interpretability, automatic piecewise linear regression(APLR), offers the best fit for predicting learning satisfaction among several state-of-the-art approaches. Through the analysis of APLR's numerical and visual interpretations, students' time management and concentration abilities, perceived helpfulness to classmates, and participation in offline courses have the most significant positive impact on learning satisfaction. Surprisingly, involvement in creative activities did not positively affect learning satisfaction. Moreover, the contributing factors can be interpreted on an individual level, allowing educators to customize instructions according to student profiles.
academic
Regresión Lineal por Tramos Automática para Predecir la Satisfacción del Aprendizaje Estudiantil
Este estudio explora la aplicación de la Regresión Lineal por Tramos Automática (APLR) en la predicción de la satisfacción del aprendizaje estudiantil. Aunque la satisfacción del aprendizaje estudiantil ha sido ampliamente investigada, las técnicas modernas de aprendizaje automático interpretable y redes neuronales aún no han sido suficientemente exploradas. El estudio demuestra que el modelo APLR, que combina algoritmos de impulso y capacidad interpretable, presenta el mejor desempeño entre diversos métodos de última generación. A través del análisis de interpretación numérica y visual de APLR, se descubrió que la capacidad de gestión del tiempo del estudiante, la capacidad de concentración, la percepción de ayuda a compañeros y la participación en cursos presenciales tienen los efectos positivos más significativos en la satisfacción del aprendizaje. Sorprendentemente, la participación en actividades creativas no produjo un impacto positivo en la satisfacción del aprendizaje.
Este estudio tiene como objetivo abordar el problema de la predicción de la satisfacción del aprendizaje estudiantil y la identificación de factores influyentes durante la pandemia de COVID-19. Después de experimentar dos años de aprendizaje en línea, las preferencias de los estudiantes por diferentes modalidades de aprendizaje han cambiado, lo que requiere una comprensión profunda de los factores clave que afectan la satisfacción del aprendizaje.
Orientación de la Práctica Educativa: Ayudar a educadores e instituciones a personalizar mejores métodos de enseñanza para mejorar la experiencia general de aprendizaje
Aprendizaje Personalizado: Proporcionar bases científicas para la enseñanza personalizada
Análisis del Impacto de la Pandemia: Comprender profundamente el impacto de los entornos de enseñanza especiales durante la pandemia en la satisfacción del aprendizaje
Métodos Estadísticos Tradicionales: Principalmente basados en modelado de ecuaciones estructurales (SEM) y pruebas de hipótesis estadísticas, carecen de capacidad predictiva
Consideración Incompleta de Características: Los estudios existentes rara vez consideran factores de estado emocional y entorno de aprendizaje
Interpretabilidad Insuficiente: Falta de aplicación de técnicas modernas de aprendizaje automático interpretable
Desempeño Superior del Método: APLR supera a modelos de árboles de embolsado y impulso representativos, modelos aditivos interpretables y modelos de aprendizaje profundo basados en Transformer en 4 de 5 métricas de evaluación
Análisis de Interpretabilidad Integral: Proporciona explicaciones globales y locales, ofreciendo información valiosa sobre los factores que influyen en la satisfacción del aprendizaje para la población general y estudiantes individuales
Apoyo al Aprendizaje Personalizado: Allana el camino para el aprendizaje personalizado, permitiendo que los educadores adapten la enseñanza según el perfil del estudiante
Código y Conjunto de Datos de Código Abierto: Proporciona código de implementación completo y conjunto de datos para uso de la comunidad investigadora
Entrada: 47 características, incluyendo información demográfica, métodos de aprendizaje, desempeño percibido, autoeficacia, motivación, participación, estado emocional, mecanismos de afrontamiento del estrés y entorno de aprendizaje
Salida: Tarea de clasificación binaria, predicción de satisfacción del aprendizaje estudiantil (satisfecho/insatisfecho)
Restricciones: Variable objetivo construida basada en 7 características principales, puntuación total ≥4 indica satisfacción, de lo contrario insatisfacción
APLR combina las ventajas del impulso de gradiente y las splines de regresión adaptativa multivariante (MARS):
Impulso de Gradiente Componente: Cada aprendiz base simple se adapta a una variable predictora, seleccionando el aprendiz que mejor ayude a minimizar la función de pérdida
Pasos de Impulso (m = 1 a M):
Cálculo del Gradiente Negativo: u_m = y - f̂_{m-1}(C_{m-1})
Actualización de Intersección: Usar la media ponderada de u_m multiplicada por la tasa de aprendizaje v
Selección de Función Base: Encontrar la mejor función base APLR h_m(u_m, e_j) para cada candidato e_j
Selección de Términos: Seleccionar el término con menor pérdida como candidato
Actualización de Coeficientes: Actualizar coeficientes de regresión β
Estimación de Coeficientes de Regresión:
β=v⋅∑i=1nefff(xi)2⋅wi∑i=1nefff(xi)⋅wi⋅um,i
Procesamiento Lineal por Tramos: En comparación con las funciones suavizadas aditivas de EBM, APLR divide los datos en segmentos y ajusta un modelo lineal a cada segmento
Consideración de Términos de Interacción: Identificación y modelado automático de relaciones de interacción entre características
Eficiencia Computacional: Más eficiente que EBM, más fácil de usar que bosques aleatorios y árboles de impulso
Interpretabilidad Dual: Proporciona simultáneamente importancia de características global y explicaciones de contribución local
Efectividad del Método: APLR demuestra desempeño excelente en la tarea de predicción de satisfacción del aprendizaje estudiantil
Factores de Influencia Clave: Gestión del tiempo, capacidad de concentración, sentido de ayuda y participación presencial son factores positivos principales
Hallazgo Sorprendente: La participación en actividades creativas no tiene impacto positivo en la satisfacción del aprendizaje
Potencial de Personalización: Las explicaciones locales apoyan la formulación de estrategias de enseñanza personalizada
El artículo cita 35 referencias relacionadas, abarcando múltiples campos incluyendo investigación de satisfacción del aprendizaje, aprendizaje automático interpretable, tecnología educativa y otros trabajos importantes, proporcionando una base teórica sólida para la investigación.
Evaluación General: Este es un artículo de investigación de alta calidad en el campo de minería de datos educativos aplicando IA interpretable, con metodología innovadora, experimentos rigurosos y resultados valiosos, aunque presenta ciertas limitaciones en escala de muestras y generalización. La investigación proporciona herramientas tecnológicas valiosas e información empírica para educación personalizada.