关键词:
大数据技术
学习行为建模
特征工程
XGBoost
OULAD数据集
摘要:
在线学习行为数据的深度分析对提升教学质量具有重要意义。针对学习行为特征提取与效果预测问题,文章提出了基于Spark的分布式特征工程与集成学习建模方法。采用开放大学学习分析数据集(Open University Learning Analytics Dataset,OULAD)中38457名学生的学习行为记录,构建包含访问频次、时间跨度与交互密度的多维特征体系,运用XGBoost算法建立学习成效预测模型。实验结果显示,学习资源访问频次与最终成绩呈正相关(r=0.731);高频交互学生的课程通过率比低频交互学生高34.6%;学习行为集中在截止日期前3 d的学生失败率达56.8%。模型在测试集上准确率达87.3%,曲线下面积值0.91,可提前5周预测学生是否能够通过课程,为在线教育平台提供学习预警与干预的数据支持。