1 引言
教育是国家发展、民族复兴的重要根基。随着教育信息化的高速发展,教育教学方式也有了巨大变革,海量的学习资源和多种多样的学习方式促使生成了体量巨大的学习过程和学习成果数据,而运用这些宝贵的数据资源进行成绩分析与学习预警来优化学习过程、提高学习质量成为十分重要的研究方向。
2 成绩分析与学习预警的研究意义
基于大数据技术的成绩分析与学习预警的研究意义可在整个教学过程中有所体现。
(1)厌学萌芽阶段进行学习预警
通过移动智能终端、智慧教室等方式随时收集学习行为数据,通过对这些数据进行挖掘和分析,全面了解学生的学习状态、学习情感、学习效能、学习情绪等,建立精准化干预机制,在学生产生厌学情绪的萌芽阶段产生预警,准确识别出具有学习危机的学生。
(2)学习过程中反馈学习短板
在学习过程中阶段性地从知识水平、认知能力等方面综合进行学习效果分析, 对学生进行学习资源个性化推送、学习分析图表、知识图谱等智能化干预策略,来实现持续性精确性地学习干预,从而反馈出学习过程中的短板帮助学生进行查漏补缺。
(3)成绩分析给出整改方向
通过数据挖掘技术追踪学生的学习轨迹、学习时长、成绩分析,将学生与学习相关的一切行为、状态等量化并输入数据库,构建学习分析模型,这样可以为教师和学生提供准确的信息反馈,为下一步的学习计划提供更好的建议。
3 成绩分析与学习预警总体架构
成绩分析与学习预警的总体架构可分为数据层、分析层和应用层。数据层将各个智能终端、智慧教室等渠道获取的数据以数据库的形式传递给分析层,分析层通过大数据关系挖掘与分析形成数据统计结果,并传递给应用层,应用层针对分析结果进行学习评估、学习行为预测、优化教育方案、提供个性化学习。图 成绩分析与学习预警总体架构
4 成绩分析与学习预警关键技术分析
4.1 贝叶斯知识跟踪
目前在教育领域的数据挖掘应用中,一个很重要的场景就是对学生的学习过程进行建模。当前比较流行的一种建模方式就是贝叶斯知识追踪(即BKT模型)。BKT模型是对“知识点”进行建模,同一个“知识点”下多个学生的作答序列,作为多个独立的观测序列进行模型训练。BKT模型有四个主要参数,分别为:
P(L0):表示学生的未开始做这道题目时,掌握这个知识点的概率,一般可以从训练数据里面求平均值获得;
P(T):表示学生经过做题练习后,知识点从不会到学会的概率;
P(G):表示学生没掌握这项知识点,但是还是蒙对的概率;
P(S):表示学生实际上掌握了这项知识点,但是还是给做错了的概率。
可以通过以上参数得出学生在当前时刻掌握某个知识点的概率:
P(Ln∣Actionn)=P(Ln−1∣Actionn)+(1−P(Ln−1∣Actionn))∗P(T)
而在预测学生行为时,该模型的预测值根据学生完成学习目标所需的知识点和所需完成的行为得出。
P(Cis)=P(Lrs)*(1-P(Sr))+(1-P(Lrs))*P(Gr)
其中,P(Cis)表示学生s达到目标i进行正确行为的概率;P(Lrs)表示学生s掌握知识点r的概率;P(Sr)表示误答概率;P(Gr)表示蒙对的概率。
BKT模型被广泛应用于教学研究中,帮助教师根据学习目标的要求,合理预测知识点的课时分配,通过成绩预测,判断对知识点的掌握程度,从而调整教学策略。
4.2 K-means算法
K-means算法又称为K均值聚类算法,是一种迭代求解的聚类分析算法,其基本步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,将每个对象分配给距离它最近的聚类中心,聚类中心及分配给它的对象就代表一个聚类。每分配一个样本,聚类中的聚类中心会根据聚类中现有对象进行重新计算。这个过程不断重复直至满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
将K均值聚类算法应用到成绩分析与学习预警中,可将学生成绩数据导入数据表,利用K均值聚类算法对数据表进行测试,挖掘出学生成绩分布情况、科目成绩分布情况等信息,依据分析结果调整教学计划,为教师进行个性化指导,为精准教学提供依据。
4.3 关联规则分析方法
关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。其中Apriori算法是最经典的关联规则算法。Apriori算法挖掘问题可被归纳正两个子问题。
(1)找出所有频繁项集,即所有支持度大于等于最小支持度的项集。
(2)由频繁项集产生强关联规则:这些规则必须满足最小支持度和最小可信度。
将学习行为数据划分为学习时长、任务完成度、考试成绩、作业成绩等属性,设置各属性离散化编码,再将学生学习数据转化为编码表所对应数据库。设置支持度,利用关联规则算法对该数据库进行挖掘,最终得到关联规则,发现隐藏在课程和学习行为之间的有意义信息,找出教学过程中各方面的成效以及影响学生学习效果的内在因素,为学生学习和教学管理提供决策支持。
5 小结
基于大数据技术的成绩分析与学习预警是契合新时代教育发展的,为课程的高质量开展和持续优化提供依据。有助于挖掘学生的学习投入与学习行为、认知等多方面的综合关系,为满足个性化学习奠定基础。但是不同技术、不同模型、不同指标都对评估效果有着巨大影响,只有综合考虑算法和模型的适用性,才能增加学习预警的准确性。
参考文献
[1]孙家泽,王曙燕.数据挖掘算法与应用[M].清华大学出版社,2020.
[2]郑勤华.教育数据挖掘与学习分析[M].北京师范大学出版社,2022
[3]高雅奇,穆军妮,刘培昌.基于数据挖掘算法的本科生学习质量分析[J].微型电脑应用,2021,38(06):60-64.
[4]高盛轩. 基于Apriori算法的高校学生日常行为与成绩的关联性研究[D].沈阳师范大学,2021.DOI:10.27328/d.cnki.gshsc.2022.000964.
[5]申民哲. 基于数据挖掘的学生画像与学业预警方法研究[D].郑州轻工业大学,2021.DOI:10.27469/d.cnki.gzzqc.2022.000041.
[6]谭茂文. 基于数据挖掘的学习者群体聚类研究[D].内蒙古师范大学,2021.