当前位置:文档之家› 大数据分析在智慧教育中的应用研究

大数据分析在智慧教育中的应用研究

大数据分析在智慧教育中的应用研究摘要:传统面向高校智慧教育的数据分析平台难以从海量智慧资源中准确分析学生学习行为,导致在面向试题的难度预测中,存在准确率低的问题。

针对上述问题,开展面向高校智慧教育的大数据分析研究工作,给出智慧教育体系架构的构成以及数据分析平台,利用 Hadoop 技术对智慧教育资源进行分析与处理,采用数据挖掘算法并结合云计算技术深入分析和解释学生学习行为数据的采集、汇聚,获取学生学习行为的隐性和显性行为,评估教育质量,预测学生日后学习表现,建立学生认知模型与可视化图表,把得到的数据智能融入智慧教育体系架构。

将该体系架构应用于在线教育系统提供的答题数据,预测英语阅读试题难度。

测试结果表明,试题难度评估预测性能较好。

关键词:大数据分析;高校智慧教育;数据挖掘算法;Hadoop 技术;云计算;学生认知模型目录1、引言 (3)2、高校智慧教育大数据分析 (4)2.1、高校智慧教育体系架构 (4)2.2、面向学生学习行为的大数据分析技术 (5)3、实验结果与分析 (8)4、结论 (9)1、引言大数据、人工智能技术的发展和广泛应用,使得“互联网⁃教育”成为高等院校教育改革与发展的重要研究方向[1]。

“智慧教育”的提出更是将高校教育信息化提升到前所未有的新高度[2]。

面向高校智慧教育的大数据分析逐渐成为研究广泛关注的重要研究方向之一[3]。

目前,相关学者已研究出多项针对智能辅助系统的数据分析平台。

例如:李爽等人通过学生学习行为投入测量指标构建数据分析平台[4]。

这些测量指标更有利于分析和测量教学智能辅助系统的学习行为。

周效章以云计算、大数据分析技术为依托,按照“线上⁃线下⁃线上”为教育实施路径,构建了“在线教育平台+学习中心”融合教学模式的数据分析平台[5]。

上述数据分析平台缺乏对学生学习行为数据合理的整合管理模式,易造成信息孤岛,无法准确分析学生学习行为数据,导致在面向试题时的难度预测精度较低。

在分析国内智能辅助系统的数据分析平台现存问题的基础上,构建“面向高校智慧教育的大数据分析平台”,以推动我国高校智慧教育发展。

2、高校智慧教育大数据分析2.1、高校智慧教育体系架构高校智慧教育体系架构属于多层次体系结构,共6 层:感知层、通信层、云计算层、业务层、数据层和智能服务层。

由这 6 层结构构成体系架构如图 1 所示。

图 1 高校智慧教育体系架构Fig. 1 Architecture of college wisdom education system模型中感知层负责将系统环境与外部高校环境进行信息交互,通过传感器、移动终端等设备实时感知高校环境和教师、学生信息,并将感知数据经由通信层上传[6]。

网络通信层负责将感知层获取的相关数据传输到业务层,为高校学生提供网络访问服务。

云计算层采用虚拟化技术实现高校校园可视化、可靠的云服务。

业务层主要负责为高校师生的教学、管理提供全方位、多角度的服务支撑。

数据层采用大数据分析技术,综合学生的学习行为数据,在网络空间内构建教育体系架构的虚拟框架,并对框架做出全方位的描述,为高校智慧校园的不同应用方向提供数据支持。

智能服务层主要负责对不同应用系统进行深度整合,给学生和教师提供个性化服务。

整合处理后,最终展现在师生面前的不是一个生硬的应用系统,而是一个以个性化服务为宗旨、以师生需求为导向的智能信息化服务平台[7]。

2.2、面向学生学习行为的大数据分析技术通过收集学生学习阶段相关数据,对收集的数据进行预处理,预处理过程包含数据清洗、数据规整化处理等,预处理后针对学生的学习行为数据构建相应的数据分析模型,分析高校学生该学期针对学习任务制定的学习模式以及对知识的掌握程度。

将数据分析结果反馈给学生和教学管理者,学生和教学管理者针对此结果调整学习计划和教学进度。

图 2 所示。

图 2 高校学生学习行为数据统一化标准Fig. 2 Unification standard for learning behavior data of college students 智慧教育与当前高校教育方式的不同之处在于,高校智慧教育是以高校学生为中心,以综合多媒体课堂互动的方式,鼓励高校学生根据自身学习情况开展新型学习模式。

如何从含量的学生学习行为数据中发现学习行为的潜在规律,是当前阶段亟待研究的重要问题。

根据xAPI 数据规整化基准采集学习行为记录。

不规整的学习行为数据以xAPI 数据规整化基准调整后,可实现检索、读取和写入功能。

预测分析报告框架中的学习应用平台通过设置不同的数据采集器,对学生与教育体系架构应用平台的交互数据备份,存入本地数据库中,并间隔给定周期将这些数据传送到教育体系架构的数据分析平台的学习行为存储模块中。

高校学生在不同学期、不同场景下学生的学习行为是不同的,通过学生对不同学习工具在各个阶段的实际应用,分场景、周期采集有效的学习行为数据,以xAPI 数据规整化基准进行传输,形成大数据分析的基本条件[8]。

1.2.2 学习认知情况度量通过分析结果评价学生对教学内容掌握程度,达到对学习成绩的预测。

对预测结果进行详细解释并建立学生认知模型[9],采用可视化技术全方位展示分析结果。

具体步骤如下:评价体系中就学生对教学内容的掌握程度,给出不同评价指标的评价基准,不同的评价指标相应的权重不同,构造一个模糊一致判断矩阵 R,采用该矩阵衡量评价等级与相关因素之间重要性的对比结果。

式中,rnn 表示隶属度函数。

对式(1)给出的各行因素进行求和,获得 h1, h2, ⋯, hn,此时因素 ai 的权重为:hi h1 + h2 + ⋯ + hn1.2.1 收集高校学生学习行为数据对高校学生学习行为数据统一化标准处理过程如以上为评价指标的权重确定方法,通过专家对比,获得不同评价指标的权重。

依据评价标准,邀请多个专家评价学生对教学内容的掌握程度。

各项评价指标通过 X = { x1, x2, ⋯, xn} 描述,Y = { y1, y2, ⋯, ym} 表示评价结果集合,将评价结果划分为 5 个等级,描述为 y1,y2,y3,y4,y5,表示“完全掌握”,“90% 的部分可以掌握”“80% 的部分可以掌握”“70% 的部分可以掌握”“60% 的部分可以掌握”。

对于不同的评价指标,可通过构造一个模糊评价矩阵来全面描述:⋯分析平台下的预测模型相比,所提平台下的预测模型能够更准确地对英语测试题进行难度预测。

式中,tnm 表示矩阵 T 相应的隶属度函数。

以下给出二级指标的模糊评价因素集的权重:A = [ a1 , a2 , ⋯, an ] (4)结合最大隶属度基准判定,评估教育质量,预测学生日后学习表现,构建认知模型。

采用可视化技术全方位展示学生学习行为数据的分析结果:采用饼状图来描述行为数据类型的分布情况;通过饼状图的面积大小分析不同行为数据类型的分布情况,所占面积越大说明该学生对此类学习活动更感兴趣;通过折线图来描述学生对课堂测试题目的准确性,通过折线中走势的变化观测学生对已学内容的掌握情况;通过柱状图来表现学生在此学期中某一天的学习活动数;通过散点图来描述学生参与教学活动的活跃程度[10]。

3、实验结果与分析为了验证面向高校智慧教育的大数据分析平台的综合有效性,需要进行一次实验验证。

仿真实验在配置为WIN 7 操作系统、Intel 酷睿Ⅱ处理器、1.86 GHz 主频、2.95 GB RAM 的笔记本计算机进行。

将数据分析平台应用于某高等院校提供的学生高数答题数据,采用近 200 万的答题记录,预测高数科目测试题的难度,选取均方根误差(RMSE)衡量准确性能;利用排序准确度(DOA)评测高数科目试题对之间的难度排序正确率;利用皮尔逊相关系数(PCC)测试高数科目测试题难度与学生成绩之间的关系。

利用 t 检验通过率评测高数科目测试题难度评估结果的置信水平。

上述评价指标中,均方根误差(RMSE)值越小,说明预测结果精度越好;剩余指标值越大说明预测模型性能越好。

图 3 给出试题难度预测结果,对比方法包括文献[4]给出的数据分析平台和文献[5]给出的数据分析平台。

为了简化描述,将文献[4]给出的数据分析平台和文献[5]给出的数据分析平台下的预测模型以及所提平台下的预测模型分别表示为A1,A2,A3。

从图 3 中可以看出,与文献[4]、文献[5]给出的数据分别采用文献[4]、文献[5]给出的数据分析平台下的预测模型以及所提的预测模型,预测高校学生多次答题得分结果,不同方法对高校学生成绩预测表现在 A 数据集和B 数据集的对比结果如图 4 所示。

从图 4 中可以看出,所提平台下的预测模型能够对得分结果进行高精度预测。

4、结论将大数据分析技术应用于高校教育领域,降低了高校智慧教育数据采集、转换、集成和挖掘的门槛,使定量研究高校智慧教育行为、优化教学方案成为可能。

大数据分析技术对高校教学环境以及师生课业发展产生了深刻的影响,使广大师生和学校受益。

LI Shuang,WANG Zengxian,YU Chen,et al. Mining LMS data for behavioral engagement indicators in online learning en⁃ vironments [J]. Open education research,2016,22(2):77⁃88.图 4 不同方法学生成绩预测结果对比Fig. 4 Comparison for student achievement prediction results of different methods。

相关主题