数据挖掘在英语在线学习平台中的应用数据挖掘在英语在线学习平台中的应用论文摘要论文摘要论文摘要论文摘要论文摘要英语在我们的生活中越来越重要 , 而英语学习也随时随地都在进行 , 尤其现在高科技产品层出不穷, 在手机、 i P a d 等产品上学英语非常方便 ,所以变得很流行。
英语在线学习的平台数不胜数 , 而它们提供的学习内容却非常单一 , 所有的学习者 , 不管他们的学习目的是什么 , 看到的学习内容都是一样的 , 这样问题就会随之而来,单一的学习内容的效果会怎么样呢? 特别是针对成人学习者来说 , 他们的学习目的更加明确 , 工作需要或者为了学术研究等等 , 单一的学习内容对他们来说完全没有针对性 , 而且他们学习时间相对来说较少 , 这样的学习效果可想而知。
本文将数据挖掘技术应用于英语在线学习平台 ,通过聚类算法和关联规则对学习者、学习内容进行分析 , 在此基础上运用遗传算法开发了一个内容组织系统 , 运用于本文的案例中 , 为学习者提供个性化的学习内容 , 以期该系统未来能推广到其他在线学习平台中。
首先 , 根据文献综述 , 分析了英语在线学习平台的现状 , 着重指出其存在的问题 , 这些问题就是本研究想要通过数据挖掘所要解决的。
其次 , 针对发现的英语在线学习平台的问题 , 选取了三种数据挖掘技术来解决发现的问题 , 设计了这些技术应该怎样应用于在线学习平台中 , 第一种技术是聚类挖掘技术 , 用来分析学习者的情况 , 将学习者分在不同的类别中 , 为其提供个性化的学习内容 , 并组织小组学习 ; 第二种技术是关联规则 , 用来分析学习内容之间的关联性, 通过这些规则来安排学习者的学习内容, 提供英语学习成绩 ;第三种技术是遗传算法 , 在前两种技术的基础上 , 设计了一个基于此算法的内容组织系统 , 此系统能够为学习者提供个性化的英语学习内容。
最后 , 本文选取了一个案例, 将上述设计应用于此案例中 ,并对结果进行了详细的分析。
本文按照现状分析 ?问题提出 ? 解决方案设计 ? 案例分析 ? 得出结论的流程进行了深入的研究 , 将数据挖掘技术应用于英语在线学习平台中 , 创新的开发了英语学习内容组织系统 , 希望本研究的成果具有一定的推广实用价值 , 为在线学习平台的建设提供一个思路 , 同时期望该思路能够从一定程度上提高在线学习的质量。
关键词:数据挖掘 ;英语在线学习;聚类分析 ;关联规则; 遗传算法I数据挖掘在英语在线学习平台中的应用 A B S T R A C TA A A A BSTRA BSTRA BSTRA BSTRA CT CT CT CTA AB B S S T T R R A AC C T TA AB B S S T T R R A AC C T TE n g l i s h i n o u r l i f e i s m o r e a n d m o r e i m p o r t a n t , a n d E n g l i s h l e a r n i n gi s a l s o i n a n y t i m e a n d a n y w h e r e , p a r t i c u l a r l y n o w t h a t h i g h - t e c h p r o d u c t s s u c h a s m o b i l e p h o n e , i P a d a r e v e r y c o n v en i e n t t o g o t o s c h o o lT h e r e a r em a n y E n g l i s h o n l i n e l e a r n i n g p l a t f o r m s , a n d t h e y p r o v i d e v e r y s i n g l el e a r n i n g c o n t e n t s , r e g a r d l e s s o f t h e i r l e a r n i n g w h a t i s t h e p u r p o s e o fl e a r n i n gE s p e c i a l l y f o r a d u l t l e a r n e r s , t h e y l e a r n o b j e c t i v e m o r ee x p l i c i t , w o r k n e e d s o r t o a c a d e m i c r e s e a r c h a n d s o o n , s i n g l e l e a r n i n gc o n t e n t f o r t h e m , b u t t h e y a b s o l u t e l y n o s p e c i f i c s t ud y t i me r e l a t i v e l yt h e l e a r n i n g e f f e c t , s o t h a t y o u c a n i m a g i n eT h i s a r t i c l e w i l l r e s e a r c h d a t a m i n i n g t e c h n o l o g y a p p l i e d t o E n g l i s ho n l i n e l e a r n i n g p l a t f o r m a n d t h r o u g h t h e c l u s t e r i n g a l g o r i t h m , a n da s s o c i a t e d a s s o c i a t i o n r u l e s , t h e s t u d y c o n t e n t s o f l e a r n e r s a r e a n a l y z e d ,b a s e d o n u s i n g g e n e t ic a l g o r i t h mde v e l o p e d a c o n t e n t o r g a n i z a t i o n s y s t e m , u s e d i n t h i s c a s e ,f o r l e a r n e r s t o p r o v i d e i n d i v i d u a l i z e d l e a r n i ng c o n t e n t ,i n o r d e r t o t h e s y s t e m t h e f u t u r e c a n b e e x t e n d e d t o o t h e r o n l i n e l e a r n i n gp l a t f o r mF i r s t o f a l l , b a s e d o n t h e l i t e r a t u r e s w e r e r e v i e w e d , a n a l y z e dt h e p r e s e n t s i t u a t i o n o f E n g l i s h o n l i n e l e a r n i n g p l a t f o r m , t h i s p a p e rp o i n t s o u t t h e e x i s t i n g p r o b l e m s , t h e p r o b l e m i s t h e s t u d y w a n t s t o b es o l v e d t h r o u g h t h e d a t a m i n i n gS e c o n d l y , a c c o r d i n g t o t h e E n g l i s h o n l i n el e a r n i n g p l a t f o r m a n d f o u n d t h e p r o b l e m , t h e a u t h o r s e l e c t s t h r e e k i n d so f d a t a m i n i n g t e c h n o l o g y t o s o l v e t h e p r o b l e m s f o u n d , h o w s h o u l d b ed e s i g n e d t h e s e t e c h n i q u e s u s e d i n o n l i ne l e a r n i n g p l a tf o r m , t h e f i r s tt e c h n i q u e i s c l u s t e r i n g m i n i n g t e c h n o l o g y , u s e d f o r a n a l y z i n g t h es i t u a t i o n , w i l l l e a r n e r s i n d i f f e r e n t c a t e g o r i e s p o r t i o n , a n d p r o v i d i n gt h e m p e r s o n a l l e a r n i n g c o n t e n t s , a n d o r g a n i z e g r o u p l e a r n i n g ; T h e s e c o n dk i n d o f t e c h n o l o g y i s u s e d t o p a r s e t h e a s s o c i a t i o n r u l e , t h e c o n n e c t i o n sb e t w e e n l e a r n i n gc o n t e n t s , t h r o u g h t h e s e r u l e s t o a r r a n g e l e a r n e r s 'l e a r n i n g c o n t e n t s , p r o v i d e E n g l i s h l e a r n i n g a c h i e v e m e n t ; T h e t h i r d k i n dI I数据挖掘在英语在线学习平台中的应用 A B S T R A C To f t e c h n o l o g y i s g e n e t i c a l g o r i t h m , t h e f i r s t t w o t e c h n o l o g y f o u n d a t i o n ,b a s e d o n t h e a l g o r i t h m i s d e s i g n e d a s y s t e m , t h ec o n t e n t o f t h e s y s t e mc a n p r o v ide p e r s o n a l i z e df o r l e a r n e r s o f E ng l i sh l e a r ni n g c o n t e n tF i n a l l y , t h i s p a p e r s e l e c t s a c a s e , t h e a b o v e d e s i g n i s a p p l i e d i n t h i sc a s e , a nd t he r e s u l t s a r e a n a l y z e d i n d e t a i lT h i s p a p e r p u t sf o r w a r d a c c o r d i ng t o th e p r e s e n t c o n di t i o n a n a l y s i s- - s o l u t i o n d e s i g n - - c a s e a n a l y s i s - - c o n c l u s i o n s f l o w , s t u d i e d t h e d a t am i n i n g t e c h n o l o g y a p p l i e d t o E n g l i s h o n l i n e l e a r n i n g p l a t f o r m , i n n o v a t i v ed e v e l o p m e n t E n g l i s h l e a r n i n g c o n t e n t o r g a n i z a t i o n s y s t e m , h o p e t h i sr e s e a r c h a c h i e v e m e n t h a s c e r t a i n p r a c t i c a l v a l u e f o r t h e p r o m o t i o n o f t h ec o n s t r u c t i o n o f o n l i n e l e a r n i n g p l a t f o r m p r o v ide s a m e n t a l i t y , a l s o h o p e t h i s i d e a t o a c e r t a i n e x t e n t , t o i m p r o v ef r o m t h e q u a l i t y o f o n l i n el e a r n i n gK K K K e e e e y y y y W W W W o o o o r r r r d d d d s s s s : : : : D D D D a a a a t t t t a a a a M M M M i i i i n n n n i i i i n n n n g g g g ; ; ; ; E E E E n n n n g g g g l l l l i i i i s s s s h h h h O O O O n n n n l l l l i i i i n n n n e e e e L L L L e e e e a a a a r r r r n n n n i i i i n n n n g g g g ; ; ; ; C C C C l l l l u u u u s s s s t t t t e e e e r r r r i i i i n n n n g g g g A A A A n n n n a a a a l l l l y y y y s s s s i i i i s s s s ; ; ; ;A A s s s s o o c c i i a a t t i i o o n n R R u u l l e e s s ; ;G G e e n n e e t t i i c c A A l l g g o o r r i i t t h h m mA A s s s s o o c c i i a a t t i i o o n n R R u u l l e e s s ; ;G G e e n n e e t t i i c c A A l l g g o o r r i i t t h h m mI I I数据挖掘在英语在线学习平台中的应用目录目录目录目录目录.论文摘要 I第 1 章绪论 111 研究背景 112 研究内容 213 研究意义 214 论文结构 3第 2 章在线学习的现状综述 421 在线学习的现状及存在问题 4.211 国外在线学习现状 4212 国内在线学习现状. 6213 在线学习存在的问题7.22 数据挖掘在在线学习中的应用现状 8第 3 章数据挖掘在英语在线学习平台中的应用设计 1 0.31 聚类分析应用 1 0311 聚类分析流程. 1 0312 聚类分析应用设计 1 3.32 关联规则分析应用 1 5321 关联分析流程. 1 5322 关联分析的应用设计. 1 833 遗传算法应用. 1 9331 遗传算法流程. 1 9332 遗传算法应用设计 2 2.第 4 章案例研究: 英孚在线学习平台的数据挖掘 2 841 英孚在线学习平台的概述. 2 8411 平台介绍. 2 8412 存在问题. 3 142 学习者的聚类分析. 3 2421 学习者聚类过程3 2.422 聚类结果分析 3 843 学习内容的关联分析4 0431 学习内容关联过程 4 0.432 关联结果分析 5 144 基于遗传算法的内容组织系统. 5 2.441 系统设计 5 3442 系统实现. 5 4443 应用结果分析. 5 9第 5 章总结与展望 6 2I V数据挖掘在英语在线学习平台中的应用目录51 研究总结 6 252 研究展望6 3参考文献 6 4.致谢 6 6V数据挖掘在英语在线学习平台中的应用图表目录图表目录图表目录图表目录图表目录图 3 - 1 聚类分析的流程图 1 3 图 3 - 2 关联分析的流程图1 8图 3 - 3 遗传算法基本流程 2 1.图 3 - 4 内容库的数据表设计 2 2图 4 - 1 英孚在线学习平台学习流程 2 9图 4 - 2 英孚在线学习平台课程等级 2 9图 4 - 3 英孚在线学习平台学习界面 3 0图 4 - 4 原始数据 3 3图 4 - 5 “数据视图”与“变量视图”转换 3 3.图 4 - 6 变量名设置 3 4图 4 - 7 导入“数据”面板 3 4图 4 - 8 导入的数据源格式 3 4.图 4 - 9 导入数据源 3 5图 4 - 1 0 “K - 均值聚类”对话框 3 5.图 4 - 1 1 “变量”节点 3 6图 4 - 1 2 “聚类数”节点 3 6图 4 - 1 3 迭代历史记录3 7图 4 - 1 4 最终聚类中心 3 7图 4 - 1 5 每个聚类中的学生数 3 7图 4 - 1 6 K - 均值聚类统计结果 3 8图 4 - 1 7 学生挖掘数据 3 9 图 4 - 1 8 关联规则挖掘原始数据 4 1图 4 - 1 9 数据转换代码 4 2图 4 - 2 0 预处理后的数据 4 2.图 4 - 2 1 E x c e l 节点对话框 4 3.图 4 - 2 2 E x c e l 节点“过滤”属性设置 4 4.图 4 - 2 3 E x c e l 节点“类型”属性设置 4 4图 4 - 2 4 关联规则挖掘数据流 4 5图 4 - 2 5 “类型”节点对话框 4 5.图 4 - 2 6 读取“值”选项 4 6图 4 - 2 7 设定“方向”选项 4 7图 4 - 2 8 “ G R I ”节点模型选项4 8图 4 - 2 9 “G R I ”节点模型生成结果 4 9图 4 - 3 0 “网络”节点模型 5 0.图 4 - 3 1 “网络”节点执行结果 5 0图 4 - 3 2 关联规则 5 1图 4 - 3 3 学习者预处理数据 5 2图 4 - 3 4 系统的体系结构 5 3.图 4 - 3 5 内容组织系统的功能模块 5 4图 4 - 3 6 内容编码示例 5 6图 4 - 3 7 设置内容属性 5 8V I数据挖掘在英语在线学习平台中的应用图表目录图 4 - 3 8 显示学习内容 5 9图 4 - 3 9 实验结果 6 0表 3 - 1 C E F R 的六个等级 1 2表 3 - 2 学习内容的指标 2 3.表 4 - 1 学生的基本资料 3 2表 4 - 2 聚类结果统计 3 9表 4 - 3 内容库的表结构 5 3表 4 - 4 “类型”的编码 5 5表 4 - 5 “等级”的编码5 5表 4 - 6 “范围”的编码 5 6表 4 - 7 “主题”的编码 5 6表 4 - 8 每单元的内容要求 6 0V I I数据挖掘在英语在线学习平台中的应用绪论第 1 章绪绪绪绪论论论论英语在我们的生活中越来越重要 ,而学习英语也变得越来越方便, 随时随地都可以轻松的学习英语 , 这样许多英语在线学习平台多得数不清 , 那么如此多的学习平台到底对我们的英语有多大帮助呢? 它们提供的学习内容真的能满足需求越来越个性化的学习者吗? 本章带着这些问题介绍了本论文的研究背景 , 提出了本文研究的主要问题及主要的研究内容 , 并指出了本研究的意义 , 为后续的研究打下了基础。