当前位置:文档之家› 《大数据分析方法与应用》教学大纲

《大数据分析方法与应用》教学大纲

《大数据分析方法与应用》课程教学大纲
课程代码:090542008
课程英文名称:Big Data Analysis: Methods and Applications
课程总学时:40 讲课:40 实验:0 上机:0
适用专业:应用统计学
大纲编写(修订)时间:2017.6
一、大纲使用说明
(一)课程的地位及教学目标
本课程是应用统计学专业的一门专业课,通过本课程的学习,可以使学生学会选用适当的方法和技术分析数据,领会大数据分析方法和应用,掌握复杂数据的分析与建模,使学生能够按照实证研究的规范和数据挖掘的步骤进行大数据研发,为就业与继续深造打下必要而有用的基础。

(二)知识、能力及技能方面的基本要求
1.基本知识:掌握数据挖掘流程、随机森林树的回归算法、基于预测强度的聚类方法、朴素贝叶斯分类、高维回归及变量选择、图模型等。

2.基本能力:要求能在真实案例中应用相应的方法。

3.基本技能:掌握复杂数据的分析与建模。

(三)实施说明
1. 本大纲主要依据应用统计学专业2017版教学计划、应用统计学专业专业建设和特色发展规划和沈阳理工大学编写本科教学大纲的有关规定并根据我校实际情况进行编写的。

2. 课程学时总体分配表中的章节序号在授课过程中可酌情调整顺序,课时分配仅供参考。

打“*”号的章节可删去或选学。

3. 建议本课程采用课堂讲授、讨论相结合的方法开展教学,通过讨论等方式强化重点,通过分散难点,使学生循序渐进的掌握难点。

4.教学手段:建议采用多媒体等现代化手段开展教学。

(四)对先修课的要求
本课程的先修课程:应用多元统计分析。

(五)对习题课、实践环节的要求
通过案例讲解算法,鼓励学生演示分析思路和分析收获,使学生有机会诊断问题,并学会选用适当的方法和技术分析数据。

(六)课程考核方式
1.考核方式:考查
2.考核目标:在考核学生基础知识、基本技能,基本能力的基础上,重点考核学生的分析能力、解决实际问题能力。

3.成绩构成:本课程由平时成绩和结课报告的质量评定优、良、中、及格和不及格。

(七)参考书目:
《大数据分析:方法与应用》,王星编,清华大学出版社,2013.
二、中文摘要
《大数据分析方法与应用》是高等学校应用统计学专业的一门选修的专业课。

本课程着重介绍了统计学习、数据挖掘和模式识别等领域的各种大数据分析方法。

课程主要内容包括大数据分析概述、数据挖掘流程、随机森林树、基于预测强度的聚类方法、贝叶斯分类和因果学习、高
维回归及变量选择、图模型等。

通过本课程的学习,使学生学会选用适当的方法和技术分析数据,领会大数据分析方法和应用,掌握复杂数据的分析与建模,提高学生分析问题解决问题的能力。

本课程将为毕业设计奠定基础。

三、课程学时分配表
四、教学内容及基本要求
第1部分大数据分析概述
总学时(单位:学时):2 讲课:2 实验:0 上机:0
具体内容:
了解大数据、了解数据挖掘的产生与功能。

重点:
数据挖掘的内涵和功能
难点:
数据挖掘与相关领域之间的关系。

第2部分数据挖掘流程
总学时(单位:学时):6 讲课:6 实验:0 上机:0
具体内容:
了解数据挖掘流程;掌握离群点检测。

重点:
局部离群点算法。

难点:
不平衡数据级联算法。

第3部分有指导的学习
总学时(单位:学时):6 讲课:6 实验:0 上机:0
具体内容:
掌握决策树相关概念;掌握随机森林树算法。

重点:
分类回归树、决策树的剪枝。

难点:
随机森林树的回归算法。

第4部分无指导的学习
总学时(单位:学时):6 讲课:6 实验:0 上机:0
具体内容:
掌握各类聚类分析方法,聚类问题的变量选择。

重点:
基于预测强度的聚类方法。

难点:
高斯成对罚模型聚类,各类异方差成对罚模型聚类。

第5部分贝叶斯分类和因果学习
总学时(单位:学时):6 讲课:6 实验:0 上机:0
具体内容:
掌握贝叶斯分类、朴素贝叶斯分类;理解统计决策论。

重点:
朴素贝叶斯分类。

难点:
线性判别函数和二次判别函数。

第6部分高维回归及变量选择
总学时(单位:学时):8 讲课:8 实验:0 上机:0
具体内容:
掌握线性回归模型、广义线性模型;掌握高维回归系数压缩算法。

重点:
广义线性模型。

难点:
岭回归、路径算法。

第7部分图模型
总学时(单位:学时):6 讲课:6 实验:0 上机:0
具体内容:
掌握图模型基本概念和性质、指数族图模型、谱聚类。

重点:
用回归估计图模型。

难点:
协方差选择方法。

相关主题