当前位置:文档之家› 《大数据概论》教学大纲

《大数据概论》教学大纲

附件1
广东财经大学华商学院课程教学大纲
一、课程简介
大数据概论是一门理论性和实践性都很强的课程,针对计算机、信息管理和其他各专业学生的发展需求,系统、全面地介绍了关于大数据技术与应用的基本知识和技能,详细介绍了大数据与大数据时代、大数据的可视化、大数据的商业规则、大数据时代的思维变革、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据促进学习、大数据在云端、支撑大数据的技术、数据科学与数据科学家、大数据的未来等内容,具有较强的系统性、可读性和实用性。

二、教学目标
(一)目的与要求
本课程是大数据系列课程的基础,系统地介绍大数据涵盖的内容,包括数据与大数据概述、大数据获取与感知、大数据存储与管理、大数据分析、大数据处理、大数据治理、大数据安全与隐私等。

除了介绍大数据的技术内容,课程还介绍了部分行业中大数据的典型应用案例,反映了大数据在社会经济生活中的重要价值。

从而达到四个方面的对于大数据的认识:认识数据与大数据、认识大数据带来信息化第三波浪潮、认识大数据对现有信息技术体系的挑战、认识亟待构建的大数据治理体系。

课程基本要求:
(1)了解本课程的教学设计;
(2)熟悉本课程的基本内容与学习要求;
(3)主动完成本章的导读案例、思考和阅读全部内容。

二、主要教学模式和教学手段
采用线下教学为主,线上教学为辅。

主要学习模式:课堂面授课程,通过常用的工具进行实践教学,线上教学为辅,选择合适的教学平台进行线上补充教学。

主要教学方法:1:问题导向法 2:对比教学法 3:讨论教学法 4:任务驱动法
主要教学手段:1:多媒体机房教学 2:在线课程教学 3:视频教学网站
四、教学内容(要求编写所有章节的主要内容)
第一章什么是大数据
内容:
1.1人类信息文明的发展
1.2 大数据时代的来临
1.2.1 信息技术的发展
1.2.2 数据产生方式的变革
1.3 大数据的主要特征
1.3.1 大数据的数据特征
1.3.2 大数据的技术特征
1.4 大数据的社会价值
熟练掌握:
了解人类信息文明的发展历程
熟悉大数据时代的来临和具体发展表现
掌握大数据的主要特征
掌握大数据的社会价值
第二章大数据技术基础
内容:
2.1 计算机操作系统
2.1.1 什么是操作系统
2.1.2 Linux操作系统
2.2 编程语言
2.2.1 编程语言的发展与种类2.2.2 Python语言
2.3 数据库
2.3.1 SQL数据库的发展与成熟2.3.2 NoSQL数据库及其特点
2.3.3 NoSQL数据库的分类
2.3.4 NewSQL数据库
2.4 算法
2.4.1 什么是算法
2.4.2 大数据时代的算法
2.5 大数据系统
2.5.1 Hadoop平台
2.5.2 Spark平台
2.6 大数据的数据类型
2.6.1 结构化数据
2.6.2 半结构化数据
2.6.3 非结构化数据
2.7 大数据应用的开发流程
2.8 数据科学算法的应用流程
熟练掌握:
掌握计算机操作系统的基础知识。

理解和掌握编程语言。

掌握数据库的主要数据类型。

理解算法的涵义。

掌握大数据系统。

熟悉大数据应用开发流程。

第三章数据采集与预处理
内容:
3.1 大数据的来源
3.1.1 传统商业数据
3.1.2 互联网数据
3.1.3 物联网数据
3.2 数据的采集方法
3.2.1 系统日志的采集方法
3.2.2 网页数据的采集方法
3.2.3 其他数据的采集方法
3.3 数据预处理
3.3.1 影响数据质量的因素
3.3.2 数据预处理的目的
3.3.3 数据预处理的流程
熟练掌握:
了解大数据的来源
掌握数据的采集方法
掌握数据预处理流程
了解大数据的来源
掌握数据的采集方法与数据预处理的主要流程
第4章数据存储与管理
内容:
4.1 数据存储概述
4.1.1 数据的存储介质
4.1.2 数据的存储模式
4.2 大数据时代的存储管理系统
4.2.1 文件系统
4.2.2 分布式文件系统
4.2.3 数据库
4.2.4 键-值数据库
4.2.5 分布式数据库
4.2.6 关系型数据库
4.2.7 数据仓库
4.2.8 文档数据库
4.2.9 图形数据库
4.2.10 云存储
熟练掌握:
☑掌握数据的存储模式
☑理解并掌握大数据时代的存储管理系统
☑理解数据存储的概念和种类
☑熟练掌握常用的3种数据存储模式
☑理解分布式平台存储大数据的意义和优势,掌握分布式文件系统基础架构第五章大数据计算框架
内容:
5.1 计算框架
5.1.1 批处理框架
5.1.2 流式处理框架
5.1.3 交互式处理框架
5.2 MapReduce
5.2.1 MapReduce编程的特点
5.2.2 MapReduce的计算模型
5.2.3 MapReduce的资源管理框架
5.3 Spark
5.3.1 Spark的基本知识
5.3.2 Spark的生态系统
5.3.3 Spark的架构与原理
5.3.4 Spark RDD的基本知识
熟练掌握:
☑理解并掌握MapReduce的计算模型、资源管理框架和编程特点
☑掌握Spark的基本知识、基本特点和架框原理。

☑理解处理框架按照所处理的数据状态分为批处理框架、流式处理框架及交互式处理框架3种计算框架
☑掌握MapReduce的计算模型、资源管理框架和编程特点
☑理解并掌握Spark的基本知识、生态系统、基本特点和架框原理
第六章数据挖掘
内容:
6.1 什么是数据挖掘
6.2 数据挖掘的对象与价值
6.2.1 数据挖掘的对象
6.2.2 数据挖掘的价值
6.3 数据挖掘常用的技术
6.3.1 关联分析
6.3.2 分类分析
6.3.3 聚类分析
6.4 数据挖掘常用的工具
6.4.1 RapidMiner
6.4.2 WEKA
6.4.3 Orange
6.4.4 R语言
6.4.5 Mining
6.5 数据挖掘的典型应用
6.5.1 社交媒体领域的应用
6.5.2 市场营销领域的应用
6.5.3 科学研究领域的应用
6.5.4 电信领域的应用
6.5.5 教育领域的应用
6.5.6 医学领域的应用
第7章数据可视化
内容:
7.1 什么是可视化
7.1.1 可视化的含义
7.1.2 可视化的发展历程
7.1.3 可视化的作用
7.2 数据可视化及其分类
7.2.1 科学可视化
7.2.2 信息可视化
7.2.3 可视化分析学
7.3 数据可视化工具
7.3.1 入门级工具
7.3.2 信息图表工具
7.3.3 地图工具
7.3.4 高级分析工具
7.4 数据可视化案例
7.4.1 数字美食
7.4.2 空中的间谍
五、教学重点难点
教学重点:关联规则、降维、特征选择、EM算法、概率图模型等内容,最后介绍自然语言处理与文本分析、图与网络分析、分布式计算和深度学习等知识。

教学重点:关联规则、降维、特征选择、EM算法、概率图模型等内容,最后介绍自然语言处理与文本分析、图与网络分析、分布式计算和深度学习等知识。

线性回归正则化,非线性回归方法,文本表示方法,主题模型和LDA。

1.先修课程:无
2.后续课程:大数据预处理技术,大数据技术与应用,数据挖掘与算法
九、推荐教材和教学参考书
教材:
《大数据导论》,杨尊琦主编,机械工业出版社.
参考书:
[1] 维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革.盛杨燕等译.杭州:浙江人民出版社,2013.
[2] 《大数据导论——数据思维、数据能力和数据伦理(通识课版)》林子雨编著,高等教育出版社,2019年11月。

[3] 《大数据概论》,陈明主编,科学出版社出版
[4] 《云计算与大数据概论》,青岛英谷教育科技股份有限公司,西安电子科技大学出版社.
[5] 《大数据导论》,周苏、王文主编,清华大学出版社.。

相关主题