R语言商务数据分析教学大纲
户与客户之间的相似度,并结合客户对 析
菜品的兴趣给目标客户生成推荐列表 6. 使用 K-Means 算
13. 对推荐结果进行评价
法进行客户分群
14. 根据特征选取后的数据,构建购物 7. 使用决策树算法 篮数据,然后构建二元矩阵,及关联规 进行客户流失预测 则模型
15. 根据关联规则模型的置信度,统计 得到的热销度和毛利率,及菜品详情表 的主推度,计算推荐的综合评分
二、 课程的任务
通过本课程的学习,使学生学会分析案例的流程,使用 R 语言实现流程的每一个步骤, 包括数据合并、数据清洗、数据变换、模型构建、模型评价等,掌握 Apriori 算法、K-Means 算法、灰色预测算法、SVR 算法、GBM 算法、协同过滤算法的应用,以及 ARIMA 模型和 LDA 模型的应用。将理论与实践相结合,为将来从事数据分析挖掘研究、工作奠定基础。
6
5
8 第 8 章 电商产品评论数据情感分析
6
5
9 第 9 章 餐饮企业综合分析
10
10
总计
45
35
四、 教学内容及学时安排
1. 理论教学
序 章节名称
号
主要内容
教学目标
学时
1. 掌握数据分析的概念
2. 掌握数据分析的流程
1. 掌握数据分析的
3. 了解数据分析的应用场景
R 语言数据分
1 析概述
4. 了解数据分析的常用工具
三、 课程学时分配
序号
教学内容
1 第 1 章 R 语言数据分析概述
理论学时 2
实验学时
其它
2 第 2 章 商品零售购物篮分析
3
2
3 第 3 章 航空公司客户价值分析
4
3
4 第 4 章 财政收入预测分析
4
3
5 第 5 章 金融服务机构资金流量预测
5
3
6 第 6 章 P2P 信用贷款风险控制
5
4
7 第 7 章 电子商务网站智能推荐服务
《R 语言商务数据分析实战》教学大纲
课程名称:R 语言商务数据分析实战 课程类别:必修 适用专业:大数据技术类相关专业 总学时:80 学时(其中理论 45 学时,实验 35 学时) 总学分:5.0 学分
一、 课程的性质
大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科 学、客观的决策越来越重要。数据分析技术将帮助企业用户在合理时间内获取、管理、处理 以及整理海量数据,为企业经营决策提供积极的帮助。有实践经验的数据分析人才已经成为 了各企业争夺的热门。为了推动我国大数据,云计算,人工智能行业的发展,满足日益增长 的数据分析人才需求,特开设 R 语言商务数据分析实战课程。
菜品名称的二元矩阵
4. 使用协同过滤算
9 餐 饮 企 业 综 合 11. 基于物品的协同过滤算法,计算菜 法 对 菜 品 进 行 智 能 10
分析
品与菜品之间的相似度,并结合客户的 推荐
历史行为给目标客户生成推荐列表 5. 使用 Apriori 算法
12. 基于用户的协同过滤算法,计算客 对 菜 品 进 行 关 联 分
步骤与流程
2. 掌握数据平稳性
金 融 服 务 机 构 5. 了解纯随机性检验的原理
5
检验和处理方法,以 5
资金流量预测
6. 对通过平稳性检验的数据进行纯随 及纯随机性检验
机性检验
3. 使 用 ARIMA 模
7. 了解 ARIMA 模型的原理
型对资金流量进行
预测
8. 了解定阶的方式,并识别模型的阶
数
9. 建立 ARIMA 模型,并计算误差与 得分
的关联关系
8. 根据模型结果提出商品销售策略
1. 了解航空公司现状与客户价值分析
2. 熟悉航空公司客户价值分析的步骤 与流程
1. 熟悉航空公司客 户价值分析的步骤 与流程
3. 处理数据的缺失值与异常值
航 空 公 司 客 户 4. 结合 RFM 模型构建关键特征
3
价值分析
5. 标准化构建关键特征后的数据
学时
统计每种商品的频数、占比;对商品归类,统计每种类
商品零售购物
1 篮分析
别的频数,并类别内部商品的分布;使用 apriori 函数进 2
行关联分析
使用删除法对缺失值与异常值进行处理;构建 LRFMC 五
航空公司客户
2 价值分析
个特征,并进行标准化处理;用 K-Means 聚类算法对客 3
户数据进行客户分群,聚成五类
4. 掌握获取评论数据的方法 5. 去除评论数据的数字、字母
1. 熟悉电商产品评 论数据实现情感分 析的步骤与流程
6. 对评论数据进行去重 7. 对评论数据进行分词处理
2. 了解如何使用 R 语言对互联网信息 进行爬取
电 商 产 品 评 论 8. 根据停用词库去除评论文本中的停 3. 掌握文本分析的
5. 计算每个菜品的毛利率
6. 绘制原序列的时序图,查看序列周
期性
1. 熟悉餐饮企业数
7. 检验原序列的平稳性和纯随机性
据分析的步骤与流 程
8. 使用 BIC 图进行定阶 2. 了解简单的统计
9. 构建 ARIMA 模型,并分析预测结 分析的应用
果 3. 使 用 ARIMA 预
10. 根据订单详情表,构建客户 ID 和 测销售额
14. 掌握寻找最优主题数的方法
15. 建立相应的 LDA 模型
16. 输入正面情感与负面情感评论求 解 LDA 模型,并分析结果
1. 了解餐饮企业的数据情况
2. 明确餐饮企业数据分析的流程
3. 使用分组聚合和透视表这两种方法 统计每日用餐人数与销售额
4. 计算一个月内的菜品热销度,并对 热销度进行 Min-Max 标准化处理
3. 熟悉购物篮分析的基本流程与步骤 2. 掌握 Apriori 算法
的基本原理与使用
4. 使用统计学知识分析热销商品
商品零售购物
方法
2 篮分析
5. 使用商品结构图分析售出商品的结
3
3. 分析商品销售状
构
况与商品结构合理
6. 了解 Apriori 算法的基本原理与使用 性
方法
4. 分析零售商品间
7. 构建零售商品的 Apriori 模型
1. 分析 P2P 信贷行业所面临的现状与 困扰
2. 了解某 P2P 信贷平台现阶段数据情
况
1. 熟悉用户逾期预
测的步骤与流程
3. 熟悉 P2P 信贷用户逾期预测的基本
流程与步骤
2. 掌握结构化数据
探索,并提取其中有
4. 分析用户信息完善程度、用户信息 效 信 息 的 方 法 与 步
修改情况、区域经济发展情况、借款月 骤
7 数据情感分析
5
算情感分析的准确率;分别对正面评论和负面评论绘制
词云,查看情感分析效果;对正面情感词与负面情感词
构建语料库,并建立文档-词条矩阵;使用 LDA 主题模型,
找出不同主题数下的主题词,寻找最优主题数;进行 LDA
主题分析
统计每日用餐人数和销售额,计算菜品热销度和毛利率;
概念、流程与应用场
景 2
2. 了解 R 语言数据
5. 了解 R 语言在数据分析中的优势 分 析 中 常 用 的 Packages
6. 了 解 R 语 言 数 据 分 析 中 常 用 的
Packages
1. 分析零售企业商品销售现状
2. 了解某商品零售企业的基本数据情 1. 熟悉购物篮分析
况
的实现流程与步骤
分析财政收入数据各特征的相关性;使用 Lasso 回归选取
财政收入预测
3 分析
财政收入预测的关键特征;分别使用灰色预测和 SVR 构 3
建财政收入预测模型;评价 SVR 模型
对数据进行平稳性检验和处理;对处理后的平稳序列进 金融服务机构 4 资金流量预测 行纯随机性检验;对处理后的平稳序列进行模型定阶; 3
对模型进行残差检验,并评估模型;拟合相对最优模型
画图分别展示用户信息完善程度、用户信息修改情况、
区域经济发展情况、借款月份情况分别与逾期率的分布;
分别求取每位用户对应编号的最大值、最小值、中位数、
P2P 信用贷款风
5 险控制
标准差;对登录信息表与更新信息表进行长宽表转换; 4
针对类别型特征进行字符串处理和哑变量处理;处理数
据进行手动网址分类,对处理后的数据
进行特征选取
11. 基于物品的协同过滤算法,计算出 物品之间的相似度
12. 根据物品的相似度和用户的历史 行为给用户生成推荐列表
13. 对模型进行评价,判断推荐系统的 好坏
1. 了解电商企业现状
2. 熟悉电商评论数据情感分析的步骤 与基本流程
3. 了解网络上发布内容的技术和 Web 文档中提取信息的技术,以获取网络数 据
2. 了解财政收入预测的方法
3. 熟悉财政收入预测的步骤与流程
4. 了解相关性分析
财 政 收 入 预 测 5. 分析计算结果
4
分析
6. 了解 Lasso 回归方法
7. 分析 Lasso 回归结果
8. 了解灰色预测算法
9. 了解 SVR 算法
10. 分析预测结果
1. 熟悉财政收入预 测的步骤和流程
2. 掌握相关性分析 方法与应用
份情况分别与逾期率之间的关系
3. 掌握常见数据预
6 P2P 信 用 贷 款 5. 使用第三方平台信息构建特征
处理方法
5
风险控制
6. 对登录信息表和更新信息表进行长 4. 熟悉 GBM 模型构
宽表转换
建与参数调节方法
7. 处理类别型特征,插补数值型特征 5. 找出影响用户逾