大数据时代下的统计学
8.3 商业 智能—— 决策者的
锦囊
【案例1】罩 杯和败家程度 【案例2】外
滩踩踏悲剧 【案例3】大 数据和途牛网
【案例】 DataEye,数 据驱动手游运
营
【案例】广告 业的商业智能
8.4 市场 智能—— 商业智能 的衍生智
慧
8.5 消费 智能—— 当数据成 为一种服
务
感谢聆听
叁
【知识点2】如何降低 不回应率
2 样本魅影
01
【案例1】娱乐圈话
题:锋菲恋
03
【案例3】双重否定
的疑惑
05
【知识点2】有效性 (Validity)和可靠 性(Reliability)
02 04
【案例2】几字之差 对于民众支持率的影 响
【知识点1】响应误 差(Response Error)
2.4 措辞的艺术——僧推/敲 月下门
03
04
5.1 点估计——统计学家比间 谍干得漂亮
【案例1】二 战中的德军坦
克数
2020
【知识点1】 样本统计量和
总体参数
2022
5 统计推断
1
【案例】美国盖洛普公司的民 意调查
2
【知识点1】置信水平
3
【知识点2】置信区间
5.2 置信区间——责善切戒尽 言
【案例1】法律中的人文精 神
【知识点1】零假设和备择 假设
6 变量间的关系
【知识点5】 回归分析F
检验
【知识点6】 拟合优度R2
6.4 回归分析——对不起,其 实我也想长高
07
Part One
7 统计杂谈
7.1 为什么对回归情有独 钟
7.3 条件概率和更多的信 息
7.5 R you happy
7 统计杂谈
7.2 调查问卷中的分类变 量
7.4 极大似然估计——看 起来最像
【知识点2】概 率
1 大数据时代下的统计学
01
【案例】挑战者号 航天飞机(STS Challenger)失 事
02
【知识点】“必然 会发生”和“必然 不会发生”的事件
1.3 小概率事件≠必然不会发 生的事件
1 大数据 时代下的 统计学
1.4 你真的了解数据吗
【案例】淘宝的客 户评价体系
成
B
4.4 中心极限定 理
D
【案例1】掷骰子和伯努利 试验
【知识点1】概率分布
【知识点3】方差
4 正态女神
4.1 期望——量化你的预期
【案例2】赌场就是概率场
【知识点2】期望 (Expectation)
4 正态女神
2020
【案例2】谁 会是被骗的大
傻瓜
2022
01
02
03
4.2 大数定律——为什么十赌 九输
实际显著
5.4 假设检验——“凑巧”可 以拒绝吗
5 统计推断
A
【知识点5】假设 检验vs.置信区间
【知识点6】单侧 检验 vs.双侧检验
B
5.4 假设检验——“凑巧”可 以拒绝吗
5 统计推断
2020
【知识点1】p 值的历史和思
想
2022
01
02
03
5.5p 值——打开潘多拉魔盒 的钥匙
【案例】金榜 题名无望、少
年得志梦断
2021
【知识点2】p 值误用
06
Part One
6 变量间的关系
6 变量间的关系
6.1 卡方分析——细腻的眼神里岂 容得半粒沙
6.3 ANOVA——地域,我们没有 什么不同
6.2 相关性分析——早起的鸟儿有 虫吃
6.4 回归分析——对不起,其实我 也想长高
6 变量间的关系
【案例1】仙道迟 到事件发生率分析
【案例3】被解雇的市场调 研部员工
【知识点2】抽样中存在的 错误风险
2 样本魅影
2.2 抽样——尝一勺锅里的靓汤
【案例2】“捉放法”估算 鱼苗成活率
【知识点1】简单随机抽样
【知识点3】访问员
2 样本魅影
壹
【案例】不回应的影响 有多大
贰
【知识点1】不回应 (Nonresponse)
2.3 不回应误差——沉默不是 金
A
【知识点】数据的 类型
B
1 大数据时代下的统计学
01
【案例】大数据,大 偏差——谷歌的流感 预测模型真的靠谱吗
03
【知识点2】相关关 系和因果关系
02
【知识点1】二手数 据
1.5 数据来自哪里
02
Part One
2 样本魅影
2 样本魅影
2.1 样本——窥一 斑而见全豹,观滴
水而知沧海
2.2 抽样——尝 一勺锅里的靓汤
【案例2】抗击埃博拉要避 免两类错误
【知识点2】两类错误
5 统计推断
5.3 两类错误:有罪被判无罪和无罪被判有罪哪个更严重
5 统计推断
0 1
【案鲜
吗
0
5
【知识点 2】p值
【知识点3】 统计显著
0 3
【知识点1】 显著性水平
0 6
【知识点4】 统计显著vs.
2.3 不回应误差— —沉默不是金
2.4 措辞的艺术— —僧推/敲月下门
2.5 大数据时代, 当“样本”已成往
事
2 样本魅影
01
【案例1】客户满 意度调查
03
【知识点】随机样 本,方便样本和自
愿回应样本
02
【案例2】救护车 垄断业务调查
2.1 样本——窥一斑而见全豹, 观滴水而知沧海
【案例1】红豆和绿豆
7.6 贝叶斯
7 统计杂谈
7.7 来自星星的统计 陷阱
7 统计杂谈
【回归和电 影】
1
【回归和手 游】
2
7.1 为什么对回归情有独钟
7 统计杂谈
04
【工作环境和员
工满意度】
03
【Svensson
Method】
02
【Rank-
Invariant】
7.2 调查问卷中的分类变量
01
【疼痛】
7 统计杂谈
05
【知识点3】相关表、
06
【知识点4】相关系
相关图和相关系数
数t统计量
6 变量间的关系
0
0
1
2
【案例】 地域歧视
问题
0
【知识点1】 方差分析
0
4
5
【知识点3】 离差平方和
及其分解
【知识点 4】均方
0 3
【知识点2】 方差分析统
计模型
0 6
【知识点5】 AMOVA F
统计量
6.3 ANOVA——地域,我们 没有什么不同
【清新萝莉 R】
7 统计杂谈
7.6 贝叶斯
【起源】
【定义】
【自拍杆和蓝 牙耳机】
7 统计杂谈
【被黑的统计 机构】
【统计局的无 奈】
【王老吉状告 加多宝】
7.7 来自星星的统计陷阱
08
Part One
8 大数据,在水一方
8 大数据,在水一方
8.1 洛阳 纸贵—— 大数据思
维
8.2 大 数据驱 动运营
3.3 标准差、标准误,傻傻分 不清楚
【案例】“剩女”和潜力巨 大的相亲市场
【知识点2】条状图(Bar Chart)
【知识点1】饼状图(Pie Chart)
【知识点3】散点图 (Scatter Plot)
3 描述数据
3.4 图形替数据说话——“剩女”和相亲市场
3 描述数据
2019
【知识点1】 什么是数据可
1.3 小概率事件≠必然不 会发生的事件
1.5 数据来自哪里
1.2 概率——上帝的指引 1.4 你真的了解数据吗
1 大数据时代下 的统计学
1.1 统计学——天使还是恶 魔
【知识点】统计学的定 义
【案例1】硬币 的指引
【知识点1】随 机性
1 大数据时代下的统计学
1.2 概率——上帝的指引
【案例2】赌徒 的错觉
【案例2】性别和 文化程度是相互独
立的吗
【知识点1】 卡方分布
【知识点2】 卡方检验
6.1 卡方分析——细腻的眼神 里岂容得半粒沙
6 变量间的关系
01
【案例1】早起的鸟
儿有虫吃
02
【案例2】化妆品销 售额与广告费的关系
分析
03
【知识点1】相关关
系
04
【知识点2】相关分
析
6.2 相关性分析——早起的鸟 儿有虫吃
2 样本魅影
【案例】Farecast, 美国创业梦
A
【知识点】大数据 的4V特征
B
2.5 大数据时代,当“样本” 已成往事
03
Part One
3 描述数据
3 描述数据
3.2 寻找中位数— —排序,数到中间
3.1 均值——可 能会说谎的天平
3.3 标准差、标准 误,傻傻分不清楚
3.4 图形替数据说 话——“剩女”和
视化
2021
【知识点3】 数据可视化的
工具
01
02
03
04
3.5 数据可视化——“云想衣 裳花想容”
【案例】谁在 开网店
2020
【知识点2】 数据可视化主
要应用领域
2022
04
Part One
4 正态女神
4 正态女神
A
C
4.2 大数定律—— 为什么十赌九输
4.1 期望——量 化你的预期
4.3 正态分布—— 大道至简,大美天