当前位置:文档之家› 贾俊平统计学第五版分类数据分析

贾俊平统计学第五版分类数据分析

STATISTICS (第五版)
c 统计量
1. 用于检验分类变量拟合优度 2. 计算公式为
c 2
( fo fe)2 fe
9 -8
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
c 统计量
分布与自由度的关系
9 -9
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
1. 品质相关
对品质数据(分类和顺序数据)之间相关程 度的测度
2. 列联表变量的相关属于品质相关
3. 列联表相关测量的统计量主要有
相关系数
列联相关系数 V 相关系数
9 - 20
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
相关系数
(correlation coefficient)
统计学
STATISTICS (第五版)
第 9 章 分类数据分析
9 -1
作者:中国人民大学统计学院 贾俊平
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
第 9 章 分类数据分析
9.1 分类数据与c2统计量 9.2 拟合优度 检验 9.3 列联分析:独立性检验 9.4 列联分析中应注意的问题
独立性检验
(例题分析)
9 - 18
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
9.4 列联表中的相关测量
9.4.1 相关系数
9.4.2 列联相关系数 9.4.3 V 相关系数
9 - 19
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
列联表中的相关测量
合,所以称为列联表
6. 一个 r 行 c 列的列联表称为 r c 列联表
9 - 15
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
列联表的结构
(r c 列联表的一般表示)
列(cj)
行(ri)
j =1
i =1
f11
i=2
f21
:
:
列(cj) j =2
f12 f22
:
合计
9.2 拟合优度检验
9 - 10
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
拟合优度检验
(例题分析)
【例】1912年4月15日,豪华巨轮泰坦尼
克号与冰山相撞沉没。当时船上共有共 2208人,其中男性1738人,女性470人。 海 难 发 生 后 , 幸 存 者 为 718 人 , 其 中 男 性 374人,女性344人,以的显著性水平检验 存活状况与性别是否有关。 ( 0.05)
统计学
STATISTICS
9.3 列联分析:独立性检验
(第五版)
9.3.1 列联表 9.3.2 独立性检验
9 - 14
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
列联表
(contingency table)
1. 由两个以上的变量交叉分类的频数分布表
2. 行变量的类别用 r 表示, ri 表示第 i 个类别 3. 列变量的类别用 c 表示, cj 表示第 j 个类别 4. 每种组合的观察频数用 fij 表示 5. 表中列出了行变量和列变量的所有可能的组
9.1.1 分,中国人民大学统计学院
统计学
STATISTICS (第五版)
分类数据
9 -5
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
分类数据
1. 分类变量的结果表现为类别
例如:性别 (男, 女)
2. 各类别用符号或数字代码来测度
c1
c2
fij 表示第 i 行第 j 列的观察频数
9 - 16
合计 …

r1

r2
:
:

n
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
独立性检验
(例题分析)
【例】一种原料来自三个不同的地区,原料质量被分成三个不 同等级。从这批原料中随机抽取500件进行检验,结果如表9-3 所示,要求检验各个地区和原料质量之间是否存在依赖关系?
( 0.05)
解:H0:地区和原料等级之间是独立的(不存在依赖关系) H1:地区和原料等级之间不独立 (存在依赖关系)
c 0.05(4)=9.488故拒绝H0,接受H1 ,即地区和原 料等级之间存在依赖关系,原料的质量受地区的影响
9 - 17
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
9 -2
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
学习目标
1. 理解分类数据与c2 统计量
2. 掌握拟合优度检验及其应用 3. 掌握独立性检验及其应用 4. 掌握测度列联表中的相关性
9 -3
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
9.1 分类数据与列联表
9 - 11
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
拟合优度检验
(例题分析)
解:要回答观察频数与期望频数是否一致,检验 如下假设:
H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致
9 - 12
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
1. 测度22列联表中数据相关程度
2. 对于22 列联表, 系数的值在0~1之间 3. 相关系数计算公式为
c2
n
式中:c 2
r
c (fij
eij)2
i1j1 e
ij
n为实际频数的总个数,即样本容量
9 - 21
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
相关系数
拟合优度检验
(例题分析)
自由度的计算为df=R-1,R为分类变量类型的 个数。在本例中,分类变量是性别,有男 女 两 个 类 别 , 故 R=2 , 于 是 自 由 度 df=2-
1=1,经查分布表, c(0.1)(1)=2.706,故
拒绝H0,说明存活状况与性别显著相关
9 - 13
作者:贾俊平,中国人民大学统计学院
3. 使用分类或顺序尺度
你吸烟吗?
1.是;2.否
你赞成还是反对这一改革方案?
1.赞成;2.反对
4. 对分类数据的描述和分析通常使用列联表
5. 可使用c检验
9 -6
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
c 统计量
9 -7
作者:贾俊平,中国人民大学统计学院
统计学
相关主题