当前位置:文档之家› 第十章卡方检验

第十章卡方检验

H1:男女学生数学成绩有显著差异;或 者是性别与数学成绩之间有关联。
理论次数的计算
B A
A1
B1
B2
(18)a
(6)b
A2
(10)c
(6)d
边缘小计
(28)
(12)
a+c
b+d
边缘小计
(24)a+b (16)c+d N=a+b+c+d

f
a

(a b)(a c) N
fb

(a b)(b d ) N
第十章 卡方检验
双变量关系的假设检验
变量关系的显著性检验类型
定类 定序 定距
定类
定序
定距
卡方类测量 (卡方检验)
卡方类测量 (卡方检验)
Spearman 相 关系数 (Z 检验)
方差分析 (F 检验)
Spearman 相关 系数
(Z 检验) Pearson 相关
(F 检验) 回归系数 (T 检验)
例如,在教育实证研究中,经常遇到以下 问题:
• 不同文化程度的人对某一政策的态度或工作 业绩是否相关?
• 不同收入程度的家庭对教育政策的态度是否 相关?
• 不同地区的人与不同的价值观是否相关? • 不同培训方法与培训后的业绩增长是否相关? • 不同民族学生与某种学习习惯是否相关?
……
上述问题称为品质相关问题,其特征是
独立样本四格表卡方检验
高二40个学生数学测验成绩如下表所示, 问男女学生数学成绩有无本质差异?
男 女 总和
80分以上 a=18
80分以下 b=6
c=10 a+c=28
d=6 b+d=12
总和 a+b=24 c+d=16
N=40
• 统计假设 H0:男女学生数学成绩没有差异;或者
是性别与数学成绩是独立的或无关联的;
• 卡方检验处理的是一个因素分为多种类别,
或多种因素各有多种类别的资料。
卡方检验的假设
• 分类相互排斥,互不包容 • 观测值(或变量)之间相互独立 • 每一单元格中的期望次数应该至少在5
个以上
卡方检验的基本公式
2 f ft 2
ft
f为实际频数;f
为理论频数;
t
卡方检验的类别
55~59 22
59.5
-11.9 -1.02 0.1539 0.0790 25
50~54 18
54.5
-16.9 -1.44 0.0749 0.0442 14
45~49 10
49.5
-21.9 -1.87 0.0307 0.0307 9

314
1.000 314
独立性检验
独立性检验一般多采用列联表的形式记录观察结果,
Z点左 尾面积
比例
当组面 积比例
fe
95~99
4
99.5
28.1
0.0244 7
90~94 12
94.5
23.1 1.97 0.9756 0.0362 11
85~89 18
89.5
18.1 1.55 0.9394 0.0708 22
80~84 28
84.5
13.1 1.12 0.8686 0.1137 36


fc

(a c)(c d ) N
fd

(c d )(b d ) N
卡方统计量
2
N (ad bc)2
(a b)(c d )(a c)(b d )
75~79 44
79.5
8.1 0.69 0.7549 0.1523 48
70~74 72
74.5
3.1 0.26 0.6026 0.1662 52
65~69 46
69.5
-1.9 -0.16 0.4364 0.1638 51
60~64 40
64.5
-6.9 -0.59 0.2776 0.1237 39
故又称为列联表分析。
每一个因素可以分为两个或两个以上的类别, 因分类的数目不同,列联表有多种形式。两个因素 各有两项分类,称为四格表或2×2表。一个因素有 R类另一个因素有C类,则称为R × C表。
四格表的独立性检验
独立样本
相关样本
缩减公式卡方 值的计算
校正卡方 值的计算
缩减公式卡方 值的计算
校正卡方 值的计算
40
46
72
44
28
18
12
4
31 4
X 71.4; S 11.7
• 统计假设:
H0 : 观测数据的次数分布与正态分布没有显著差异; H1 : 观测数据的次数分布与正态分布具有显著差异。
• 确定理论次数 • 计算卡方值 • 确定α水平,并查卡方临界值 • 统计决断
组别
f0
组上限 离差x
标准 分Z
f e差

54
1 4
13.5
• 确定α水平,并查卡方临界值
• 统计决断
• 统计假设:H0 : f0i fei(因f0, fe为多个值)
H1 : f0i fei
• 确定理论次数
f e喜欢

76
1 2

38
• 计算卡方值
f e不喜欢

76
1 2

38
• 确定α水平,并查卡方临界值
• 统计决断
例2:从小学生中随机抽取76人,其中50人喜 欢体育,26人不喜欢体育,问该校学生喜欢 和不喜欢体育的人数是否相等?
• 统计假设:H0 : f0i fei(因f0, fe为多个值)
H1 : f0i fei

确定理论次数
f e好

54
1 4

13.5
1 fe中 54 2 27
• 计算卡方值
每个个体至少有两个特征(变量)。每个 特征(变量)的取值,要么是顺序型的, 只能比较大小,不能做加减运算;要么是 名义型的,连大小都不能比较,只是区别 所取的“值”是不同的。解决此类问题一
般采用卡方检验。
• 卡方检验是对样本的频数分布所来自的总
体分布是否服从某种理论分布所作的假设 检验,即根据样本的频数分布来推断总体 的分布。
• 配合度检验:用于检验一个因素多项分类的实
际观察数与理论次数是否接近;又称为无差假说 检验,例正态吻合性检验。
• 独立性检验:用于检验两个或两个以上因素各
种分类之间是否有关联或是否具有独立性。
• 同质性检验:用于检定不同人群母总体在某一 个变量的反应是否具有显著差异。
配合度检验问题实例
例1:大学某系54位老年教师中,健康状况属 于好的有15人,中等的有23人,差的有16人, 问该校老年教师健康状况好、中差的人数比 例是否为1:2:1?
C 卡方分布形状
接受域 拒绝域
频数分布正态性的卡方检验
下表中的314名学生在英语科目上的考试成 绩是否服从一正态分布?
组 别
45 ~
50 ~
55 ~
60 ~
65 ~
70 ~
75 ~


49 54 59 64 69 74 79 84 89 94 99
次 数
10
18
22
相关主题