第九讲 卡方检验
1.161
142~ 143 8 -11.62 -2.29 0.01710 9
139~ 140 4 -14.62 -2.88 0.00396 2
0.09
N552 S5.07 X 154.6.2
■分析
其一、分组数据第1组理论次数的计算
f p p y N
e1
e1
i
e1
Z S XC1
注: =i 组上限的Z值-组下限的Z值
2
2
~
d f1
e
■结论:Z检验与卡方检验一致 (样本比率p的真正分布是二项分布)
.
■例
某班有100名学生,男生的有42人,问男生
的比率是否与0.5有显著差异?
①比率显著性检验 Z ②用卡方检验(配合度)
p p
e 1.6
pq 00 n
24 55 2 02 0 5 55 8 02 0 2 .5 6 1 .6 2
S
其二、拟合指标卡方值的计算
2
2
3.905 1.6 2
.05 93
.
5、二项分类的配合度检验与比率显著检验
⑴设总体比率为 p , p且 q 时n p 5
0
0
0
0
Z
p p e
~ N 0,1
pq
00
n
pp npnp f f
Z
e
e o
e
pq 00 n
npq 00
f •1
e2
.
2
Z f ff 22 o e
③应用卡方检验时,应注意取样设计,保 证取样的代表性,否则依据卡方检验的 结果难以保证结论的科学性;
.
三、卡方检验应用一——总体分布的拟合检 验(goodness of fit test 配合度检验) 由于检验内容仅涉及一个变量多项分类 的计数资料,也称one-way test) 1、配合度检验的一般问题 即检验实际观察数据的分布与某理 论分布是否有显著的差别。
期选拨”制度的态度。曾以问卷调查的形式 对977名低年级学生、790名高年级学生和 764名教师进行随机调查,调查结果:
.
⑶同质性检验
主要用于检验不同人群母总体在某一个变 量上的反应是否有显著差异。 [例]从四所幼儿园分别随机抽出6 岁儿童若
干,各自组成一个实验组,进行识记测 验。测验材料是红、绿、蓝三种颜色书 写的字母,以单位时间内的识记数量为 指标,结果如下。问四组数据是否可以 合并分析。
.
2、检验过程
⑴统计假设
H0:
f f
0
e
即:实际观察次数与某分布理论次数
之间无差异;
H1:
f o
f e
.
⑵数理基础
H0:
f f
0
e
2
f f 2 K
o
e~ 2
f df
e
⑶依统计检验公式,计算实得卡方值
2
K
f
of f
e
2
e
f Np
e
e
⑷作出统计决断 2 ( df )
N:总数 Pe:具体类别理论概率
.
分组 1 2 3 4
红色字母 24 15 20 10
绿色字母 17 12 20 25
蓝色字母 19 9 14 28
.
二、 检2 验的基本原理
理论基础是1899年皮尔逊的工作:在分 布拟合优度检验中,实际观察次数 f 与理
o
论次数 f 之差的平方除以理论次数近似服 e
从 分2 布,即:
2
f f 2 K
.
3、离散型分布的拟合检验 ■例
某项民意测验,答案有同意、不置可否、 不同意3种。调查了48人,结果同意的24人 ,不置可否的人12人,不同意的12人,问持 这3种意见的人数是否存在显著差异?
.
4、连续型分布拟合检验(例)
对于连续随机变量的测量数据,有时不知 道其总体分布,需要根据样本的次数分布的 信息判断其是否服从某种确定的连续性分布。 ⑴检验方法
f e
3.03 0.00237 1 2.44 0.01201 7
0.125
163~ 164 22 9.38 1.85 0.04260 24
0.167
160~ 161 57 6.38 1.26 0.10888 60
0.150
157~ 158 110 3.38 0.67 0.18858 104
0.471
o
e~ 2
f df
e
.
■注
-如果实际观察次数与理论次数的差异越
大,卡方检验的结果就越可能拒绝无差
虚无)假设接受备择假设。
-理论次数 f 越大( f)拟5 合效果 越
e
e
好。
.
1、卡方检验基本公式
2
K
f
of f
e
2
e
■注
K 为类别的数目;
f是o 实际观察值;
f是理论(期待)次数; e
M是: 约束条件数或利用观察数据时使
①将连续性的测量数据整理成次数分布表 ②画出相应的次数分布曲线; ③选择恰当的理论分布; ④进行拟合检验;
.
■例:下表是552名学生的身高次数分布,问这 些学生的身高分布是否符合正态分布?
.
身高 组中值
169~ 170 166~ 167
次数 离均差
2
15.38
7
12.38
f o f e 2
Z分数 P 理论次数
用的样本统计量的数目; .
2、卡方检验的假设 ⑴分类相互排斥,互不包容; ⑵观察值相互独立; ⑶期望次数的大小应大于或等于5(较好趋 近卡方分布的前提);
.
■注
①自由度小时,必须 f ,否5 则利用卡方 e 检验需要进行较正或用精确的分布 进行 检验;
②自由度大时,可以有少许类别的理论次 数少于5;
154~ 155 124 0.38 0.07 0.23544 130
0.277
151~ 152 112 -2.62 -0.52 0.20615 114 0.035
148~ 149 80 -5.62 -1.11 0.12746 70
1.429
145~ 146 25 -8.62 -1.70 0.05562 31
第九讲 卡方检验
.
ቤተ መጻሕፍቲ ባይዱ
一、 检2 验的功能 1、适用资料─计数数据
计数数据的统计分析,测量数据的统计 方法并不适用,卡方检验是较为常用的一 种方法。
.
2、卡方检验的功能 ⑴拟合优度检验[例] 即通过实际调查与观察所得到的一批 数据,其次数分布是否服从理论上所假 定的某一概率分布;
.
■例
某广播电视台为了了解广大儿童对其提供 的6种儿童节目的偏好(态度),随机抽取 了300名儿童,问他们最喜欢哪一种节目( 每人只能选一种),得到的数据如下表:
节目1 节目2 节目3 节目4 节目5 节目6 85 80 55 10 40 30
问:就调查的300人而言,他们对6个节目的 偏好(体现在人数)是否存在显著的差 异?
.
.
⑵变量间的独立性检验 在对一批观察数据进行双向多项分类之
后,这两个分类特征是独立无关的还是具 有连带相关的关系?
.
■例 某师范大学为了了解广大师生对实行“中