第十章 卡方检验
26
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 例如: 120个11岁男生身高的频数分布如表,问其总体是否呈正态 分布?(平均数X=139.9,标准差σX=7.5)
检验的步骤: (1)提出假设 H0:样本所属的总体呈正态分布 H1:样本所属的总体不呈正态分布
27
第二节 单向表的卡方(χ2)检验
《教育统计学》
职教学院 刘春雷 E-mail:lcl2156@
1
第十章 卡方(χ2)检验
第一节 χ2及其分布 第二节 单向表的χ2检验
第三节 双向表的χ2检验
第四节 四格表的χ2检验
2
第一节 卡方(χ2)及其分布
一、卡方(χ2)检验的特点 卡方(χ2)检验 ——是对样本的频数分布所来自的总体分布是否服从某种理 论分布或某种假设分布所作的假设检验。 ——即根据样本的频数分布来推断总体的分布。
自由度越小,χ2分布偏斜度越大;自由度越大,分布形态越 趋于对称。
11
第一节 卡方(χ2)及其分布
χ2分布的特点:
自由度越小,χ2分布偏斜度越大; 自由度越大,分布形态越趋于对称。
12
第二节 单向表的卡方(χ2)检验
单向表 ——把实得的点计数据按一种分类标准制成表就是单向表。 单向表(因素)的χ2检验 ——对于单向表的数据所进行的χ2检验就是单向表(因素) 的χ2检验。
(|f0-ft|-0.5)2/ ft
12.25/16=0.77
非团员
总和
8
20
4
20
4
12.25
12.25/4=3.06
χ2=3.83
25
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (3)统计决断 根据df=1,查χ2值表,χ2(1)0.05=3.84, 由于χ2=3.83<3.84=χ2(1)0.05,则P>0.05, 于是保留H0而拒绝H1。 其结论为:该校共青团员的比率与全区没有显著性差异。
5
第一节 卡方(χ2)及其分布
二、卡方(χ2)检验的统计量 卡方(χ2)检验统计量的基本形式为:
2
f 0 ft
ft
2
f0——实际频数 ft——理论频数
6
第一节 卡方(χ2)及其分布
二、卡方(χ2)检验的统计量 例如: 从某校随机抽取50个学生,其中男生27人,女生23人,问 该校男女生人数是否相同?
28
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 检验的步骤: (2)计算χ2值 在计算实际频数与理论频数差数之前,两端若有任何一组的 理论频数小于5,就要进行校正。即把ft<5这组的理论频 数与相邻组的理论频数合并,直至大于5 为止。然后将相 应组的实际频数也进行合并。 2 根据 求χ2=5.202
根据男女生人数相同的假设,其理论频数应为50/2=25。于 是
2
f 0 ft
ft
2Hale Waihona Puke 27 25 25
2
23 25
25
2
0.32
7
第一节 卡方(χ2)及其分布
可列表计算χ2值
表10.1 男女学生人数的χ2值计算表 实际 频数 f0 男生 女生 总和 27 23 50 理论 频数 ft 25 25 50 差 数 f0-ft 2 -2 差数的 平方 (f0-ft)2 4 4 差的平方与 理论频数之比 (f0-ft)2/ ft 4/25=0.16 4/25=0.16 χ2=0.32
16
第二节 单向表的卡方(χ2)检验
检验的步骤: (3)统计决断 首先决定自由度。 单向表χ2的自由度一般等于组数减1,即df=K-1。 然后根据df=K-1=3-1=2,查χ2值表,χ2(2)0.05=5.99, 由于χ2=1.22<5.99=χ2(2)0.05,则P>0.05, 按照表10.3χ2检验统计决断的规则,应保留H0而拒绝H1。 其结论为:该校老年教师的健康状况,好、中、差人数比率 为1:2:1。
21
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 当df=1,其中只要有一个组的ft<5,就要用亚茨(Yates) 连续性校正法,即
2
f
0
f t 0.5 ft
2
连续性校正的必要性: ——因为点计数据求得的χ2值是间断数列,当df=1, ft<5时,间断性尤为明显。而χ2值表上的理论值是用 连续量表示的,其χ2分布是一条连续的光滑曲线。
10
第一节 卡方(χ2)及其分布
χ2分布的特点: 第一,χ2分布呈正偏态,右侧无限伸延,但永不与基线相交。 第二,χ2分布随自由度的变化而形成一簇分布形态。 所谓自由度——是指实际频数与理论频数差数中,能够独立 变化的个数。 本例实际频数与理论频数的差数有2个,因为受到∑(f0-ft)=0 因子的限制,其中只有一个可以独立变化,则自由度df=1。
14
第二节 单向表的卡方(χ2)检验
检验的步骤: (2)计算χ2值 根据零假设,健康状况好、中、差的理论频数ft分别为: 54×(1/4)=13.5 54×(2/4)=27 54×(1/4)=13.5 然后根据公式求解χ2值
2
f 0 ft
ft
2
χ2=(15-13.5)2/13.5+(23-27)2/27+(16-13.5)2/13.5=1.22
8
第一节 卡方(χ2)及其分布
χ2值的特点: 第一,χ2值具有可加性。如,男生+女生=总卡方值。 第二,χ2值永远是正值。 第三,χ2值的大小随实际频数与理论频数差的大小而变化。 两者之差越小,说明样本分布与假设的理论分布越相一致; 两者之差越大,说明样本分布与假设的理论分布越不相一致。 究竟χ2值大到什么程度才能说样本分布与理论分布不一致 呢?——这要看样本的χ2值在其抽样分布上出现的概率如何 而定。
4
第一节 卡方(χ2)及其分布
比率和比率之差的假设检验,是对二项分布数据的假设检验。 ——处理一个因素分成两类, ——或者两个因素,每个因素都分为两类的资料。 ——最多只能同时比较两组比率的差异。 卡方(χ2)检验 ——可同时处理一个因素分为多种类别, ——或多种因素各有多种类别的资料。 ——凡是可以应用比率进行检验的资料,都可以应用卡方 (χ2)检验。
23
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (2)计算χ2值 根据零假设,该校共青团员的ft=20×0.8=16,非共青团员 的ft=20×0.2=4。 由于本例df=1,有一个组的ft=4<5,在计算χ2值时需要进行 亚茨连续性校正。
15
第二节 单向表的卡方(χ2)检验
也可列表计算χ2值
表10.2 不同健康人数的χ2值计算表 健康 好 中 差 总和 f0 15 23 16 54 ft 13.5 27 13.5 54 f0-ft 1.5 -4 2.5 (f0-ft)2 2.25 16 6.25 (f0-ft)2/ ft 0.167 0.593 0.465 χ2=1.22
9
第一节 卡方(χ2)及其分布
三、χ2值的抽样分布 用上例说明χ2的抽样分布。 ——如果将上述所抽取的50个学生还回总体之中, ——再从中随机抽取50个学生,又可以计算出一个样本χ2值。 ——这样反复抽下去,就会有一切可能个样本χ2值。 ——这一切可能个样本χ2值的频数分布,就形成一个实验性 的χ2的抽样分布。
24
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (2)计算χ2值
表10.5 检验某中学共青团员比率是否与全区一样的χ2值计算表
f0
团员 12
ft
16
|f0-ft|
4
|f0-ft|-0.5
3.5 3.5
(|f0-ft|-0.5)2
12.25
喜欢 50 不喜欢 26
总和 76
38 38
76
12 -12
144 144
3.79 3.79
χ2=7.58
20
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 检验的步骤: (3)统计决断 根据df=K-1=2-1=1,查χ2值表,χ2(1)0.01=6.63, 由于χ2=7.58﹡﹡>6.63=χ2(1)0.01,则P<0.01, 按照表10.3 χ2检验统计决断规则, 应在0.01显著性水平上拒绝H0而接受H1。 其结论为:该校喜欢体育的人数与不喜欢体育的人数不相等, 并有极其显著性差异。
18
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 1、各组理论频数ft≥5的情况 例如: 从小学生中随机抽取76人,其中50人喜欢体育,26人不喜 欢体育,问该校学生喜欢和不喜欢体育的人数是否相等? 检验的步骤: (1)提出假设 H0:喜欢与不喜欢体育的人数相等 H1:喜欢与不喜欢体育的人数不相等
三、频数分布正态性的χ2检验 检验的步骤: (2)计算χ2值 按照样本所属的总体呈正态分布的零假设,运用正态曲 线下面积的有关知识, 首先求各组的理论频数,其步骤为: 将各组的上下限转换为标准分数Z值。 根据各组上下限Z值查表,寻找各组上下限Z值至Z=0之间 的面积。 求各组的面积。 将各组的面积与总频数相乘,求各组的理论频数。
19
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 检验的步骤: 2 f f (2)计算χ2值 2 0 t 本例df=1,两组的理论频数均为ft=38>5。 ft