当前位置:文档之家› 第九章 卡方检验

第九章 卡方检验

第九章 χ2检验—计数数据的分析方



一、 χ2 检验的意义 二、 χ2 检验的基本公式 三、配合度检验 四、独立性检验 五、品质相关
χ2检验的意义


1、χ2检验方法能同时检验一个因素两 项或多项分类的实际观察数与某理论次 数分布是否相一致的问题,或说有无显 著差异的问题。 2、χ2检验方法还能用于检验两个或两 个以上因素各有多项分类之间是否有关 联或是否具有独立性的问题。
实际频 数(f0) (6) 0 4 9 10 22 33 20 11 6 4 1 0 120
f0-fe (7)
(f0-fe)2 (8)
(f0fe)2/fe (9)
13
1.792 -4.568 -0.380 7.920 -1.684 -3.460
3.211 20.867 0.144 62.726 2.836 11.972

Yates连续性校正公式:
2
( f o f e 0.5) 2 fe
配合度检验的应用举例(一) ——检验无差假说

随机抽取60名学生,问他们高中要不要文理分科,回 答赞成的39人,反对的21人,问对分科的意见能否说 有显著差异?
2 2 2 ( f f ) ( 39 30 ) ( 21 30 ) 2 0 e 5.4 fe 30 30
51
155 49
260

χ2=76.99
返回
五、品质相关


两个变量都是按质划分成几种类别,表示这两个变量之间的关 系称为品质相关。 1、四分相关 180o
(适用于两个变量都是连续变量, 且每一个变量都被认为地划分为两种类型。)
rt cos( ) 1 ad bc


2、Φ相关
(适用于两个变量都是真正的二分变量)
——四格表(2×2)独立性检验之二

(二)相关样本 例:对100名学生先后测验两次,结果整理成下表:
测验一 测 验 二 对


错 5
对 55


25
15

问:两次测验结果在对错上差异是否显著?
理论次数小于5时,四格表2的近似校正


(1)独立的四格表:
2 =N(AD-BC-N/2)2/(A+B)(C+D)(A+C)(B+D)
2 2 2 2 X X X X 1 2 K

其自由度为 即χ2分布具有可加性。

df df1 df2 dfk
4、 χ2分布的平均值和方差: 如果df>2,这时χ2分布的平均数:μχ2 =df 方差:σ2χ2 =2df 5、 χ2分布是连续型分布,但有些离散型的分布也近似χ2分布(χ2检验就是 利用这一特点而来。) 返回

2
( f0 fe ) (16 8) (24 34) (10 8) 11.44 fe 8 34 8
2 2 2
2
配合度检验的应用举例(四) ——检验假设分布的概率

某校长的经验:高中生升学的男女比例为2:1, 今年的升学情况是男生85人,女生35人,问今年 升学的男女生比例是否符合该校长的经验?
ad bc r (a b)(a c)(b d )(c d )

3、列联相关
(当数据属于R×C表的计数资料, 欲分析二因素之间的相关程度,就要用列联相关)
2 C N 2
n i 1 2 i
n
2
2
i 1
2 i
n
2
2
i 1
2
返回
2 χ 分布的表达式

1、若正态总体的平均数已知,则 2
( X )
2
2

或 n 2 2 此时自由度为n。 X i 1 2、若正态总体的平均数未知 ,则用样本平均数作为 2 2 2 ( X X ) nS ( n 1 ) S n 1 总体平均数的估计值: 2 2n 2 2 此时自由度为n-1。
返回
三、 χ2分布表的编制与使用

χ2分布表是根据χ2分布函数计算出来的, χ2分布曲线下的面积都是1。 但随自由度不同,同一χ2值以下或以上所含面积与总面积之比率不同。 故一般χ2表,要列出自由度、及某一χ2值以上χ2分布曲线下的概率。 见卡方值表。 卡方值表:表的左列为自由度,表的最上一行是概率值,即不同自由度 时,某χ2以上的概率。表中所列为不同自由度及概率下的χ2值。例如: 当df=1时,在χ2=0.02以上的概率为90%,那么在其以下的概率为 1-0.90=0.10。它的意思是从一个正态分布总体中,每次随机抽取容量为 1(μ已知)或容量为2(μ未知)的样本,计算Z2或∑Z2,这无限多个Z2 的分布即为χ2分布。其χ2值有90%的可能(或90%的样本)比0.02大,同 时有10%的可能比0.02小。 χ2分布的应用:

二、

2 χ 分布的特点
1、 χ2分布是一个正偏态分布。随自由度的不同,其分布曲线的形状不同,自 由度越小,分布越偏斜,自由度很大时,接近正态分布。当df ∞时, χ2 分布即为正态分布。可见, χ2分布是一族分布,正态分布是其中一特例。 2、 χ2值都是正值。 3、 χ2分布的和也是χ2分布



例:今随机抽取90人,按男女不同性别进行分类,将学生成绩分为中等 以上及中等以下两类。结果如下表。问男女生在学业水平上是否有关联? 学业水平因素 性 中等以上 中等以下 别 男 23 17 因 女 28 22 素
独立性检验的应用举例(三)
——四格表独立性检验之二:相关样本四格表2 检验
2 2 2 ( f f ) ( 85 80 ) ( 35 40 ) 2 0 e 0.9375 fe 80 40
配合度检验的应用举例(五) ——连续变量分布的吻合性检验(139.9;7.5)
分数 (1) -∞ 122126130134138142146150154158+∞ 总和 各组限 的Z值 (2) -∞ -2.39 -1.85 -1.32 -0.79 -0.25 0.28 0.81 1.35 1.88 2.41-2.95) +∞ 平均值 至各组 限间的 面积(3) 0.5000 0.4916 0.4678 0.4066 0.2852 0.0987 0.1103 0.2910 0.4115 0.4699 0.4920
关于 χ2分布

一、 χ2分布的直观意义 二、 χ2分布的特点 三、 χ2分布表的编制与使用
一、 χ2分布的直观意义


从一个服从正态分布的总体中,每次随机抽取 容量为n的样本,将n个随机变量X1,X2,……Xn 分别平方,即可得到X12,X22,……Xn2,然后计 算 X ,这样可抽取无限多个容量为n的样 本,可求得无限多个 X ,也可计算其标准分 X Z ( ) 数及其平方 及n个标准分数的平方 ( X ) Z 和 ,那么,这无限多个n个随机 变量X的平方和或标准分数的平方和的分布,就 是 χ2分布。 χ2分布的表达式
配合度检验的应用举例(二)


某项民意测验,答案有同意、不置可否、不同意三种,调查 结果如下表: 同意 不置可否 不同意 24人 12人 12人 问:三种意见的人数是否有显著不同?
( f 0 f e ) 2 (24 16) 2 (12 16) 2 (12 16) 2 6.0 fe 16 16 16



关于配合度检验

一、它主要用于实际观察次数与某理论次数是否有差 别的分析。它适用于一个因素多项分类的计数资料。 二、配合度检验的一般问题:(1)统计假设:Ho:fo=fe H1: fo≠fe (2)应用基本公式计算χ2值,若计算的χ 2值大于表中 的χ 20.05或χ 20.01值,就拒绝Ho ,推论fo与fe之间 差异显著。若χ 2值小于χ 20.05或χ 20.01值 ,则接受 Ho ,认为fo与fe之间差异不显著。
0.286 1.432 0.006 2.501 0.131 0.828
11
0.380
0.144
0.014
0.5000
χ2 = 5.198
独立性检验的应用举例(一)


某校对学生的课外活动内容进行调查,结果整理成下表:问 性别与课外活动内容的选择是否有关? 体育 文娱 阅读 男生 21 11 23 女生 6 7 29
χ2检验的基本公式
( f0 fe ) fe
2

2
式中fo为实际观察次数,即实计数; fe为理论次数
χ2检验的基本公式


根据1899年统计学家皮尔逊推导的配合适度的理论公 式,即:实际观察次数(fo)与某理论次数(fe,又称 期望次数)之差的平方再除以理论次数乃是一个与χ2 分布非常近似的次数分布。 当fe越大(fe>=5),接近的越好。Fo与fe相差越大, χ2越大。F 与f 相差的越小, χ2值也小。因此,它能 o e 够用来表示fo与fe相差的程度,同时,它也具备与χ2 分布相同的一些特点:fo与fe之差的平方再除以fe的值, 随自由度而变化,变化的趋势与χ2分布一样。

21(15.3) 11(10.2) 23(29.5) 6(11.7) 7(7.8) 29(22.5)
55

42
独立性检验的应用举例(二) ——四格表(2×2)独立性检验之一



(一)独立样本的四格表 公式:2=N(AD-BC)2/(A+B)(C+D)(A+C)(B+D)
df=1
相关主题