当前位置:文档之家› 第八讲 x2检验

第八讲 x2检验



2
b c 1
bc
2
2 11 1
2 11
2
4.92
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验

公式与普通四格表检验公式相同 H1:两法的结果相关 α=0.05
1. 建立假设 H0:两法的结果无相关
2. 计算检验统计
ad bc n 2 a c a b c d b d 2 25 15 2 11 53 15.37
配对四格表χ2检验

一般形式
甲属性 + 合计

乙属性 + a c a+c b d b+d
合计 a+b c+d n=a+b+c+d
注意:a、b、c、d代表的是对子数
配对四格表差异性检验统计量公式
当b+c>40时
b c
2
2
bc
,
v 1
当b+c≤40时

2
b c 1

例10-3 为观察婴儿腹泻是否与喂养方式有关, 某医院儿科随机调查了消化不良儿童82例,对 每个个体分别观察腹泻与否和喂养方式两种属 性,结果如下,分析两种属性的关联性。 喂养方式 腹 有 30 17 47 泻 无 10 25 35 合计
人工 母乳 合计
40 42 82
2×2交叉分类表的一般形式及概率表达

四格表资料,若有理论数小于1或n<40,或作
χ2检验后所得概率P接近检验水准α,需要用确 切概率法直接计算概率以作判断。实际上,当 有统计软件条件下,大样本四格表的资料也可 用确切概率检验
四格表确切概率法

确切概率计算方法的基本思想:在四格表边 缘合计固定不变的条件下,利用公式
a b ! c b ! a c ! b d ! p
属性X
X1 Y1 A11 (π11) 属性Y Y2 A12 (π12)
合计
n1(πr1)
X2
合计
A21 (π21)
m1(πc1)
A22 (π22)
m2 (πc2)
n2(πr2)
n(1.0)
基本思想
所谓两属性X和Y互相独立,是指属性X的 概率和属性Y的概率分布无关,否则称这 两种属性之间存在关联性。即
1
1 1 2
x
2
AT
T
2

χ2值反映了实际频数与理论频数的吻合
程度,如果H0成立,则实际频数与理论 频数之差一般不会很大,若实际频数与 理论频数差别很大,出现大的χ2值的概 率P是很小的,P≤α时我们就怀疑假设成 立,因而拒绝假设,若P>α,则没有理 由拒绝它。
基本公式
( ARC TRC ) TRC
2 2
74 63 120 17
3. P>0.05 差异无统计学意义。
四格表资料χ2统计量的校正公式
当n≥40,1≤T<5时
( A T 0.5)2 2 T
n ad bc n 2 2 a c a b c d b d
bc
2
,
v 1
例10-4

用两种不同的方法对53名肺癌患者进行诊断, 结果如下,问两种方法的检测结果有无差别?
甲法 + 合计
乙法 + 25 11 36 2 15 17
合计 27 26 53
1. 建立假设 H0:两方法的检测结果无差别 H1:两方法的检测结果有差别 α=0.05 2. 计算检验统计
a !b !c !d !
直接计算表内四个格子数据的各种组合的概 率,然后计算单侧或双侧累计概率,并与检 验水准比较,作出是否拒绝H0的结论
行×列表χ2检验

公式:
( ARC TRC )2 2 TRC
A2 2 n 1 nR nC
自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
四格表χ2检验公式
当n≥40,T≥5时
( ARC TRC )2 2 TRC
ad bc n 2 a c a b c d b d
2
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同 α=0.05 2. 计算检验统计
ad bc n a c a b c d b d 2 68 11 6 52 137 2.74
nri ncj ij ri cj ( )( ) n n
Tij n ij nri ncj n
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立 α=0.05 2. 计算检验统计
ad bc n a c a b c d b d 2 30 25 10 17 82 9.98
例题10-6

某医院用3种穴位针刺治疗急性腰扭伤民, 数据如下,试比较3 组总体治愈率有无差别。
治愈数 未愈数 合计 治愈率
穴位
后溪穴
人中穴
80
20
18
20
98
40
81.6
50.0
腰痛穴
合计
24
124
38
76
62
200
38.7
62.0
1. 建立假设 H0:3组总体治愈率相等 H1:3组总体治愈率不全相等 α=0.05 2. 计算检验统计
2

例10-2 两种药物治疗葡萄球菌败血症疗效 的试验结果如下,问两种药物的疗效有无差 异? 疗效
药物
有效
无效
合计

乙 合计
28(26.09)
12(13.91) 40
2(3.91)
4(2.09) 6
30
16 46
1. 建立假设 H0:两药疗效相同 H1:两药疗效不同 α=0.05 2. 计算检验统计
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理 A药 B药 合计 有效例数 无效例数 合 计 有效率(%)
68(64.818)a 52(55.182)c 120 (a+c)
6(9.182)b 11(7.818)d 17 (b+d)
74 63
(a+b) (c+d)
91.89 82.54 87.59
2 2 0.05(6) 4. 由于
则P<0.05,拒绝H0,认为 民族与血型分布有关。
行×列表χ2检验注意事项
1. 若1/5以上格子的理论频数小于5,或至少有1格子 的理论频数小于1,要处理。 进一步增大样本含量 将相临的两行或两列合并(注意合理性) 2. 总的结论有统计学意义,即有差异,并不说明任意 两组间都有差异,做行×列表的分割才能检验任意 两组间是否有差异 3. 有些资料不适合做x2检验,如单向有序的行×列表 (等级资料)
例题10-7

某研究者欲比较维吾尔族与回族的血型分布 情况,数据如下,试比较两个民族血型构成 有无差别。
血型
民 族 维吾尔族 回族 合计
A 442 369 811
B 483 384 867
O 416 487 903
AB 172 115 287
合 计 1513 1355 2868
1. 建立假设 H0:两个民族的血型构成比相等 H1:两个民族的血型构成比不相等 α=0.05 2. 计算检验统计
2
a c a b c d b d
2
ad bc n 2 n
2
28 4 2 12 46 2 46 1.69
30 16 40 6
3. P>0.05 差异无统计学意义。
交叉分类2×2表的关联性分析
2 2
40 42 47 35
3. P<0.05 差异有统计学意义。
列联系数(contingency coefficient)
r
2 n
2
0 <r<1
15.347 本例 r =0.18 15.347 484
四格表确切概率法

该方法是由R.A.Fisher提出的,其理论依据是 超几何分布
合计 275 125 84 484
1. 建立假设 H0:民族与血型无关 H1:民族与血型有关 2. α=0.05 3. 计算检验统计
602 702 222 202 2 484 ( 1) 275 122 275 125 84 86 84 151 15.35
2 2
A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察到的 例数。 nR nC TRC n 自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
x2分布界值


自由度一定时,P值越小, x2值越大。 当P 值一定时,自由度越大, x2越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
2
27 26 36 17
3. P<0.05 , 拒绝H0,两种方法的结果存在关联性。
小结



熟悉χ2检验的基本思想。 掌握χ2检验在四表格资料、行×列表资 料中的应用。 了解行×列表的分割法及四表格的确切 概率法。
习题
1.对于总合计数n为400的4个样本率的资料做检验, 其自由度为( ) A.399 B.395 C.1 D.3 E.8 2.当四格表的周边合计不变时,如果某格的实际频数 有变化,则其理论频数( ) A.增大 B.减小 C.不变 D.不确定 E.增大或减少 3.从甲、乙两文中,查到同类研究的两个率的比较的 四格表资料,其 检验,甲文 ,乙文 , 可认为( ) A.两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.甲文结果不可信 E.甲文说明总体的差别大
相关主题