当前位置:文档之家› 统计方法卡方检验

统计方法卡方检验

卡方统计量卡方检验用途:可以对两个率或构成比以及多个率或构成比间的差异做统计学检验第一节. 四格表资料的χ2检验例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别?表8.1 两组人群尿棕色素阳性率比较组别阳性数阴性数合计阳性率%病人29(18.74) 7(17.26) 36 80.56对照9(19.26)28(17.74) 37 24.32合计38 35 73 52.05卡方检验的基本思想表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料四格表卡方检验的步骤以例8.1为例1.建立假设:H0:π1 = π2H1:π1≠π2α=0.05四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。

若H0:π1=π2成立→p1=p2=p即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么铅中毒病人36人,则理论上有36 ╳52.05%=18.74人为阳性;对照组37人,则理论上有37 ╳52.05%=19.26人为阳性。

故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。

即TRC=nR nC / n2.计算理论数第1行1列: T11=36×38/73= 18.74依次类推T12 = 17.26T21 = 19.26T22 = 17.74四格表中理论数的两大特征:(1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同;(2)各个基本格子实际数与理论数的差别(绝对值)相同。

一、卡方检验基本公式A: 实际数 T: 理论数卡方检验的基本思想是看理论数与实际数的吻合程度上述公式中卡方统计量的大小取决于实际数和理论数的相差大小情况,如果无效假设成立的话,那么实际数和理论数不应该相差过大,所以卡方统计量应该较小,而如果卡方统计量越大,则越有可能推翻无效假设而得出有统计差异的结论。

3.计算χ2值4.确定P 值,作出统计推论自由度ν=(行-1)(列-1) = 1χ2 = 23.12 >χ2 0.05(1) = 3.84,故P <0.05,按α=0.05 水准拒绝H0,接受H1 ,故可以认为两总体阳性率有差别,即铅中毒病人有尿棕色素增高现象。

二、 四格表专用公式表8.1 两组人群尿棕色素阳性率比较组别 阳性数 阴性数 合计病人 29(a) 7(b) 36(a+b)对照 9(c) 28(d) 37(c+d)合计 38(a+c) 35(b+d) 73(n)四格表资料还可以用专用的公式来计算卡方值a, b, c, d 各代表四格表中四个实际数例8.1中计算χ2值也可用此公式结果和前面一致三. 四格表的校正条件: 当n>=40 且 1=<T<5校正公式:或例8.2 某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎。

后随机抽取15名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情况,资料见表8.2,问两组工人患病率有无差别?表8.2 两组工人皮肤炎患病率比较由表可见,n>40且有1<T<5,故应用校正公式,步骤如下:由于理论数的计算方法是:TRC=nR nC / n分母大家都一样,所以最小理论数的计算:Tmin=行和最小*列和最小/ n四格表卡方要不要校正,只要计算最小理论数就可以判断了。

1.建立假设:H0:π1 = π2H1:π1≠π2α=0.052.计算χ23. 确定P值,作统计推论χ2 =2.94 <χ2 0.05(1) = 3.84,P >0.05,差异无统计学意义,按α=0.05水准,不拒绝H0,故不能认为穿不同防护服的两组工人的皮肤炎患病率有差异。

结果相同,结论一致注意:当n<40或出现T<1时,校正法也不行,要用精确检验法直接计算概率。

四格表的确切概率法条件:n<40,或有理论数T<1Fisher’s exact testP= (a+b)!(c+d) !(a+c) !(b+d) !/ a ! b ! c ! d ! n !第二节配对四格表资料的χ2检验例8.3 某研究室用甲乙两种血清学方法检验鼻咽癌患者血清93份,结果两法都是阳性的45份,都是阴性的20份;甲法阳性但乙法阴性的22份,甲法阴性但乙法阳性的6份。

问两法检出率有无差别?表8.4 两种血清学检验结果比较甲法乙法合计+—+45(a) 22(b) 67-6(c) 20(d) 26合计51 42 93配对计数资料的计算公式:当b+c>40b+c<40检验步骤:1.建立假设:H0:两法总体检出率无差别H1:两法总体检出率不同α=0.052.计算χ2值3. 确定P值,作出统计推论自由度ν=1χ2=8.04>χ20.05(1)=3.84,查χ2界值表得P<0.005,按α=0.05水准,拒绝H0,接受H1,故可以认为甲乙两法血清学阳性检出率不同,甲法的阳性检出率较高。

第三节行×列表的卡方检验适用于多个(两个组以上)的率或构成比差别的显著性检验。

一、多个率比较例8.4 某省观察三个地区的花生污染黄曲霉毒素B1的情况,见表8.5,问三个地区花生污染黄曲霉毒素B1污染率有无差别?表8.5 三地花生黄曲霉毒素B1污染率地区检验的样品数合计污染率%未污染污染甲 6 23 29 79.3乙30 14 44 31.8丙8 3 11 27.3合计44 40 84 47.6检验步骤1、建立假设:H0:三个地区花生污染黄曲霉毒素B1污染率相等H1:三个地区花生污染黄曲霉毒素B1污染率不全相等α=0.052. 计算χ23.确定P值自由度ν=(3 – 1)(2 – 1) = 2χ2=17.91>χ20.05(2)=5.99 P<0.05,差异有统计学意义,按α=0.05水准,拒绝H0,接受H1,故可认为三个地区花生污染黄曲霉毒素B1污染率不全相等。

【注意事项】1.不宜有1/5以上格子的理论数小于5,或有小于1的理论数。

处理方法:1)增加样本含量2)去除理论数过太小的行或列3)合并理论数太小的性质相近的行或列2. 如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间有差别或两两之间有差别。

二、多个构成比比较例8.5 某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表8.6,问其血型构成有无差别?表8.6 鼻咽癌患者与眼科病人血型构成比较组别A型B型O型AB型合计患者55 45 57 19 176眼科病人44 23 36 9 112合计99 68 93 28 288由表8.6可知,第2行第4列对应的合计数最小,故该格的理论数最小,即T24=112×28/288=10.89>5,符合R×C表卡方检验条件。

1、建立假设:H0:鼻咽癌患者与眼科病人血型构成比相同H1:鼻咽癌患者与眼科病人血型构成比不全相同α=0.052. 计算3.确定P值自由度ν=(2 – 1)(4 – 1) = 3 χ2 =2.56<χ2 0.05(2)=7.81 P>0.05,差异有统计学意义,按α=0.05水准,不拒绝H0,故不能认为鼻咽癌患者与眼科病人血型构成有差别。

三、双向有序分类资料的关联性检验例8.6 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如表8.7,问矽肺患者肺门密度的增加与期次有无关系?表8.7 不同期次矽肺患者肺门密度级别分布矽肺期次++++++合计Ⅰ43 188 14 245Ⅱ 1 96 72 169Ⅲ 6 17 55 78合计50 301 141 4921、建立假设:H0:矽肺期次与肺门密度无关联H1:矽肺期次与肺门密度有关联α=0.05第3行第1列合计数最小,最小理论数为T31=78×50/492=7.93>5,符合R×C表卡方检验条件。

2. 计算3.确定P值自由度ν=(3 – 1)(3 – 1) = 4,χ2 =163.01>χ2 0.05(4)=9.49,P<0.05,按α=0.05水准,拒绝H0,接受H1,故认为矽肺期次与肺门密度有关联,结合本资料认为肺门密度有随矽肺期次增高而增加的趋势。

第四节行×列表的χ2分割法。

行×列表χ2检验拒绝H0时,只能得到总体有差别的结论。

χ2分割法可得到进一步的结论。

例8.7 对例8.4三个地区花生污染率的分析结果作进一步的两两比较。

由表8.5可知乙丙两地污染率差异最小,将它们分割后见表8.8表8.8 χ2分割计算表步骤地区未污染污染合计污染率χ2 υP分乙30 14 44 31.8%0.09 1 #割丙8 3 11 27.3%合计38 17 55合乙+丙38 17 55 30.9%17.83 1 *并甲 6 23 29 79.3%合计44 40 84 17.92 2注:#>0.05,* P<0.05小结卡方检验是对计数资料进行统计推断最常用的方法四格表资料卡方检验(可以用于两个率或构成比比较)行列表卡方检验(可以用于多个率或构成比比较)四格表资料1、成组资料1)当n>40且Tmin>5,推荐使用四格表专用公式2)当n>40且1< Tmin <5,推荐使用四格表专用公式的校正公式3)当n < 40或Tmin <1,应该用确切概率法直接计算概率2、配对资料当b+c>40 行列表资料。

相关主题