当前位置:文档之家› 第四章第四次课 样本频率的假设检验

第四章第四次课 样本频率的假设检验

教学内容与组织安排:通过回顾上次课讲授的平均数检验引出本次课教学内容。

第三节样本频率的假设检验
要求掌握一个样本频率的假设检验和两个样本频率的假设检验的使用方法及适用条件,检验程序中应注意的问题。

在生物学研究中,有许多数据资料是用频率或百分数、成数表示的。

当总体或样本中的个体分属两种属性,如药剂处理后害虫的死与活、种子的发芽与不发芽、动物的雌与雄等,类似这些性状组成的总体通常服从二项分布,因此称为二项总体,即由“非此即彼”性状组成的个体组成的总体。

有些总体中的个体有多个属性,但可根据研究目的经过适当的统计处理分为“目标性状”和“非目标性状”两种属性,也可看作二项总体。

在二项总体中抽样,样本中的“此”性状出像的情况可用次数表示,也可用频率表示,因此频率的假设检验可按二项分布进行,即从二项式(p+q)n的展开式中求出“此”性状频率p的概率,然后作出统计推断。

但是,如果样本容量n较大,0。

1≤p≤0。

9时,n p和n q又均不小于5,(p+q)n分布就趋于正态分布,因而可将频率资料作正态分布处理,从而作出近似的检验。

一、一个样本频率的假设检验
当 np 或 nq<5,由二项式 (p+q)n展开式直接检验
例:孵化小鸡的概率表(p= 0.90 q=0.10)
概率函数 Cnxpxqn-x P(x)
P(0) C50p0q5 0.00001
P(1) C51p1q4 0.00045
P(2) C52p2q3 0.0081
P(3) C53p3q2 0.0729
P(4) C54p4q1 0.32805
P(5) C55p5q0 0.59049
可以得出:P(0)或P(1)或P(2) < 0.05,差异显著;P(3)或P(4)或P(5) > 0.05,差异不显著
当 np 和 nq > 30,近似正态分布,可进行正态检验( u 检验)
当 5<np 或 nq<30
由于二项总体的百分数(频率)是由某一属性的个体计算来的整数,所以是离散型的。

当样本不太大时,把它当作连续型的近似正态总体来处理,结果会有些出入,容易发生第一类错误。

补救的办法时仍按正态分布的假设检验计算,但必须进行连续性矫正,即随机变量所落的区间+0.5,如一个样本由 np--np矫正为|np—np|-0.5。

在经连
续型校正之后所作的推断其准确性不亚于2×2列联表。

1、一个样本频率的假设检验
适用范围:检验一个样本频率(记为)和某一理论值或期望值p 的差异显著性。

在二项分布中,事件A发生的频率x/n称为二项成数,即百分数或频率。

则二项成数的平均数和标准差分别为:
也称为二项总体成数的标准误,当p 未知时,常以样本百分数来估计。

此时上式改写为:
=
称为样本成数标准误。

样本频率的标准误其中 q = 1-p
1、当 np 和 nq > 30,不需连续性矫正,则u值为:
2、当 5<np 或 nq<30时,需要进行连续性矫正,u c值为:
如果np<30,因0<p<1,所以n<30
例:有一批蔬菜种子的平均发芽率为0.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,检验种衣剂对种子发芽有无效果?
分析:(1)一个样本频率的假设检验;
(2) np 和 nq > 30 ,无需连续矫正,用u检验;
(3)不知使用种衣剂的发芽率是高是低,用双尾检验。

(1)假设
H0:p=0.85
 即用种衣剂浸种后的发芽率仍为0.85; HA:p≠0.85
(2)水平
选取显著水平α=0.05
(3)检验
u >1.96,P<0.05
(4)推断
在0.05显著水平上,否定H0,接受HA;
认为种衣剂浸种能够显著提高蔬菜种子的发芽率。

例:规定种蛋的孵化率>0.80为合格,现对一批种蛋随机抽取100枚进行孵化,结果有78枚孵出,问这批种蛋是否合格?
分析:(1)一个样本频率的假设检验;
(2) np 和 nq > 5 ,但nq <30,需要进行连续矫正,由于n >
30,用u检验;(3)只有孵化率≤ 0.80,才认为是不合格,故
采用单尾检验。

1假设
H0:p≤ 0.80,即该批种蛋不合格。

HA:p>0.80
2水平
选取显著水平α=0.05
3检验:
u c <1.645,P>0.05
4推断;在0.05显著水平上,接受H0,否定HA;认为这批种蛋不合格。

二、两个样本频率的假设检验
适用范围:检验两个样本频率和差异的显著性。

一般假定两个样本的方差是相等的,即
两个样本频率差数的标准误
H0: p1 = p2= p,q1=q2=q
在总体p1和p2未知,假定条件下,可用两样本频率的加权平均值作为对p1和p2的估计,即:
当n1= n2=n时
1、当np 和nq > 30,不需连续性矫正,用u检验:
在H0: p1 = p2下,
2、当5 < np 或nq < 30,需进行连续性矫正,如果n > 30 ,用u检
验:
在H0: p1 = p2下
2、当5 < np 或nq < 30,需进行连续性矫正,如果n < 30 ,用t检
验:
在H0: p1 = p2下,
例:研究地势对小麦锈病发病的影响,低洼地麦田378株,其中锈病株342株,高坡地麦田396株,其中锈病株313株,比较两块麦田锈病发病率是否有显著性差异。

分析:(1)2个样本频率的假设检验;
(2) np 和 nq > 30 ,无需连续矫正,用u检验;
(3)事先不知两块麦田的锈病发病率孰高孰低,用双尾检验。

1假设:
H0: p1=p2 即两块麦田锈病发病率没有显著差异。

HA: p1 ≠ p2
2水平
选取显著水平α=0.01
3检验:
u>2.58,P<0.01
4推断:在0.01显著水平上,否定H0,接受HA;认为两块麦田锈病发病率有极显著差异,即地势对小麦锈病的发生有极显著影响作用,低洼地小麦锈病的发病率极显著高于高坡地。

例:某鱼场发生了药物中毒,抽查甲池中的29尾鱼,有20尾死亡抽查乙池中的28尾鱼,有21尾死亡。

检验甲、乙两池发生药物中毒以后,鱼的死亡率是否有显著性差异。

分析:(1)2个样本频率的假设检验;
(2) 5 < np 和nq < 30 ,需进行连续矫正,因n1<30,n2<30,用t检验;
(3)事先不知两池鱼的死亡率孰高孰低,用双尾检验。

1假设:
H0: p1=p2 即甲乙两池鱼的死亡率没有显著差异
HA: p1 ≠ p2
2水平:选取显著水平α=0.05
3检验:
df=29+28-2=55 t 0.05(55) = 2.004, t c <t 0.05(55)
4推断:在0.05显著水平上,接受H0,否定HA;认为发生药物中毒后,甲、乙两鱼池鱼的死亡率没有显著差异。

相关主题