当前位置:文档之家› 生物统计学教案(5)

生物统计学教案(5)

生物统计学教案第五章统计推断教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。

讲授难点:一个、两个样本的差异显著性检验统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。

参数估计:通过样本统计量估计总体参数。

5.1 单个样本的统计假设检验5.1.1 一般原理及两种类型的错误例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。

已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。

1、假设:H 0: μ=μ或H0: μ-μ0=0H A : μ>μμ<μμ≠μ三种情况中的一种。

本例的μ=10.00g,因此H: μ=10.00HA: μ>10.00或μ<10.00或μ≠10.002、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。

从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。

如果得到的值很小,则x 抽自平均数为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。

显著性检验:根据小概率原理建立起来的检验方法。

显著性水平:拒绝零假设时的概率值,记为α。

通常采用α=0.05和α=0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。

3、临界值例 从上述动物群体中抽出含量n =10的样本,计算出x =10.23g ,并已知该批动物的总体平均数μ绝不会小于10.00g ,规定的显著水平α=0.05。

根据以上条件进行统计推断。

H 0: μ=10.00 H A : μ>10.00 根据备择假设,为了得到x 落在上侧尾区的概率P (U > u ),将x 标准化,求出u 值。

P (U >1.82)=0.03438,P < 0.05,拒绝H 0,接受 H A 。

在实际应用中,并不直接求出概率值,而是建立在α水平上H 0的拒绝域。

从正态分布上侧临界值表中查出P (U > u α)= α时的u α值,U > u α的区域称为在α水平上的H 0拒绝域,而U < u α的区域称为接受域。

接受域的端点一般称为临界值。

本例的u =1.82,从附表3可以查出u 0.05=1.645, u > u α,落在拒绝域内,拒绝H 0而接受H A 。

4、单侧检验和双侧检验上尾单侧检验:上例中的H A :μ>μ0,相应的拒绝域为U > u α。

对应于H A :μ>μ0时的检验称为上尾单侧检验。

下尾单侧检验:对应于H A :μ<μ0时的检验称为下尾单侧检验。

nx nx u 40.000.100-=-=σμ82.11040.000.1023.100=-=-=nx u σμ其拒绝域为U <-u α。

双侧检验:对应于H A :μ≠μ0时的检验称为双侧检验。

双侧检验的拒绝域为|U | >u α/2 。

5、单侧检验和双侧检验的效率:在样本含量和显著水平相同的情况下,单侧检验的效率高于双侧检验。

这是因为在做单侧检验利用了已知有一侧是不可能这一条件,从而提高了它的辨别力。

所以,在可能的条件下尽量做单侧检验。

例 上例已经计算出u =1.82,上尾单侧检验的临界值u 9,0.05=1.645,u > uα,结论是拒绝零假设。

在做双侧检验时u 仍然等于1.82,双侧检验的临界值为u 9, 0.05/2=1.96, |u |<u 0.025, 不能拒绝零假设。

6、两种类型的错误(1)I 型错误,犯I 型错误的概率记为αα=P (I 型错误)=P (拒绝H 0|H 0是正确的,μ=μ0) (2)II 型错误,犯II 型错误的概率记为ββμ1=P (II 型错误)=P (接受H 0|H 0是错误的,μ=μ1) 例 继续上例,抽出n =10的样本,x =10.20g ,检验假设H 0:μ=10.00g H A :μ >10.00g标准化的样本平均数临界值u 0.05 =1.645,u < u 0.05, P > 0.05。

结论是不能拒绝H 0。

以样本平均数表示的临界值,可由下式得出在下图中0x 的位置已用竖线标出。

犯I 型错误的概率α,由竖线右侧μ0=10.00曲线下面积给出。

犯II 型错误的概率由竖线左侧μ1=10.30曲线下面积给出。

10.2010.001.580.40u -==0010.001.64510.2080.40x x -==犯II 型错误的概率β10.30=0.2327。

从上图中可以看出(1)当μ1越接近μ0时,犯II 型错误的概率越大。

(2)降低犯I 型错误的概率,必然增加犯II 型错误的概率。

(3)为了同时降低犯两种错误的概率,必须增加样本含量。

7、关于两个概念的说明:(1)当P <α时,所得结论的正确表述应为:由样本平均数推断出的总体平均数μ与μ0之间的差异有统计学意义。

即它们属于两个不同总体。

习惯上称为“差异是显著的”。

(2)接受H 0的更严密的说法应是:尚无足够理由拒绝H 0。

但习惯上采用接受H 0和拒绝H 0这种表达方法。

5.1.2 单个样本显著性检验的程序 (略)5.1.3 在σ已知的情况下,单个平均数的显著性检验-u 检验 检验程序如下:1、假设从σ已知的正态或近似正态总体中抽出含量为n 的样本。

()()2327.073.01040.030.10208.1030.10=-<=⎪⎪⎪⎪⎭⎫ ⎝⎛-<=<=U P U P u U P αβ2、零假设 H 0: μ=μ0备择假设 H A : ① μ > μ0 ② μ < μ0 ③ μ ≠ μ03、显著性水平 在α=0.05水平上拒绝H 0称为差异显著 在α=0.01水平上拒绝H 0称为差异极显著4、检验统计量5、相应于2中各备择假设之H 0的拒绝域 ① u > u α ② u <-u α ③ |u | > u α/26、得出结论并给予解释例 已知豌豆籽粒重量服从正态分布N (377.2,3.32)在改善栽培条件后,随机抽取9粒,其籽粒平均重为379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量? 解 ① σ已知② 假设: H 0: μ= 377.2 H A : μ > 377.2 ③ 显著性水平: α=0.05 ④ σ已知,使用u 检验⑤ H 0的拒绝域:因H A :μ >μ0,故为上尾检验,当u >u 0.05时拒绝H 0 。

u 0.05=1.645。

⑥ 结论: u > u 0.05 , 即P < 0.05, 所以拒绝零假设。

栽培条件的改善,显著地提高了豌豆籽粒重量。

5.1.4 σ未知时平均数的显著性检验-t 检验nx u σμ0-=82.193.32.3772.3790=-=-=nx u σμ检验程序如下:1、假设从σ未知的正态或近似正态总体中抽出含量为n 的样本。

2、零假设: H 0: μ=μ0 备择假设: H A : ① μ > μ0② μ < μ0 ③ μ ≠ μ03、显著性水平: 在α=0.05水平上拒绝H 0称为差异显著 在α=0.01水平上拒绝H 0称为差异极显著4、检验统计量: 当σ未知时以s 代替之,标准化的变量称为t ,服 从n -1自由度的t 分布。

t 分布的临界值可从附表4中查出。

5、相应于2中各备择假设之H 0的拒绝域: ① t > t α ② t <-t α ③ |t | > t α/26、得出结论并给予解释。

例 已知玉米单交种群单105的平均穗重μ0=300g 。

喷洒植物生长促进剂后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、294、320g 。

问喷药后与喷药前的果穗重差异是否显著? 解 ① σ未知② 假设: H 0: μ=300 H A : μ ≠300激素类药物需有适当的浓度,浓度适合时促进生长,浓度过高时反而抑制生长,在这里喷药的效果是未知的,并非仅能促进生长,需采用双侧检验③ 显著性水平: α=0.05 ④ σ未知应使用t 检验,已计算出x =308,s =9.62ns x t 0μ-=49.2962.93003080=-=-=n s x t μ⑤ H 0的拒绝域:因H A :μ≠μ0,故为双侧检验,当|t |>t 0.025时拒绝H 0 。

t 0.025=2.306。

⑥ 结论:因|t |>t 0.025 , 即P < 0.05,所以拒绝零假设。

喷药前后果穗重的差异是显著的。

若规定α=0.01,t 0.01/2=3.355,t < t 0.005,因此喷药前后果穗重的差异尚未达到“极显著”。

5.1.5 变异性的显著性检验-χ2检验χ2检验的基本程序如下:1、假设从正态总体中随机抽取含量为n 的样本,计算出样本s 2。

2、零假设: H 0: σ=σ0备择假设: H A : ① σ > σ0② σ < σ0 ③ σ ≠ σ03、显著性水平: 在α=0.05水平上拒绝H 0称为差异显著 在α=0.01水平上拒绝H 0称为差异极显著4、检验统计量:统计量χ2服从n – 1自由度的χ2分布。

5、相应于2中各备择假设之H 0的拒绝域: ① χ2 >χ2α ② χ2 <χ21-α③ χ2<χ21-α/2 和 χ2>χ2α/2 6、得出结论并给予解释。

例 一个混杂的小麦品种,株高标准差σ0=14cm ,经提纯后随机抽出10株,它们的株高为:90、105、101、95、100、100、101、105、93、97cm ,考查提纯后的群体是否比原群体整齐?解① μ未知,对未知总体的方差做检验()2221σχs n -=② 假设: H 0: σ=14cm 0 H A : σ < σ0小麦经提纯后株高只能变得更整齐,因而使用下侧检验。

相关主题