当前位置:文档之家› 第四章 生物统计学统计推断121031

第四章 生物统计学统计推断121031

8
3、临界值
例 从上述动物群体中抽出含量n=10的样本, 计算出x=10.23g,并已知该批动物的总体平 均数μ绝不会小于10.00g,规定的显著水平α= 0.05。根据以上条件进行统计推断。
H0: μ=10.00 HA: μ>10.00 根据备择假设,为了x 得到落在上侧尾区的
概率P(U > u),将x 标准化,求出u值。
样本含量。
15
7、关于两个概念的说明
(1)当p <α时,所得结论的正确表述应为:由 样本平均数推断出的总体平均数μ与μ0之间的 差异有统计学意义。即它们属于两个不同总体。 习惯上称为“差异是显著的”。
(2)接受H0的更严密的说法应是:尚无足够理 由拒绝H0。但习惯上采用接受H0和拒绝H0这 种表达方法。
6
从动物群体中抽出含量为n的样本,计算样本 平均数,假设该样本是从N(10.00,0.402 )中抽 取的,标准化的样本平均数
u
x
0
x
10.00 0.40
n
n
服从N(0,1)分布,可以从正态分布表中查出样本 抽自平均数为μ的总体的概率,即P(U>u), P(U<-u), 以及P(|U|>u)的概率。
➢ H0:μ=300 HA:μ≠300 ➢ 统计量: t x 0
s
n
28
➢ Data View ➢ Variable View
SPSS 界面
29
SPSS操作
➢ 在Data View中输入数据后,选择 [Analyze]=>[Compare Means]=>[One Sample T Test],弹出对话框,将“穗重”
13
6、两种类型的错误
(1)I型错误,犯I型错误的概率记为α
α=P(I 型错误)=P(拒绝H0|H0是正确的,μ=μ0) 弃真错误
(2)II型错误,犯II型错误的概率记为β
βμ1=P(II 型错误)=P(接受H0|H0是错误的,μ=μ1) 纳伪错误
14
犯I型错误的概率α,犯II型错误的概率
(((2)13))降当为低μ了犯1 I型越同错接时误近降的μ低概0 率时犯,,两必犯种然I错增I型 加错误犯误的II型的概错概率误, 的率必概越须率大增。。加
即改善栽培条件显著提高了豌豆籽粒重量。
22
当总体方差σ2未知时,只要样本容量n>30,可 以用样本方差s2来代替σ2 ,仍可以使用u检验 法
例:生产某种纺织品,要求棉花纤维长度平均 为30mm以上,现有一棉花品种,以n=400进 行抽查,测得其纤维平均长度为30.2mm,标 准差为2.5mm,问该棉花品种的长度是否符合 纺织品的生产?
9
u
x
0
10.23 10.00 0.40
1.82
n
10
P(U >1.82)=0.03438,P < 0.05,拒绝H0,接受 HA。
10
在实际应用中,并不直接求出概率值,而是建 立在α水平上H0的拒绝域。从正态分布上侧分 位数表中查出P(U > uα)= α时的uα值,U > uα的 区域称为在α水平上的H0拒绝域,而U < uα的 区域称为接受域。接受域的端点一般称为临界 值。本例的u=1.82,从附表3可以查出 u0.05=1.645, u > uα,落在拒绝域内,拒绝H0而 接受HA。
t x 0
s
n
26
检验程序
5、相应于2中各备择假设之H0的拒绝域: ① t > tα ② t <-tα ③ |t| > tα/2
6、得出结论并给予解释。
27
例:已知玉米单交种群单105的平均穗重μ0= 300g。喷洒植物生长促进剂后,随机抽取9个 果穗,其穗重为:308、305、311、298、315、 300、321、294、320g。问喷药后与喷药前的 果穗重差异是否显著?
➢ 依题意有: n=9 x=379.2 σ=3.3
➢ H0:μ=377.2 HA:μ>377.2
➢ ➢
a=0.05 统计量:
u
x
0
379.2 377.2 3.3
2 1.1
1.82
n
9
➢ 查临界值,确定拒绝域和接受域
21
标准正态分布的单侧和双侧分位点(/临界值)表
Uα Uα/2
➢ 查表得:u0.05(单)=1.645 ∵u=1.82>u0.05(单)=1.645 ∴p<0.05,落在拒绝域内,故拒绝H0,接受HA ,
导入“Test Variable”框中,在“Test Value” 中输入300,<OK> ,在output界面输出统计 结果:
30
SPSS操作
31
SPSS结果输出
s s
x
n
穗重
穗重
t 2.495
One-Sample Statistics
N 9
Std. Error
Mean Std. Deviation Mean
23
解题思路: “t检验”或“大样本u检验”
解:依题意有: n=400 x=30.2 s=2.5
➢ H0:μ=30 (代表μ≤30 区间,不符合生产要求) HA:μ>30 (代表符合生产要求的长度区间)
➢ a=0.05
∵ n=400>30为大样本,故可用u检验代替t检验
➢ 统计量: u x 0 30.2 30 0.2 1.6
12
5、单侧检验和双侧检验的效率
在样本含量和显著水平相同的情况下,单侧检验的 效率高于双侧检验。这是因为在做单侧检验利用了 已知有一侧是不可能这一条件,从而提高了它的辨 别力。所以,在可能的条件下尽量做单侧检验。
例 上例已经计算出u =1.82,上尾单侧检验的临界 值u0.05=1.645,u > uα,结论是拒绝零假设。在做 双侧检验时u仍然等于1.82,双侧检验的临界值为 u 0.05/2 =1.96, |u|<u0.025, 不能拒绝零假设。
16
二、单个样本显著性检验的程序
1. 假设:确定H0和HA 2. 显著性水平:α=?(0.01,0. 05,0.10) 3. 确定应该使用的检验方法:u检验、t检验、
χ2检验、F检验 4. 建立在α水平上H0的拒绝域:单侧检验、双
侧检验 5. 对推断的解释:看统计量的值落在接受域还
是拒绝域里
17
三、在σ已知的情况下,单个平均数的显 著性检验—— u 检验
实验要求动物体重μ=10.00g。已知总体标准 差σ=0.40g,总体平均数μ未知,为了得出对 总体平均数μ的推断,以便决定是否接受这批 动物,随机抽取含量为n的样本,通过样本平 均数,推断μ。
4
1、假设
H0: μ=μ0 或 H0: μ-μ0=0 HA: μ>μ0 μ<μ0 μ≠μ0 三种情况中的一
4、检验统计量:
统计量 2服从n – 1自由度的 2分布。
2
n 1 s2
2 0
35
检验程序
5、相应于2中各备择假设之H0的拒绝域: ① χ2 > χ2 α ② χ2 < χ2 1-α ③ χ2 < χ2 1-α/2 和 χ2 > χ2 α/2
6、得出结论并给予解释。
36
例:一个混杂的小麦品种,株高标准差σ0= 14cm,经提纯后随机抽出10株,它们的株
7
小概率事件
如果得到的值很小,则抽自平均数为μ0的总体的事 件是一个小概率事件,它在一次试验中几乎是不会 发生的,但实际上它发生了,说明假设的条件不正 确,从而拒绝零假设,接受备择假设。
显著性检验:根据小概率原理建立起来的检验方法
显著性水平:拒绝零假设时的概率值,记为α。通常 采用α=0.05和α=0.01两个水平,当P < 0.05时称为 差异显著,P < 0.01时称为差异极显著。
11
4、单侧检验和双侧检验
上尾单侧检验:上例中的HA:μ>μ0,相应的拒 绝域为U > uα。对应于HA:μ>μ0时的检验称为 上尾单侧检验。
下尾单侧检验:对应于HA:μ<μ0时的检验称为 下尾单侧检验。其拒绝域为U <-uα。
双侧检验:对应于HA:μ≠μ0时的检验称为双侧 检验。双侧检验的拒绝域为|U| >uα/2 。19
检验程序
5、相应于2中各备择假设之H0的拒绝域 ① u > uα ② u <-uα ③ |u| > uα/2
6、得出结论并给予解释
20
例:已知豌豆籽粒重量服从正态分布N(377.2,
3.32)在改善栽培条件后,随机抽取9粒,其籽
粒平均重为379.2,若标准差仍为3.3,问改善
栽培条件是否显著提高了豌豆籽粒重量?
2、零假设: 备择假设:
H0: μ=μ0 HA: ① μ > μ0
② μ < μ0 ③ μ ≠ μ0
25
检验程序
3、显著性水平: 在α=0.05水平上拒绝H0称为 差异显著;在α=0.01水平上拒绝H0称为差异 极显著。
4、检验统计量: 当σ未知时以s 代替之,标准 化的变量称为t,服从n-1自由度的t分布。t 分布的分位数可从附表4中查出。
种。 本例的μ0=10.00g,因此
H0: μ=10.00 HA: μ>10.00 或 μ<10.00或 μ≠10.00
5
2、小概率原理
小概率的事件,在一次试验中几乎是不会发生 的,若根据一定的假设条件计算出来该事件发 生的概率很小,而在一次试验中,它竟然发生 了,则可以认为假设的条件不正确,从而拒绝 假设。
308.00
9.618
3.206
One-Sample Test
相关主题