当前位置:文档之家› 统计假设测验(显著性检验)

统计假设测验(显著性检验)


判定是否属小概率事件的概率值叫显著水平 (significant level), 一般以α表示。农业上常取0.05 和0.01。凡计算出的概率p小于α的事件即为小概率 事件。
统计上,当1%<p ≤5%称所测差异显著, p ≤1%称差异极显著, p>5%称差异不显著,
所以,统计假设测验又叫差异显著性测验 (difference significance test)
在实际检验时,计算概率可以简化,因为在标准正态分布下:
P(|u|>1.96)=0.05, P(|u|>2.58)=0.01, 因此,在用u分布作检验时, |u|≥1.96,表明概率P<0.05,可在0.05水平上否定H0; |u,|≥表2.明58P,>表0.明05概,率可P接<受0.H001。,不可必在再0.计01算水实平际上的否概定率H0。|u|<1.96
第二节 单个平均数的假设检验
单个平均数的假设检验就是检验某一样本所 属总体平均数是否和某一指定的总体平均数相同 ,检验所依据的理论基是平均数的抽样分布
一 单个平均数u检验
(一)应用条件: 1 总体参数μ0和σ2为已知 。 2 总体参数μ0已知, σ2 为未知,但
为大样本(n≥30),可用S2估计。
此错误的概率为β。
β
β
x1 x1 μ0
x2 x2μ
x
否定区间
接受区间
由图可见,β的大小与|μ-μ0|、α有反比关系;而与标准

有 正比关系。
x
n
实际中控制犯两类错误的措施有以下几种:
①适当增大水平间差距,即增大|μ-μ0|。
②增加n。
③根据试验目的,通过调整α的大小来控制犯错 误的概率。即 当试验者主观希望获得差异显著(不显著) 的检验结果时,(此时易接受第一类(二类)错 误),应适当减小(增大) α。
二、统计假设测验的意义
设甲施肥方法的总体平均数为 1 ,乙 施肥方法的总体平均数为 2,试 验研究的 目的,就是要给 1 、2 是否相同做出推断。 由于总体平均数 1、2未知 ,在进行显著性
检验时只能以样本平均数 x1、x2作为检验对 象,更确切地说,是以( x1 - x2)作为检验
对象。
二、统计假设测验的意义
α=0.05时H0:µ≥µ0的接受 区和否定区
四、统计假设测验的两类错误
• 检验结果有四种情况:
检验结果 真实情况
H0正确 H0错误
否定H0 第一类错误
正确
接受H0 正确
第二类错误
第一类错误:把非真实 差异错判为真实差异。 犯此错误的概率为α。
f( x)
2
接受区间
x1
μ
否定区间 0
2
x2 x
• 第二类错误:把真实差异错判为非真实差异。犯
新品系 n=16,-x=380kg
µ
? µ≠µ0
H0 0 HA 0
(二)在无效假设成立的前提下,计算无效假 设正确的概率
在H0:μ=μ0(360kg)为正确的前提下,
ux 0 360
x
n
40 10 16
样本平均数=380kg则是此分布总体中的一个随机 变量,据此,就可以根据正态分布求概率的方 法 算 出 在 平 均 数 μ=360kg 的 总 体 中 , 抽 到 一 个 样本平均数和μ相差≥20kg的概率,从而确定是 接受或否定H0。
测验(statistical hypothesis test)。
三、显著性检验的基本步骤
(一)首先对试验样本所在的总体作假设
无效假设 H 0 : 1 = 2 或 1 - 2 =0 0 或 0 0
无效假设是被检验的假设,通过检验可能被接 受,也可能被否定。提出H0的同时相应地提出一 对应假设,
虽然处理效应(1 - 2)未知,但试验的 表面效应是可以计算的,借助数理统计方法 可以对试验误差作出估计。所以,可从试验 的表面效应与试验误差的权衡比较中间接地 推断处理效应是否存在,这就是显著性检验 的基本思想。
二、统计假设测验的意义
先假设真实差异不存在,表面差异全为 试验误差。然后计算这一假设出现的概率, 根据小概率事件实际不可能性原理,判断 假设是否正确。这是对样本所属总体所做 假设是否正确的统计证明,称为统计假设
σ
x
)
假设否定区域(negation region)
x
≤( µ0-1.96
σ -
σ -x )
(
µ0-1.96
σ
x
)
= 360-1.96×10=340.4kg
接受区域 95%
(
µ0+1.96
σ
x
)
= 360+1.96×10=379.5kg
否定区域 2.5%
否定区域 2.5%
二、统计假设测验的意义
对两个样本进行比较时 ,必须判断样 本间差异是抽样误差造成的,还是本质不 同引起的。如何区分两类性质的差异?怎 样通过样本来推断总体?这正是显著性检 验要解决的问题。
二、统计假设测验的意义
两个总体间的差异如何比较?一种方法 是研究整个总体,即由总体中的所有个体数 据计算出总体参数进行比较。这种研究整个 总体的方法是很准确的,但常常是不可能进 行的,因为总体往往是无限总体 ,或者是 包含个体很多的有限总体。因此 ,不得不 采用另一种方法,即研究样本,通过样本研 究其所代表的总体。
统计推断
参数估计 假设测验
点估计 区间估计
统计推断的前提条件: 资料必须来自随机样本; 统计数的分布规律必须已知。
二、统计假设测验的意义
[例] 有一水稻施肥试验,甲乙两种施肥方法的水稻产量如下
x1 (甲) 8.2 9.6 8.7 8.9 9.4 8.5 Σ=53.3 x1 =8.88
x2 (乙) 10.7 11.2 9.2 10.9 11.1 10.8
第六章 统计假设测验(显著性检验)
第一节 统计假设检验的基本原理和方法 第二节 单个平均数的假设检验 第三节 两个平均数相比较的假设检验 第四节 百分数的假设检验 第五节 参数的区间估计
第一节 统计假设检验的基本原理和方法
一、统计推断的概念
统计推断:是指用一个或一系列样本的结 果去估计总体可能的结果的过程。统计推断基本 上包括两大部分的内容,一是假设测验,二是参 数估计。
一 单个平均数u检验
(二)方法步骤
[例1] 已知某工厂排污水中石油浓度分布属正态分 布,经处理后随机采样16次,得样本平均数=48 mg·L-1。已知原总体平均数μ=50m g·L-1,总体 方差σ2=6.25,问污水处理前后石油含量有无显 著差异?
▪ 统计假设 H0:μ=μ0(50 g·L-1) HA:μ≠μ0
• 显著水平:统计推断时,衡量差异显著性程度的概率标准, 称为显著性水平,以α表示。
• 常用显著水平 α=0.05 称为5%的显著水平
α=0.01 称为1%的显著水平
也有用
α=0.25 称为25%的显著水平
α=0.10 称为10%的显著水平
(二)在无效假设成立的前提下,计算无效假 设正确的概率
原品种 µ0 =360kg ,σ=40kg
(二)在无效假设成立的前提下,计算无效假 设正确的概率
f( x )
u x 0 380 360 2
x
10
0 ux 360 x 380 x
查附表2,即得u值对应的概率p<0.05。表明20Kg差异 属于试验误差的概率小于5%。
根据小概率事件实际不可能性原理,这个假设应被否定, 即表面差异不全为试验误差,新品系与原品种之间存在真实 差异。
(一)t 分布
在变计 量算 不再S服x从时标,准由正于态采分用布S,来而代是替服σ从,t使分得布t
(t-distribution)。它的概率分布密度函数
如下:
f (t)
[(df 1) / 2]
(1
t2
(
df
1 )
)2
df (df / 2)
df
t
df=n-1为自由度。
t分布的主要特性:
1、t分布受自由度的制约,每一个自由度都有一条 t分布密度曲线。
Σ=63.9 x 2 =10.65
能否仅凭这两个平数
的差值 x2- x1= 1.77,
立即得出甲与乙两种
施肥方法的水稻产量
不同的结论呢?
二、统计假设测验的意义
统计学认为,这样得出的结论是不可靠的 。 因为如果我们再做一次甲乙两种施肥方法试验, 又可得到两个样本资料 。由于 抽样误差的 随机 性,两样本平均数就不一定是8.88和10.65,其 差值也不一定是1.77 。造成这种差异可能有两种 原因,一是两种施肥方法不同造成的差异,即是 两种施肥方法本质不同所致,另一可能是试验误 差(或抽样误差)。
观测值由两部分组成,即 xi i
若样本含量为n ,则可得到n 个观测值:x1 x2 xn
样本平均数:x xi n ( i)/ n
对于接受不同处理的两个样本来说,则有:
x1 11 x2 2 2
x1 x2 (1 2 ) (1 2 )
表面效应
处理效应
试验误差
二、统计假设测验的意义
n
将随机变量
x
标准化得: u (x ) (x )
x
/ n
当总体标准差σ未知时,以样本标准差 S 代替σ所
得到的统计量记为t t (x ) (x )
Sx
S/ n
t 分布的定义:
若X~N(μ,σ2),则
x
t=
~t(df)—— t分布。
sn
X μ,σ2
n x ,s
x
t=
sn
t总体
……
二、单个平均数 t 检验
(二)在无效假设成立的前提下,计算无效假
x 设正确的概率
相关主题