当前位置：文档之家› 统计假设测验(显著性检验)

统计假设测验(显著性检验)

判定是否属小概率事件的概率值叫显著水平 (significant level), 一般以α表示。农业上常取0.05 和0.01。凡计算出的概率p小于α的事件即为小概率事件。
统计上，当1%＜p ≤5%称所测差异显著， p ≤1%称差异极显著， p＞5%称差异不显著，
所以，统计假设测验又叫差异显著性测验 (difference significance test)
在实际检验时，计算概率可以简化，因为在标准正态分布下：
P（|u|＞1.96）=0.05， P（|u|＞2.58）=0.01，因此，在用u分布作检验时， |u|≥1.96，表明概率P＜0.05，可在0.05水平上否定H0； |u，|≥表2.明58P，＞表0.明05概，率可P接＜受0.H001。，不可必在再0.计01算水实平际上的否概定率H0。|u|<1.96
第二节单个平均数的假设检验
单个平均数的假设检验就是检验某一样本所属总体平均数是否和某一指定的总体平均数相同，检验所依据的理论基是平均数的抽样分布
一单个平均数u检验
（一）应用条件： 1 总体参数μ0和σ2为已知。 2 总体参数μ0已知， σ2 为未知，但
为大样本（n≥30），可用S2估计。
此错误的概率为β。
β
β
x1 x1 μ0
x2 x2μ
x
否定区间
接受区间
由图可见，β的大小与｜μ－μ0｜、α有反比关系；而与标准
误
有正比关系。
x
n
实际中控制犯两类错误的措施有以下几种：
①适当增大水平间差距，即增大｜μ－μ0｜。
②增加n。
③根据试验目的，通过调整α的大小来控制犯错误的概率。即当试验者主观希望获得差异显著(不显著) 的检验结果时，（此时易接受第一类(二类)错误），应适当减小(增大) α。
二、统计假设测验的意义
设甲施肥方法的总体平均数为 1 ，乙施肥方法的总体平均数为 2，试验研究的目的，就是要给 1 、2 是否相同做出推断。由于总体平均数 1、2未知，在进行显著性
检验时只能以样本平均数 x1、x2作为检验对象，更确切地说，是以（ x1 - x2）作为检验
对象。
二、统计假设测验的意义
α=0.05时H0：µ≥µ0的接受区和否定区
四、统计假设测验的两类错误
• 检验结果有四种情况：
检验结果真实情况
H0正确 H0错误
否定H0 第一类错误
正确
接受H0 正确
第二类错误
第一类错误：把非真实差异错判为真实差异。犯此错误的概率为α。
f( x)
2
接受区间
x1
μ
否定区间 0
2
x2 x
• 第二类错误：把真实差异错判为非真实差异。犯
新品系 n=16，－x=380kg
µ
？ µ≠µ0
H0 0 HA 0
（二）在无效假设成立的前提下，计算无效假设正确的概率
在H0：μ=μ0（360kg）为正确的前提下，
ux 0 360
x
n
40 10 16
样本平均数=380kg则是此分布总体中的一个随机变量，据此，就可以根据正态分布求概率的方法算出在平均数 μ=360kg 的总体中，抽到一个样本平均数和μ相差≥20kg的概率，从而确定是接受或否定H0。
测验(statistical hypothesis test)。
三、显著性检验的基本步骤
（一）首先对试验样本所在的总体作假设
无效假设 H 0 ： 1 = 2 或 1 - 2 =0 0 或 0 0
无效假设是被检验的假设，通过检验可能被接受，也可能被否定。提出H0的同时相应地提出一对应假设，
虽然处理效应（1 - 2）未知，但试验的表面效应是可以计算的，借助数理统计方法可以对试验误差作出估计。所以，可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在，这就是显著性检验的基本思想。
二、统计假设测验的意义
先假设真实差异不存在，表面差异全为试验误差。然后计算这一假设出现的概率，根据小概率事件实际不可能性原理，判断假设是否正确。这是对样本所属总体所做假设是否正确的统计证明，称为统计假设
σ
x
)
假设否定区域（negation region)
x
≤( µ0－1.96
σ -
σ -x )
(
µ0－1.96
σ
x
)
= 360-1.96×10=340.4kg
接受区域 95%
(
µ0＋1.96
σ
x
)
= 360+1.96×10=379.5kg
否定区域 2.5%
否定区域 2.5%
二、统计假设测验的意义
对两个样本进行比较时，必须判断样本间差异是抽样误差造成的，还是本质不同引起的。如何区分两类性质的差异？怎样通过样本来推断总体？这正是显著性检验要解决的问题。
二、统计假设测验的意义
两个总体间的差异如何比较？一种方法是研究整个总体，即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的，但常常是不可能进行的，因为总体往往是无限总体，或者是包含个体很多的有限总体。因此，不得不采用另一种方法，即研究样本，通过样本研究其所代表的总体。
统计推断
参数估计假设测验
点估计区间估计
统计推断的前提条件：资料必须来自随机样本；统计数的分布规律必须已知。
二、统计假设测验的意义
[例] 有一水稻施肥试验，甲乙两种施肥方法的水稻产量如下
x1 (甲) 8.2 9.6 8.7 8.9 9.4 8.5 Σ=53.3 x1 =8.88
x2 (乙) 10.7 11.2 9.2 10.9 11.1 10.8
第六章统计假设测验（显著性检验）
第一节统计假设检验的基本原理和方法第二节单个平均数的假设检验第三节两个平均数相比较的假设检验第四节百分数的假设检验第五节参数的区间估计
第一节统计假设检验的基本原理和方法
一、统计推断的概念
统计推断：是指用一个或一系列样本的结果去估计总体可能的结果的过程。统计推断基本上包括两大部分的内容，一是假设测验，二是参数估计。
一单个平均数u检验
（二）方法步骤
[例1] 已知某工厂排污水中石油浓度分布属正态分布，经处理后随机采样16次，得样本平均数=48 mg·L-1。已知原总体平均数μ=50m g·L-1，总体方差σ2=6.25，问污水处理前后石油含量有无显著差异？
▪ 统计假设 H0：μ=μ0（50 g·L-1） HA：μ≠μ0
• 显著水平：统计推断时，衡量差异显著性程度的概率标准，称为显著性水平，以α表示。
• 常用显著水平 α=0.05 称为5%的显著水平
α=0.01 称为1%的显著水平
也有用
α=0.25 称为25%的显著水平
α=0.10 称为10%的显著水平
（二）在无效假设成立的前提下，计算无效假设正确的概率
原品种 µ0 =360kg ，σ=40kg
（二）在无效假设成立的前提下，计算无效假设正确的概率
f( x )
u x 0 380 360 2
x
10
0 ux 360 x 380 x
查附表2，即得u值对应的概率p＜0.05。表明20Kg差异属于试验误差的概率小于5%。
根据小概率事件实际不可能性原理，这个假设应被否定，即表面差异不全为试验误差，新品系与原品种之间存在真实差异。
（一）t 分布
在变计量算不再S服x从时标，准由正于态采分用布S，来而代是替服σ从，t使分得布t
(t－distribution)。它的概率分布密度函数
如下：
f (t)
[(df 1) / 2]
(1
t2
(
df
1 )
)2
df （df / 2)
df
t
df=n-1为自由度。
t分布的主要特性：
1、t分布受自由度的制约，每一个自由度都有一条 t分布密度曲线。
Σ=63.9 x 2 =10.65
能否仅凭这两个平数
的差值 x2- x1= 1.77，
立即得出甲与乙两种
施肥方法的水稻产量
不同的结论呢？
二、统计假设测验的意义
统计学认为，这样得出的结论是不可靠的。因为如果我们再做一次甲乙两种施肥方法试验，又可得到两个样本资料。由于抽样误差的随机性，两样本平均数就不一定是8.88和10.65，其差值也不一定是1.77 。造成这种差异可能有两种原因，一是两种施肥方法不同造成的差异，即是两种施肥方法本质不同所致，另一可能是试验误差（或抽样误差）。
观测值由两部分组成，即 xi i
若样本含量为n ，则可得到n 个观测值：x1 x2 xn
样本平均数：x xi n （ i）/ n
对于接受不同处理的两个样本来说，则有：
x1 11 x2 2 2
x1 x2 (1 2 ) (1 2 )
表面效应
处理效应
试验误差
二、统计假设测验的意义
n
将随机变量
x
标准化得： u (x ) (x )
x
/ n
当总体标准差σ未知时，以样本标准差 S 代替σ所
得到的统计量记为t t (x ) (x )
Sx
S/ n
t 分布的定义：
若X～N（μ，σ2），则
x
t＝
～t（df）—— t分布。
sn
X μ，σ2
n x ，s
x
t＝
sn
t总体
……
二、单个平均数 t 检验
（二）在无效假设成立的前提下，计算无效假
x 设正确的概率

e商务文档

统计假设测验(显著性检验)

相关文档推荐：