5-1常用的显著性检验方法
符合u检验条件: 样本服从正态分布,总体方差σ2 =64。 需作两尾检验: 每罐平均净重可能高于或低于正常工作状态下
的标准净重。
(1) 提出假设。 无效假设H0:μ=μ0= 500 g,即当日装罐机每罐平均净重
与正常工作状态下的标准净重一样。 备择假设HA:μ≠μ0,即罐装机工作不正常。
(2)确定显著水平: α=0.05
试验表面效应为:
x 0= 0=( 0)
试验的 处理效
应
试验误 差
如果处理效应不存在(即( 0)=0 ),则表面效应
仅由误差造成,此时可以说两总体平均数无显著差异;如果 处理效应存在,则表面效应不仅由误差造成,更主要由处理 效应影响。
所以,判断处理效应是否存在是假设检验的关健。
2.2 统计假设检验的基本思想 小概率事件实际不可能性原理 α= 0.05 0.01 0.001称之为小概率事件。
小概率事件不是不可能事件,但在一次试验中出现的可能 性很小,不出现的可能性很大,以至于实际上可以看成是 不可能发生的。
小概率事件实际不可能性原理是统计学上进行假设检验 (显著性检验)的基本依据。
小概率事件在一次试验中被认为是不可能发生的。
2.3 统计假设检验的基本原理
1. 对研究总体提出假设 H0: 无效假设、原假设、零假设(null hypothesis)
应根据试验要求或试验结论的重要性而定。 一般试验材料的变异系数大,难以控制的因素较多,试验误
差大,选定α=0.05即可。 对试验精度要求较高,不允许反复或试验结论应用事关重大,
一般α≤0.01,甚至选用α≤0.001。
统计假设检验的步骤
建立假设。对样本所属总体提出假设,包括无效假设H0和
备择假设HA;
又如:国家规定酿造白酒 中的甲醇含量不得大于 0.1%,因此,其否定域 只是在正态曲线的左侧 才有意义。
这类测验称为单尾测验。
§3 样本平均数的假设检验
3.1 单个样本平均数的假设检验
在实际工作中我们往往需要检验一个样本平均数与已知 的总体平均数是否有显著差异,即检验该样本是否来自某一 总体。
常用的检验方法有u检验和t检验。
为 x = 11.99%。试问,能否由这30个醋样的平均
数 x 判断新曲种好于原曲种?
食醋醋酸含量的差异是由于采用新曲种引起 的还是由于试验误差引起的?
例2:A,B两种肥料,在相同条件下各施用于5个小区的 水稻上,水稻产量平均分别为 xA=500 kg,xB=520 kg ,二 者相差20kg.
那么20kg差异究竟是由于两种肥料的不同而造成的 还是由试验的随机误差造成的?
1.2 几种常用可疑值的检出方法
1. 利用算术平均误差δ检查 • 除去可疑值后,求出δ
x可疑
• 计算可疑值与平均值之差d =| x可疑 - x |
• 若d≥2.5 δ时, 可疑值舍去;反之,保留.
2 拉衣达准则
对于实验数据x1,x2,…xn,先计算出平均值x 和标准差s,
若某个可疑值的离均差满足|di|=|xi - x |>3s(或 2s),
试验表面效应仅由误差引起的概率P>0.05,故H0 成立,即
当日装罐机工作正常。
3.1.2 单个样本平均数的t 检验
t 检验(t-test): 利用t分布来进行统计量的概率计算的假设 检验方法。
应用范围: 主要应用于总体方差未知的小样本资料(n<30).
均数标准误
S
=
x
S n
统计量t t x 0
确定显著水平α。常用的显著水平α=0.05和α=0.01; 从无效假设H0出发,根据样本提供信息构造适宜统计量,
并计算统计量值或概率;
由附表查出相应的统计量临界值,比较样本统计量值与临
界值大小,根据小概率原理做出统计推断。
2.5 双尾检验与单尾检验
双尾检验
在上述显著性检验中,对应于无效假设
H
第五章-1 常用的显著性检验方法
§1.可疑值的检验
1.1 可疑值和异常值 可疑值:当对同一样品进行重复测定时,一组数据中有 一、两个测定值明显地偏大或偏小,称之为可疑值; eg.酸碱滴定检测中,获得下列数据: 5.38, 5.38, 5.39, 5.40,5.41, 5.51
可疑值的处理: 1. 经分析,是属于技术上的失误,不论是否属于可疑值, 均应舍弃; 2. 若不能确定是技术上的失误,则应进行统计假设检验.
n = 0.119 0.0975=2.315 0.053/ 30
由正态分布双侧分位数(uа)可知
Pu 1.96=0.05 Pu 2.58=0.01
本例计算出的统计量u=2.315, 1.96< u <2.58,所以可推知其概率
0.01< P u 2.315 < 0.05
结果表明:本试验的表面效应 x 0 =0.0224完全由
H
:
0
0
,即新老工艺没有差异。
H
:
A
0
,新老工艺有差异。
(2)确定显著水平α=0.01 (3)计算t值
x =520g,S=12g
均数标准误
S
=
x
S= n
12 =3 16
t x u0 = 520 500 =6.667 **
Sx
3
自由度 df n 1 16 1 15
(4)查临界t值,作出统计推断
df 由 =15,查t值表, 得 t0.01(15)= 2.947,因为|t|>t0.01,
P<0.01, 故应否定H0,接受HA, 表明新老工艺的每100g加工出
的果量差异极显著。
3.2 两个样本平均数的差异显著性检验
验的表面效应是随机误差引起的。那么,可以把试验中所
x 获得的
看成是从0 总体中抽取的一个样本平均数,
由样本平均数的抽样分布理论可知,
x ~ N(μ0,σ2/n)。
构造统计量:
u x 0 x 0 ~ N(0,1) (4-1) 2 / n
n
由样本值计算统计量u值,
u x 0 x 0 2 / n
(3)构造统计量,并计算样本统计量值。
样本平均数:
x= xi =505 512 510 =502 .70
n
10
均数标准误: x= = 8 =2.530
n 10
统计量u值:
u x 0 =502.70 500=1.067
/ n
8 / 10
(4)统计推断。由显著水平α=0.05,查附表,得临界 值u0.05=1.96。实际计算出的u=1.067 u0.05=1.96 表明:
试验误差造成的概率在0.01-0.05之间,属于小概 率事件。
2.根据“小概率事件实际不可能性原理”否定或接 受
无效假设
•当试验的表面效应是试验误差的概率大于0.05时,即P>0.05, 则 说明无效假设成立的可能性大,不能被否定,因而接受无效假设。
•当试验的表面效应是试验误差的概率小于0.05时 ,即P《0.05, 可以认为
通过试验测定得到的每个观测值 xi ,既由被测个体所属
总体的特征决定,又受其它诸多无法控制的随机因素的影响。
所以观测值 xi 由两部分组成,即
xi = + i
总体平均数 反映了总体特征,i 表示试验误差。
若样本含量为n ,则样本平均数:
x xi n ( i)/ n
可以看出,样本平均数并非总体平均数,它还包含试验误 差的成分。
3s (或2s) 作为极限误差,则认为xi是异常数据,予以剔除。
选择 3s 还是 2s 作为极限误差,取决于检验的显著性水平α, 或者可信度1- α.
3s相当于显著性水平α=0.01, 2s相当于显著性水平α=0.05. 注:计算平均值和标准差时可疑值包括在内.
3. t-检测准则
实验数据按大小顺序排列:
图所示。这种利用两尾概率进行的检验叫 双侧检验(two-sided
test),也叫双尾检验(two-tailed test), u 为双侧检验
的临界u值。
单尾测验
例:某酿醋厂曲种酿造醋的醋酸含量保证在12%以上,则其 假设H0:μ>12%, HA:μ≤12%。如果选择的新曲种酿造醋的 醋酸含量小于12%,H0被否定,μ只能大于12%,若小于12%, 便不符合规定的企业标准,没有推广价值。因此,只是在正态 曲线的右尾一个否定域。
:
0
0
的备择假设为
H
:
A
0
。它包含了 0
或 0 两种可能。 因而有两个否定域,分别位于分
布曲线的两尾。对两尾进行检验的方法称为双尾检验.
这个假设检验的目的在于判断μ与μ0有无差异,而不考
虑谁大谁小。
这样,在α水平上否定域有两个 , u 和 u , ,
对称地分配在u分布曲线的两侧尾部,每侧的概率为α/2,如下
造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等, 这个假设表明: 采用新曲种酿造食醋对提高醋酸含量是无 效的,试验的表面效应是随机误差引起的。
对应的备择假设为 0=9.75% ,即表明: 采用新曲
种酿造食醋能够改变醋酸含量,试验的处理效应存在。
对前例分析,无效假设H0: =0=9.75% 成立,试
3.1.1 单个样本平均数的u 检验
u 检验(u-test): 在假设检验中利用标准正态分布来进行
统计量的概率计算的检验方法。
u 检验的应用范围: 1.样本资料服从正态分布N(μ,σ2),并且总体方差σ2 已知; 2.总体方差虽然未知,但样本平均数来自于大样本
(n≥30)。
【例1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每 罐净重服从正态分布N(500,64) (g)。某日随机抽查10瓶罐头 ,得净重为:505,512,497,493,508,515,502,495, 490,510。问装罐机当日工作是否正常?