实验数据处理与分析 第四章
某罐头厂生产肉类罐头,其自动装罐机在正常工作
时每罐净重服从正态分布N(500,64)(单位,g) 。某日随机抽查10瓶罐头,得净重为:505,512,
497,493,508,515,502,495,490,510。问装
罐机当日工作是否正常?
为了降低犯两类错误的概率,一般从选取适当的
和增加试验重复次数 n来考虑。因为选取 数值小的显著水平 值可以降低犯Ⅰ类型错误的概率,
著差异。
甲生产线(x1) 71 56 54 71 57 62 69 73 72 65 62 62 54 78 70 58 53 78 63 67 乙生产线(x2) 53 54 60 56 49 51 53 66 58 70 70 66 65 52 71 58 55 53 56 55
74 62 61 77 59
n≥30)。
【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正
常工作时每罐净重服从正态分布N(500,64)(单 位,g)。某日随机抽查10瓶罐头,得净重为:505
,512,497,493,508,515,502,495,490,510
。问装罐机当日工作是否正常?
(1) 提出假设 无效假设H0:μ =μ 0=500g,即当日装罐机每 罐平均净重与正常工作状态下的标准净重一样。 备择假设HA:μ≠μ0,即罐装机工作不正常。 (2)确定显著水平 α =0.05(两尾概率)
小或试验误差越大,就越容易将试验的真实
差异错判为试验误差。
显著性检验的两类错误归纳如下:
表4-1 显著性检验的两类错误
客观实际
检验结果 否定 H 0 Ⅰ型错误( ) 推断正确(1- ) 接受 H 0 推断正确(1- ) Ⅱ型错误( )
H 0 成立 H 0 不成立
因而,不能仅凭统计推断就简单地作出绝 对肯定或绝对否定的结论。 “有很大的可靠性,但有一定的错误率” 这 是统计推断的基本特点。
显著水平
但与此同时也增大了犯Ⅱ型错误的概率,所以显著水
平 值的选用要同时考虑到犯两类错误的概率的大小。
四、双侧检验与单侧检验
某罐头厂生产肉类罐头,其自动装罐机在正常工作
时每罐净重服从正态分布N(500,64)(单位,g)
。某日随机抽查10瓶罐头,得净重为:505,512,
497,493,508,515,502,495,490,510。问装 罐机当日工作是否正常?
第四章 统计假设检验
本章主要内容
统计假设检验概述 样本平均数的假设检验 二项百分率的假设检验 统计假设检验中应注意的问题 参数的区间估计
第一节 统计假设检验概述
统计假设检验的意义和基本原理
统计假设检验的步骤
统计假设检验的几何意义与两类错误
两尾检验与一尾检验
一、 统计假设检验的意义和基本原理
t0.05( 7 )= 双侧 t0.10( 7 )= 1.895,t=1.000<
0
单侧t0.05(7),P > 0.05 ,不能否定H0 : ≤
=5.5%,可以认为该批绿茶的含水量符合规定要 求。
[练习1]某植物油厂在正常生产情况下,豆油中的平
均酸价为3.5,经抽查了9份样品,测得其酸价为3.8, 4.0, 3.9, 4.1,4.2,4.0,4.2,3.7,4.1,问该生产 线生产是否正常?
(3)构造统计量,并计算样本统计量值 样本平均数: 均数标准误: 统计量u值:
x=
x = 505 512 510=502.70
i
n
10
=
x
n
=
8 =2.530 10
x 0 502.70 500 u = = 1.067 / n 8 / 10
(4)统计推断 由显著水平α =0.05,查附表,得临界值u0.05= 1.96。实际计算出的 u= 1.067 u = 1.96表明,试验
统计假设检验的意义 例1:某一酿造厂新引进一种酿醋曲种,以原 曲种为对照进行试验。已知原曲种酿出的食醋 醋酸含量平均为μ 0=9.75%,其标准差为σ = 5.30%。现采用新曲种酿醋,得到30个醋样, 测得其醋酸含量平均为 x = 11.99%。问新曲 种是否好于原曲种?
1 2 从试验的表面效应与试验误差的权衡比
如果试验中难以控制的因素较多,试验
误差可能较大,则显著水平可选低些,即α
值取大些。反之 ,如试验耗费较大,对精
确度的要求较高,不容许反复,或者试验结
论的应用事关重大,则所选显著水平应高些,
即α值应该小些。
差异显著性判定:
差异不显著
差异显著 差异极显著
统计假设检验的两类错误 因为在显著性检验中,否定或接受无效假 设的依据是“小概率事件实际不可能性原理”, 所以我们下的结论不可能有百分之百的把握。
这样,在α水平上否定域有两
个 , u和 ,对称 u , 地分配在u分布曲线的两侧尾
部,每侧的概率为α/2,如图 4-3所示。这种利用两尾概率 进行的检验叫 双侧检验(twosided test),也叫双尾检验
(two-tailed test),
验的临界u值。
为双侧检 u
因为|t|>t0.01, P<0.01, 故应否定H0,接受HA, 表
明新老工艺的每100g加工出的果冻量差异极显著。(在 统计量t上标记**)
[例4-3]某名优绿茶含水量标准为不超过5.5%。现有
一批该绿茶,从中随机抽出8个样品测定其含水量,
平均含水量
x =5.6%,标准差S=0.3%。问该批
绿茶的含水量是否超标?
单侧检验
如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持
在12%以上(μ0),如果进行抽样检验,样本平均数x
0
,
该批醋为合格产品,但如果
x 0 时,可能是一批不合格产
品。对这样的问题,我们关心的是 x
所在总体平均数μ是否小
于已知总体平均数数μ0(即产品是否不合格)。此时,无效假
设应为H : 0 0 (产品合格),备择假设则应为 HA : 0
二、两个样本平均数的差异显著性检验
在实际工作中还经常会遇到推断两个样本平
H A: ,即新老工艺有差异。 0
(2)确定显著水平 α=0.01
(3)计算t值
所以
x
=520g,S=12g
S 12 均数标准误 S x= = =3 n 16
x 0 520 500 t = =6.667 * * Sx 3
自由度 df n 1 16 1 15
(4)查临界t值,作出统计推断 由df =15,查t值表(附表3)得t0.01(15)=2.947,
较中间接地推断处理效应是否存在,这 就是显著性检验的基本思想。
统计假设检验的基本原理
0.05
在统计学上,把小概率事件在一次试验中看成是 0.01 实际不可能发生的事件称为小概率事件实际不可 0.001 能性原理,亦称为小概率原理。小概率事件实际 称 之 不可能性原理是统计学上进行假设检验(显著性 为 检验)的基本依据。
显著性检验可能出现两种类型的错误: Ⅰ型错误 与Ⅱ型错误。
Ⅰ型错误又称为 错误,就是把非真实的差异 错判为是真实的差异,即实际上H0正确,检验结果 为否定H0。犯Ⅰ类型错误的可能性一般不会超过所 选用的显著水平 ;
Ⅱ型错误又称为 错误,就是把真实的 差异错判为是非真实的差异,即实际上HA正 确,检验结果却未能否定H0。 犯Ⅱ类型错 误的可能性记为 ,一般是随着 0 的减 小或试验误差的增大而增大,所以 0 越
(1)提出无效假设与备择假设
≤ =5.5%,HA: > 0 H0:
0
(2)计算 t 值
S 0.003 Sx = = =0.001 n 8 x 0 0.056 0.055 t= = =1.000 Sx 0.001
df n 1 8 1 7
(3)查临界t值,作出统计推断 单侧
单个样本平均数的u 检验
u 检验(u-test),就是在假设检验中利用
标准正态分布来进行统计量的概率计算的检验方
法。Excel中统计函数(Ztest)。
有两种情况的资料可以用u检验方法进行分析:
样本资料服从正态分布 N(μ,σ2),并且总体方 差σ2已知; 总体方差虽然未知,但样本平均数来自于大样本(
0.0 5
表面效应仅由误差引起的概率P>0.05,故不能否定
H0 ,所以,当日装罐机工作正常。
单个样本平均数的t 检验
t 检验(t-test)是利用t分布来进应用于总体
方差未知时的小样本资料(n<30)。
S 均数标准误 S x= n
x 0 统计量t t Sx
其中, 样本容量。
x 为样本平均数,S为样本标准差,n为
[例4-2]用山楂加工果冻,传统工艺平均每100g加工
500g果冻,采用新工艺后,测定了16次,得知每
100g山楂可出果冻平均为520g,标准差12g。问新工
艺与老工艺在每100g加工果冻的量上有无显著差异?
(1)提出无效假设与备择假设
H 0: 0,即新老工艺没有差异。
78 63 74 62 70
65 58 58 60 68
69 62 56 69 57
[例3]:意大利对进口谷物六六六(丙怀)农药残留限
量为0.5mg/kg,现我国某地区出口大米抽样检验所 得10个试样的检验结果,0.51、0.48、0.43、0.56、 0.53、0.52、0.49、0.51、0.50、0.47,问能否放 行?
[例1]某一酿造厂新引进一种酿醋曲种,以原曲种为
对照进行试验。已知原曲种酿出的食醋醋酸含量平