区间估计和假设检验
H0 : μ =210 H1 : μ≠210 选择显著性水平α= 0.05,由Z检验表查得
Z(0.05/2)=1.96
然后根据样本数计算统计值:
公式为:
Z= X—μ = 220—210 = 6.67
S/√n
15/√100
由于Z=6.67>Z (0.05/2) =1.96 所以.拒绝虚无假设,接受研究假设,即
这里,P为样本的百分比 。 例题:
从某工厂随机抽取400名工人进行调查,结 果表明女工的比例为 20%现在要求在90%的置 信度下,估计全厂工人中女工比例的置信区间。
(解)带入公式得:
20%±1.65× 20%×(1-20%) 400
即.16.7-23.3% 而当提高置信度时,比如在95%的置
信度下,置信区间为16.1%和23.9%.可见随着 制度的提高,置信区间进一步扩大,估计的精 确性则进一步降低.
(一)假设检验及其依据 假设检验实际上就是先对总体的某一参数 作出假设,然后用样本的统计量去进行验证,以决 定假设是否为总体所接受.
1.假设检验的依据
假设检验所依据的是概率论中的“小概率 原
理”即“小概率事件在一次观察中不可能出现的 原
理”,但是如果现实的情况恰恰是在一次观察中小 概率事件出现了,应该如何判断呢?
一种意见认为该事件的概率仍然很小 ,只不 过偶然被遇上了,
另一种则是怀疑和否定该事件的概率未必很 小,即认为该事件本身就不是一种小概率事件,而 是一种大概率事件.
2.举例说明假设检验的基本思路
某单位职工上月平均收入为210元,这个月 的情况与上月没有大的变化,我们设想平均收 入还是210元.
为了验证这一假设是否可靠,我们抽取100 人作调查,结果得出月平均收入为220元,标准 差位15元.
③根据样本数据计算出统计值,并根据显 著性水平查出对应的临界值.
④将临界值与统计值进行比较,以判定是 接受虚无假设还是接受研究假设.
(二)总体均值的假设检验
某单位职工上月平均奖金为210元,本月调查 了100名职工,平均奖金为220元,标准差为15元,问 该单位职工平均奖金与上月相比是否有变化. (解)首先建立虚无假设 (用H0 表示) 和研究假设 (用H1 表示) ,即有:
应扩大置信区间.比如我们将置信度提高到
99%时,那么,上例中得置信区间又是多大呢?
Z 检验表
P≤
0.10 0.05 0.02 0.01
│Z│≥
一端
二端
1.29
1.65
1.65
1.96
2.06
2.33
2.33
2.58
3.总体百分数的区间估计
总体百分数的区间估计公式为:
P±Z(1-α)
P(1—p) n
显然,样本的结果与总体 结果之间出现了 误差,这个误差是由于我们假设错误引起的,还 是由于抽样误差引起的呢?
如果是抽样误差引起的,我们就应该承认 原来的假设,而如果是假设错误引起的,我们就 应该否定原假设.
方法:
通过将原假设作为虚无假设,而将与之对 立的假设作为研究假设,然后用样本的数据计算 统计量并与临界值比较. 当统计值的绝对值小于临界值,
即│Z│≤Zα/2 时则接受虚无假设,否定 研究假设;当统计值的绝对值大于或等于临界值: 即│z│≥ Zα/2 时则拒绝虚无假设,接受研
究假设.
3.假设检验的步骤:
①建立虚无假设和研究假设通常将原假 设作为虚无假设.
②根据需要选择适当的显著性水α(即 小概率的大小).通常α=0.05或α=0.01等.
工资的置信区间是多少.
(解) 将调查资料带入总体均值的
区间估计公式得:
186± Z (1-0.05) 42
√900
查表得Z (1-0.05) = 1.96 (p.358)
所以,总体均值的置信间为:
186± 1.96×
42 √900
得183.26—188.74元
当我们希望提高估计的可靠性时就必须相
四、单变量推论统计
推论统计就是利用样本的统计值 对总体的参数值进行估计的方法.
推论统计的内容主要包括 两个方面:
区间估计 和 假设检验
一.区间估计(Interval Estimation)
1. 区间估计的概念 区间估计是指在一定的可信度(置信度)下,用样本
统计值的某个范围(置信区间)来“框”住总体的参数值. 范围的大小反映的是这种估计的精确性问题,而可
练习题:
从某校随机抽取300名教师进 行调查,得出他们的平均年龄为42 岁,标准差为5岁,在95%的置信度 下,该校全体教师平均年龄的置信 区间是多少?
二.假设检验
假设检验是推论统计中的另一种类型.需要 说明的是,这里的假设不是指抽象层次的理论假 设,而是指和抽样手段联系在一起并且依靠抽样 调查的数据进行验证的经验层次的假设,即统计 假设.
2.总体均值的区间估计
总体均值的区间估计公式:
X ± Z (1-α)
S
√n
其中X为样本平均数,S为样本标准差, Z(1-α) 为置
信度是1-α所对应的 Z 值. n为样本规模.
计算练习:
调查某单位的工资情况,随机抽取900名工人作
为样本,调查得到他们的月平均工资为186元,标准
差为42元,求95%得置信度下,全单位职工的月平均
它可以这样来解释,如果从这个总体中重复抽样 100次,约有95%次所抽 样本的统计值都落 在这个区间, 说明这个区间估计的可靠性为95%.
对于同一总体和同一抽样规模来说 ①所给区间的大小与做出这种估计所具有的把握性形 成正比. ② 区间大小所体现的是估计的精确性,区间越大,精确 性程度越低,区间越小精确性越高,二者成反比.
信度高低反映的则是这种估计可靠性或把握性的问题. 区间估计的结果通常可以采取下述方式来表述:我
们有95%的把握认为,全市职工的月收入在750元至850 元之间,或者“全市人口中,女性占50%至52%的可能性为 99%.
区间估计中的可靠性或把握性是指用 某个区间去估计总体参数值时,成功的可能 性有多大.
③ 从精确性出发,要求所估计的区间越 小越好,从把握性出发,要求所估计的区间越大 越好,因此人们总是需要在这二者之间进行平 衡和选择.
在社会统计中,常用的置信度分别为90%, 95%和99%.与他们所对应的允许误差(α)分别 为10%,5%和1%.在计算中,置信度常用1- α来 表示.
以下我们分别介绍总体均值,和总体百分 比的区间估计方法