当前位置:文档之家› 第六章 假设检验 第一节 假设检验的基本逻辑

第六章 假设检验 第一节 假设检验的基本逻辑




1、该矿区的自然社会条件并不影响新生儿发育,矿 区新生儿总体的头围均值μ 1与一般新生儿(总体) 头围均值μ 0相等( μ 1 = μ 0 ),样本均值与总体 均值的差异来源于抽样误差,也就是说我们抽到了 一个头围偏小的样本,由此造成的差异不具有显著 性(significance),即没有统计学意义。 2、差异不仅仅由抽样误差造成,矿区新生儿总体头 围均值小于一般新生儿总体头围均值( μ 1 < μ 0 ),这种差异被认为具有显著性,亦即有统计 学意义。 在这两者之间如何抉择呢?关键在于两个均值的 差异能否用抽样误差来解释。
处理组 68 对照组 65
65 66 67 62 64 65
66 64
66 59
64 63
69 65
63 58
66 65
第四节 大样本比例的假设检验
当n较大,且比例不接近于0和1时,大样本比
例(或百分率)的比较可采用z检验。具体应 用条件如下: n较大,且每组例数都大于60; 样本比例p和1-p都不接近于100%和0; np和n(1-p)均大于5。

二、成立假设:
在统计学里,上述问题是用反证法的方式来解 决的,首先假设差异可由抽样误差解释,两总体均 值相等,然后再来分析在μ 1 = μ 0的总体中随机抽 样,得到头围均值小到Xbar=33.89这个程度的可能 性有多大。如果这个可能性很小,则拒绝这一假设, 而采纳相反的假设。
所以,我们首先要成立两个相互对立的假设: 虚无假设H0和备择假设H1。虚无假设(null hypothesis,或译为无效假设,)主张,差异可以 由抽样误差来解释,也就是说差异在总体中不存在 或无效。备择假设与虚无假设对立,主张样本数据 表现出的差异来源于总体差异。在假设检验中,直 接检验的是虚无假设,所以虚无假设又称检验假设 (hypothesis to be tested)。 在本例中,我们可成立如下假设: H0: μ 1 = μ 0 H1: μ 1 < μ 0
一、单样本比例的z检验
比例是均值的一种特殊情况,对比例进行 检验,其思想是将属性数据转化为(二分变 量),然后对其均值进行检验。 对某高校随机抽样n=200的样本,根据样本计 算出学生中城市户口为40%。问该高校城市户 口学生比例是否高于35%。(显著性水平为 0.05) P Q 40% 35%
练习: 有趣的环境是否会对脑发育产生影响呢?美国 某生物学家对老鼠进行了实验。他随机抽出10窝新 出生的老鼠,每窝中分别随机抽取出1只到处理组, 1只到对照组。两组老鼠所受待遇相同,所不同的只 是处理组的老鼠都住在一个笼子里,还放了许多好 玩的东西;而对照组的老鼠却用隔板分开,也没有 什么玩具。一个月后,取出每只老鼠的脑皮质,各 窝中10对老鼠脑皮质重量如下表(单位:厘克):

四、计算概率值(p值),做出决策。 在这个情况下,我们是否接受无效假设H0呢? 我们先计算在H0成立的条件下,抽到头围均值小到 Xbar=33.89这个程度的样本的可能性。 查表可知,p(z<-2.273)=0.0116。 这样,如果接受H0,则说明我们抽到了一个均 值严重偏小的样本,抽到这么偏的样本的可能性只 有1.16%。
决策的风险 两种选择: 1、接受H0,我们的运气太差,抽到了一个很偏 的样本; 2、拒绝H0,犯错误的概率为1.16%。

P值的含义 在本例中,p=0.0116意味着在H0条件下,抽到 如此偏小的样本的可能性只有0.0116。 一般来说, 1、概值意味着在H0条件下,抽到比实有样本更偏的样 本的可能性; 2、或者表述为,p值意味着样本数据对虚无假设的支 持程度(或两者之间的一致性程度); 3、在假设检验过程中,如果p值较小,我们拒绝H0,p 就是我们要冒的风险。
第三节 均值比较的Z检验
两个均值的比较
这里讨论的是从两个总体中分别抽取随机样 本,通过对样本数据的分析来推断总体均值 差异的方法,亦即两个均值差异的比较问题。 多均值比较在方差分析中另行介绍。
基本思路:
设两总体均值分别为U1和U2,成立虚无假 设H0:U1-U2=0,或U1=U2;在H0条件下,两样 本是从总体中随机抽取的,其均值差异X1-X2 可以等于零,也可以不等于零,是一个围绕 零值波动的随机分布。 统计研究表明,样本均值差值X1-X2服从于 均值为0,标准差为SE的正态分布。其中X1X2的方差正好是X1和X2的方差之和。 故两样本均值Z检验的统计量计算公式为: Z= X1-X2/SE。
第六章 假设检验
X 1 n X Xi n i 1
第一节 假设检验的基本逻辑
例:通过以往大规模调查,已知某地新生儿头围均 值为34.50cm,标准差为1.99cm。为研究该地某矿区 新生儿发育状况,从该矿区随机抽取新生儿55人, 测得其头围均值为33.89cm。问该矿区新生儿头围均 值是否小于一般新生儿头围均值? 一、分析差异来源 根据题意, Xbar =33.89, μ 0=34.50,两者差 值为0.61cm。该差异来源有两种可能性:
Байду номын сангаас

三、在H0条件下计算检验统计量。 如果H0成立,根据中心极限定理,均值的抽样 分布服从正态分布,从研究总体中随机抽取样本量 为55的样本,其均值会落在正态曲线横轴的任一位 置,但大多数会落在总体均值μ 1 = μ 0附近,远离 中心点的可能性较小。样本均值偏离中心点的距离 可由其标准值来衡量。
本例中,n=55,σ =1.99,在H0: μ 1 =34.50条件下,将观测值Xbar标准化,即 Xbar=33.89与中心点之间的距离(以标准差 为单位来衡量)为: z=(33.89-34.50)/(1.99/n1/2 )=-2.273 由此可见Xbar=33.89落在距中心点较远的 位置。


结论: P值反映了拒绝原假设时所犯错误的可能 性,在进行假设检验时,我们通常要设定一 个我们所能接受的犯这种错误的风险水平α 值 ,称为检验水准或显著性水平。 p<α ,拒绝原假设; p>α ,不拒绝原假设。
第二节 进一步的讨论
一、检验的方向
二、两类错误 三、假设检验的统计意义
x
相关主题