浙江大学统计学假设检验
可以想象如果一个事件发生的概率很小,那么在只进 行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识就可以知道,这句话在大多数情况下是 正确的,但是它一定有犯错误的时候,因为发生的概 率再小也总是有可能发生的。这就是小概率原理。
例如现在买体育彩票中特等奖的概率是千万分之一左 右,如果你只买 1注,你是得不到特等奖的,这句话在 绝大多数情况下是正确的,但是它一定有犯错误的时 候,因为确实有人中了特等奖。
例5-1 已知一般中学男生的心率平均值为 74次/分 钟,标准差 6次/分钟,为了研究经常参加体育锻炼的 中学生心脏功能是否增强,在某地区中学中随机抽取常 年参加体育锻炼的男生 100名,得到心率平均值 65次/ 分钟。
这是一个未知总体与已知总体均数比较的问题。在 这个例子中我们把中学一般男生作为一个已知总体,该 总体心率的均数μ 0=74次/分钟,标准差σ= 6次/分。 将常年参加体育锻炼的中学男生作为一个未知总体,通 过随机抽样,得到该总体心率的均数μ的估计值 X =65 次/分钟,样本量 n=100。试问:常年参加体育锻炼 的中学男生心率是否与一般中学男生相等?
按照假设检验的思想用双侧检验对例 5-l提出的问题进行假设检验。
无效假设 H0:常年参加体育锻炼的中学男生的心率与一般的中学男 生相等,即μ=μ 0。
备择假设 H1:常年参加体育锻炼的中学男生的心率与一般的中学男 生不同,即μ≠μ 0。
将检验水准确定为α= 0.05。
由于在无效假设的前提下,可以认为样本是来自μ 0=74次/分钟, 标准差σ= 6次/分的总体。此时构造统计量 u:
第五章 假设检验
假设检验是统计学中最重要的概念之一,是统计 推断的核心,因此正确地理解假设检验的思想,掌 握假设检验的方法与步骤,对统计学的学习和应用 具有十分重要的意义。
第一节 假设检验的基本思想
一、小概率事件与假设检验
为了研究某一特定总体的特征, 个体是无限多的,由于人力、物力和时间等因素的限制,在 绝大多数的情况下,研究者没有能力和必要对总体中的每一 个体进行测量,只能用随机抽样的方法,得到一个能够很好 地代表总体的样本,通过对样本指标的测量,以样本的特征 来推断总体的参数。由于这种估计存在抽样误差,可以根据 抽样误差的分布规律对抽样误差的大小进行估计。
样本是否属小概率事件,若属小概率事件,则拒绝该假设;若
不属小概率事件,则不拒绝该假设。关于μ与μ 0是否相等的研 究中,首先假设μ=μ 0,然后看在μ=μ 0的情况下实际观察到的 样本的情况是否属小概率事件。
先前的假设即:这个样本是从均数为μ 0的总体中抽出来的(μ =μ0)称为无效假设( null hypothesis )用H0表示,将 μ≠μ0称为备择假设( alternative hypothesis )用H1表示, 其意义是当无效假设 H0被拒绝后,应该接受的假设,所以称为备 择假设或对立假设。
二、单、双侧检验
通常假设检验的目的是两总体是否相等,备择假设是 μ≠μ0,即μ可以大于μ 0,也可以小于μ 0,因此是双 侧检验。但是如果你从专业知识的角度判断μ不可能大 于μ0(或者是μ不可能小于μ 0),这就是单侧的检验, 此时备择假设为μ<μ 0(或者是μ>μ0)。
例如:要比较经常参加体育锻炼的中学男生心率是否 低于一般中学男生的心率,就属于单侧检验。因为根据 医学知识知道不会高于一般中学男生,因此在进行假设 检验时,应使用单侧检验。即 H0:μ=μ0经常参加体育 锻炼的中学男生心率与一般中学男生的心率相同, H1: μ<μ0。经常参加体育锻炼的中学男生心率低于一般中 学男生的心率。
估计值X 。因此X 与μ0之间的差异(不相等)应有两种可能: 1.μ与μ0本身就不相等,所以导致了 X与μ0之间的差异; 2.μ与μ0相等仅因为用 X 去估计μ时存在抽样误差,所
以导致了 X 与μ0之间的差异。
因为均数有抽样误差,故当观察到样本均数 不X等于μ 0时,不
能下结论μ≠μ 0,到底μ与μ 0是否相等,需作统计推断。
在统计学中约定,如果一个事件发生的概率P≤0.05 就把这个事件称之为小概率事件。
既然有两种可能造成 X与μ0之间的差异,无法确定μ是否等
于μ0,但是我们已经知道如果是采用随机抽样的方法得到的样 本,那么抽样误差的分布是存在一定规律的。假设检验的基本
思想是:先提出假设,然后在假设成立的前提下看实际拍到的
u ? X ? ?0
(5 ? 1)
在无效假设成? 立/ 的n情况下, u服从标准正态分布 N(0,1),|
u|≥u0.05/2=1.96的概率为 0.05,故一次随机抽样“ |μ|≥1.96 ”属 于小概率事件,若实际样本出现“ |μ|≥1.96 ”则拒绝 H0。
(level of significance ),常取 α=0.05;将接受了错误
的无效假设 H0称为Ⅱ类错误(type Ⅱ error)。犯Ⅱ类错误的 概率用β表示。在统计学中将 l-β称为检验效能( power of
test),其意义是当两个总体存在差异时(即备择假设 Hc: μ≠μ 0成立时),所使用的统计检验能够发现这种差异(拒绝 无效假设 H0:μ=μ0)的能力,通常检验效能应该达到 0.8左右。
三、两类错误
尽管假设检验帮助我们回答了μ与μ 0是否相等的问题,但它是 建立在小概率原理上的判断,无论接受无效假设 H0、拒绝备择 假设 H1,还是接受备择假设 H1、拒绝无效假设 H0都有可能犯错 误。统计学中将拒绝了正确的无效假设 H0称为Ⅰ类错误( type Ⅰerror),犯Ⅰ类错误的概率用α表示,通常称之为检验水准
当要用抽样的方法研究一个未知总体的均数μ是否和一个已
知总体的均数μ 0相等时,通常是从未知总体中随机抽取一个样 本,对样本中的每一个体进行测量,得到相应的测量值( X1,
X2,…,Xn),并计算出样本的均数 X ,可以用样本的均数 X
去估计未知总体的均数μ。此时要比较的是μ与μ 0是否相等, 但是由于μ是“无法”得到的,只能通过抽样的样本得到μ的