第四讲 多元回归分析:推断
H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
双侧检验与单侧检验
1.
2.
备择假设没有特定的方向性 ,并含有符号 “ ”的假设检验,称为双侧检验或双尾检 验(two-tailed test) 备择假设具有特定的方向性 ,并含有符号 “ >” 或“ <” 的假设检验,称为单侧检验或单 尾检验(one-tailed test)
显著性水平
(significant level)
1.事先确定的用于拒绝原假设H0时所必须的证据 2.能够容忍的犯第Ⅰ类错误的最大概率(上限值)
3.原假设为真时,拒绝原假设的概率
抽样分布的拒绝域 常用的 值有0.01, 0.05, 0.10
4. 表示为 (alpha)
5. 由研究者事先确定
计量经济学导论
3
正常人的平均体温是37oC吗?
当问起健康的 成年人体温是 多少时,多数 人的回答是 37oC,这似乎 已经成了一种 共识。下面是 一个研究人员 测量的 50 个健 康成年人的体 温数据
37.1
36.9
36.9
37.1
36.4
36.9 37.6 36.1 37.1 37.0 36.6 36.1 36.7 36.8
36.6 36.7 37.1 36.2 36.7 37.2 37.1 37.2 37.0
36.2 37.3 36.6 36.3 36.9 36.4 37.0 36.3 37.0
36.7 36.9 36.5 37.5 37.0 36.6 36.6 37.1 36.1
36.9 36.4 36.7 36.9 37.1 37.3 36.9 36.7 37.0
和的关系
成反方向 变动
你能同时减少犯 两种错误的概率吗?
20
增大样本容量
第一类错误就是拒真错误,为了降低第一类错误的概率,就要尽 可能的做接受的推断,随之带来的就是可能把假的也当成真的接 受了,这就导致纳伪错误的增加,即增加第二类错误发生的概率。 样本容量固定的前提下,两类错误的概率不能同时减少。 为了同时减少两类错误的概率就得增加样本容量。
犯第I类错误的风险机会是由决策者事先指定的,通常取 为0.10,0.05或0.01。指定了α ,再加上事实上参数真值早已 固定这一前提,就相应地确定了β值。在样本容量一定时, 减少某一类错误的概率必然增大另一类错误的概率。在具体
的问题上,可以视两类错误的危害性,加以权衡,指定适当
的值。如欲同时减小两种风险,就只有增大样本容量。
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
用P 值决策
(P-value)
1.
如果原假设为真,所得到的样本结果会像实际 观测结果那么极端或更极端的概率
•
P值告诉我们:如果原假设是正确的话,我们得到 得到目前这个样本数据的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
正常人的平均体温是37oC吗?
根据样本数据计算的平均值是 36.8oC ,标准差 为0.36oC 根据参数估计方法得到的健康成年人平均体温的 95%的置信区间为 (36.7 , 36.9) 。研究人员发现 这个区间内并没有包括37oC 因此提出“不应该再把 37oC 作为正常人体温的 一个有任何特定意义的概念” 我们应该放弃“正常人的平均体温是 37oC” 这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
Region of Rejection
置信水平
Region of Rejection
拒绝H0
拒绝H0
/2
1-
Region of Nonrejection
/2
临界值
2008年8月
H0
临界值
用统计量决策
(左侧检验 )
抽样分布
Region of Rejection
置信水平
拒绝H0
1-
Region of Nonrejection
提出假设
(结论与建议)
1.
原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2.
先确定备择假设,再确定原假设
3.
4.
等号“=”总是放在原假设上
因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
怎样做出决策?
两类错误与显著性水平
1.
2.
3.
研究者总是希望能做出正确的决策,但由于决策是建立 在样本信息的基础之上,而样本又是随机的,因而就有 可能犯错误 原假设和备择假设不能同时成立,决策的结果要么拒绝 H0,要么不拒绝H0。决策时总是希望当原假设正确时没 有拒绝它,当原假设不正确时拒绝它,但实际上很难保 证不犯错误 第Ⅰ类错误(错误)-“弃真错误”
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
备择假设
(alternative hypothesis)
1.
2.
3.
4.
也称“研究假设”,研究者想收集证据予以支持的 假设,用H1或Ha表示 所表达的含义是总体参数发生了变化或变量之间 有某种关系 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设 总是有符号 , 或
ቤተ መጻሕፍቲ ባይዱ
依据什么做出决策?
1.
2. 3.
若假设为H0:=500,H1:≠ 500。样本均值 为 495 ,拒绝 H0 吗?样本均值为 502 ,拒绝 H0 吗? 做出拒绝或不拒绝原假设的依据是什么? 传统上,做出决策所依据的是样本统计量,现 代检验中人们直接使用由统计量算出的犯第Ⅰ 类错误的概率,即所谓的 值
检验统计量
(test statistic)
1.
根据样本观测结果计算出对原假设和备择假设 做出决策某个样本统计量 对样本估计量的标准化结果
2.
原假设H0为真
点估计量的抽样分布
3. 标准化的检验统计量
点估计量 — 假设值 标准化检验统计量 点估计量的抽样标准差
用统计量决策
(双侧检验 )
抽样分布
多元回归分析:推断
y = 0 + 1x1 + 2x2 + . . . kxk + u
计量经济学导论
1
统计名言 ……正如一个法庭宣告某一判决 为“无罪(not guilty)”而不为“清白 (innocent)”,统计检验的结论也应 为“不拒绝”而不为“接受”。
——Jan Kmenta
一、假设检验的回归
2008年8月
提出假设
(例题分析)
【例】一种零件的生产标准是直径应为 10cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于 10cm, 则表明生产过程不正常,必须进行调整。试陈述用 来检验生产过程是否正常的原假设和被择假设
假设检验的基本原理
怎样提出假设?
什么是假设?
(hypothesis)
在参数检验中,对总体参数的具体数值所作
的陈述
就一个总体而言,总体参数包括总体均值、比例、 方差等 分析之前必需陈述
什么是假设检验?
(hypothesis test)
1.
2.
3.
先对总体的参数(或分布形式)提出某种假设,然 后利用样本信息判断假设是否成立的统计方法 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理
3.
P值越小,你拒绝原假设的理由就越充分
多大的P 值合适?
要证明原假设不正确,P值要多小,才能令人 信服呢?
原假设的可信度又多高?如果H0所代表的假设 是人们多年来一直相信的,就需要很强的证据( 小的P值)才能说服他们 拒绝的结论是什么?如果拒绝H0而肯定H1 ,你 就需要有很强的证据显示要支持 H1。比如,H1 代表要花很多钱把产品包装改换成另一种包装 ,你就要有很强的证据显示新包装一定会增加 销售量(因为拒绝H0要花很高的成本)
提出假设
(例题分析)
【例】一家研究机构估计,某城市中家庭拥有汽 车的比例超过 30% 。为验证这一估计是否正确, 该研究机构随机抽取了一个样本进行检验。试陈 述用于检验的原假设与备择假设。 解:研究者想收集证据予以支持的假设是“该 城市中家庭拥有汽车的比例超过30%”。建立的 原假设和备择假设为 H0 : 30% H1 : 30%
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值
计算出的样本统计量
2008年8月
0
临界值
Z
计算出的样本统计量
左侧检验的P 值
拒绝H0
1/2P 值
临界值
计算出的样本统计量
2008年8月
0
Z
右侧检验的P 值
拒绝H0
1/2P 值
0
临界值
Z
计算出的样本统计量
2008年8月
P值是关于数据的概率
2. 3.
被称为观察到的(或实测的)显著性水平 决策规则:若p值<, 拒绝 H0
在双尾检验中,
P值 P[| Z || X0
__
|] 2 P[ Z
X0
__
n
] 2 P[ Z