当前位置：文档之家› 第四讲多元回归分析：推断

第四讲多元回归分析：推断

H1 ：某一数值 H1 ：某一数值 H1 ： <某一数值
双侧检验与单侧检验
1.
2.
备择假设没有特定的方向性，并含有符号 “ ”的假设检验，称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性，并含有符号 “ >” 或“ <” 的假设检验，称为单侧检验或单尾检验(one-tailed test)
显著性水平
(significant level)
1.事先确定的用于拒绝原假设H0时所必须的证据 2.能够容忍的犯第Ⅰ类错误的最大概率(上限值)
3.原假设为真时，拒绝原假设的概率

抽样分布的拒绝域常用的值有0.01, 0.05, 0.10
4. 表示为 (alpha)

5. 由研究者事先确定
计量经济学导论
3
正常人的平均体温是37oC吗？

当问起健康的成年人体温是多少时，多数人的回答是 37oC，这似乎已经成了一种共识。下面是一个研究人员测量的 50 个健康成年人的体温数据
37.1
36.9
36.9
37.1
36.4
36.9 37.6 36.1 37.1 37.0 36.6 36.1 36.7 36.8
36.6 36.7 37.1 36.2 36.7 37.2 37.1 37.2 37.0
36.2 37.3 36.6 36.3 36.9 36.4 37.0 36.3 37.0
36.7 36.9 36.5 37.5 37.0 36.6 36.6 37.1 36.1
36.9 36.4 36.7 36.9 37.1 37.3 36.9 36.7 37.0
和的关系
成反方向变动
你能同时减少犯两种错误的概率吗？

20
增大样本容量
第一类错误就是拒真错误，为了降低第一类错误的概率，就要尽可能的做接受的推断，随之带来的就是可能把假的也当成真的接受了，这就导致纳伪错误的增加，即增加第二类错误发生的概率。样本容量固定的前提下，两类错误的概率不能同时减少。为了同时减少两类错误的概率就得增加样本容量。
犯第I类错误的风险机会是由决策者事先指定的，通常取为0.10，0.05或0.01。指定了α ，再加上事实上参数真值早已固定这一前提，就相应地确定了β值。在样本容量一定时，减少某一类错误的概率必然增大另一类错误的概率。在具体
的问题上，可以视两类错误的危害性，加以权衡，指定适当
的值。如欲同时减小两种风险，就只有增大样本容量。

双侧检验：I统计量I > 临界值，拒绝H0 左侧检验：统计量 < -临界值，拒绝H0 右侧检验：统计量 > 临界值，拒绝H0
用P 值决策
(P-value)
1.
如果原假设为真，所得到的样本结果会像实际观测结果那么极端或更极端的概率
•
P值告诉我们：如果原假设是正确的话，我们得到得到目前这个样本数据的可能性有多大，如果这个可能性很小，就应该拒绝原假设
正常人的平均体温是37oC吗？

根据样本数据计算的平均值是 36.8oC ，标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的 95%的置信区间为 (36.7 ， 36.9) 。研究人员发现这个区间内并没有包括37oC 因此提出“不应该再把 37oC 作为正常人体温的一个有任何特定意义的概念” 我们应该放弃“正常人的平均体温是 37oC” 这个共识吗？本章的内容就将提供一套标准统计程序来检验这样的观点
Region of Rejection
置信水平
Region of Rejection
拒绝H0
拒绝H0
/2
1-
Region of Nonrejection
/2
临界值
2008年8月
H0
临界值
用统计量决策
(左侧检验 )
抽样分布
Region of Rejection
置信水平
拒绝H0

1-
Region of Nonrejection
提出假设
(结论与建议)
1.
原假设和备择假设是一个完备事件组，而且相互对立

在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立
2.
先确定备择假设，再确定原假设
3.
4.
等号“=”总是放在原假设上
因研究目的不同，对同一问题可能提出不同的假设(也可能得出不同的结论)
怎样做出决策？
两类错误与显著性水平
1.
2.
3.
研究者总是希望能做出正确的决策，但由于决策是建立在样本信息的基础之上，而样本又是随机的，因而就有可能犯错误原假设和备择假设不能同时成立，决策的结果要么拒绝 H0，要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它，当原假设不正确时拒绝它，但实际上很难保证不犯错误第Ⅰ类错误(错误)-“弃真错误”

H0 ： = 某一数值 H0 ：某一数值 H0 ：某一数值

例如, H0 ： 10cm
备择假设
(alternative hypothesis)
1.
2.
3.
4.
也称“研究假设”,研究者想收集证据予以支持的假设，用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法，然后就是想办法收集证据拒绝原假设，以支持备择假设总是有符号 , 或
ቤተ መጻሕፍቲ ባይዱ
依据什么做出决策？
1.
2. 3.
若假设为H0：=500，H1：≠ 500。样本均值为 495 ，拒绝 H0 吗？样本均值为 502 ，拒绝 H0 吗？做出拒绝或不拒绝原假设的依据是什么？传统上，做出决策所依据的是样本统计量，现代检验中人们直接使用由统计量算出的犯第Ⅰ 类错误的概率，即所谓的值
检验统计量
(test statistic)
1.
根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量对样本估计量的标准化结果

2.
原假设H0为真

点估计量的抽样分布
3. 标准化的检验统计量
点估计量 — 假设值标准化检验统计量点估计量的抽样标准差
用统计量决策
(双侧检验 )
抽样分布
多元回归分析：推断
y = 0 + 1x1 + 2x2 + . . . kxk + u
计量经济学导论
1
统计名言 ……正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白 (innocent)”，统计检验的结论也应为“不拒绝”而不为“接受”。
——Jan Kmenta
一、假设检验的回归
2008年8月
提出假设
(例题分析)

【例】一种零件的生产标准是直径应为 10cm，为对生产过程进行控制，质量监测人员定期对一台加工机床检查，确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于 10cm，则表明生产过程不正常，必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设
假设检验的基本原理
怎样提出假设？
什么是假设?
(hypothesis)
在参数检验中，对总体参数的具体数值所作
的陈述

就一个总体而言，总体参数包括总体均值、比例、方差等分析之前必需陈述

什么是假设检验?
(hypothesis test)
1.
2.
3.
先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法，统计上依据小概率原理
3.
P值越小，你拒绝原假设的理由就越充分
多大的P 值合适?

要证明原假设不正确，P值要多小，才能令人信服呢？

原假设的可信度又多高？如果H0所代表的假设是人们多年来一直相信的，就需要很强的证据( 小的P值)才能说服他们拒绝的结论是什么？如果拒绝H0而肯定H1 ，你就需要有很强的证据显示要支持 H1。比如，H1 代表要花很多钱把产品包装改换成另一种包装，你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)
提出假设
(例题分析)

【例】一家研究机构估计，某城市中家庭拥有汽车的比例超过 30% 。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。解：研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为 H0 ： 30% H1 ： 30%
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值
计算出的样本统计量
2008年8月
0
临界值
Z
计算出的样本统计量
左侧检验的P 值

拒绝H0
1/2P 值
临界值
计算出的样本统计量
2008年8月
0
Z
右侧检验的P 值

拒绝H0
1/2P 值
0
临界值
Z
计算出的样本统计量
2008年8月
P值是关于数据的概率
2. 3.
被称为观察到的(或实测的)显著性水平决策规则：若p值<, 拒绝 H0
在双尾检验中，
P值 P[| Z || X0
__

|] 2 P[ Z
X0
__
n

] 2 P[ Z

e商务文档

第四讲多元回归分析：推断

相关文档推荐：

e商务文档

第四讲 多元回归分析：推断

相关文档推荐：

第四讲多元回归分析：推断