当前位置:文档之家› 回归模型的统计检验 - 第三节回归模型的统计检验

回归模型的统计检验 - 第三节回归模型的统计检验


注意的问题



判定系数只是说明列入模型的所有解释变量对被 解释变量的联合的影响程度,不说明模型中每个 解释变量的影响程度(在多元中) 回归的主要目的如果是经济结构分析,不能只追 求高的判定系数,而是要得到总体回归系数可信 的估计量。判定系数高并不一定每个回归系数都 可信。 如果建模的目的只是为了预测被解释变量值,不 是为了正确估计回归系数,一般可考虑有较高的 判定系数。
判定系数与相关系数的关系
联系:数值上判定系数是相关系数的平方。 区别: ⑴前者就模型而言,后者就两个变量而言。 ⑵前者说明解释变量对被解释变量的解释程度, 后者说明两变量线性依存程度。 ⑶前者度量的不对称的因果关系,后者度量的不 含因果关系的对称相关关系。 ⑷前者取值[0,1]非负,后者取值[-1,1],可正可 负。
2 2 2 ˆ ˆ y y y y y y i i i i
y
yi
ei
yi y
ˆi y y
SRF
y
xi
x
TSS ( yi y ) 2 ˆi y )2 ESS ( y ˆi )2 RSS ( yi y
2
补充:关于假设检验(在进行F/T统计检 验之前)




假设检验是统计推断的一个主要内容,它的基本任务是根 据样本所提供的信息,对未知总体分布的某些方面的假设 作出合理的判断。 假设检验的程序是,先根据实际问题的要求提出一个论断, 称为统计假设;然后根据样本的有关信息,对假设的真伪 进行判断,作出拒绝或接受假设的决策。 假设检验的前提是知道所估计的样本回归系数概率分布性 质,即对总体回归系数某种原假设成立时。 假设检验的基本思想是概率性质的反证法。 概率性质的反证法的根据是小概率事件原理,该原理认为 “小概率事件在一次试验中几乎是不可能发生的,如果该小 概率事件竟然发生了,就认为原假设不正确,而拒绝原假 设,不拒绝备则假设”。 下面讲授的模型的显著性检验及解释变量的显著性检验都 基于此基础。

案例2.4

p45
⒈总变差的分解
设估计的多元线性回归模型为:
ˆ ˆ x ˆ x ˆ x e yi 0 1 1i 2 2i k ki i
分析Y的观测值、估计值和平均值的关系
ˆi y yi y ˆi yi y y
因为 yi y 0 ,将上式两边平方加总,可 证得
H 0 : 1 2 , k 0
即模型线性关系不成立。备择假设为: H1 : 1, 2 ,, k 不全为零
对于一元线性回归模型,假设为: H 0 : 1 0 H1 : 1 0 然后根据样本观测值和估计值,计算 F 统计量 的数值:
F ESS RSS k
Yi 由于Yi 服从正态分布,根据数理统计学中的定义, 的一
组样本的平方和服从 2 分布。所以有:
2 ˆ Y )2 ESS (Y i ~ (k )
2 ˆ )2 RSS (Yi Y i ~ ( n k 1)
即回归平方和、 残差平方和分别服从自由度为k

2

( n k 1)
ห้องสมุดไป่ตู้
对于一元回归模型,
S ˆ
1
误差项方差的估计量, 对于二元回归模型,
ˆ2

2 ˆ x ,其中 为随机
2 i
ˆ2
ˆ Yi Y i
n k 1
y
2
2 i
n2
ˆ 2 x2 1 i
ˆ ) SE ( 1 ˆ ) SE ( 2
x x x x x ˆ x x x x
t 如果
t ) (n k 1 < 2 ,则在(1-α )的置
信概率下接受原假设 H0,表明在(1-α ) 的置信概率下,与 0 没有什麽差别, 即变量 Xi 对被解释变量的影响是不显著 的。
用P值判定参数的显著性
假设检验的p值 p值是根据既定的样本数据所计算的统计量,拒绝原 假设的最小显著性水平。 统计软件中(EViews,SPSS,SAS)通常都给出了检验的 p值。 方法:将给定的的显著性水平与p值比较: 若>p, 则在显著性水平下拒绝原假设H0,即认为X对Y 有显著影响。 若<=p, 则在显著性水平下接受原假设H0,即认为X对 Y没有显著影响。 规则:当p< 时,p值越小,越能拒绝原假设H0。
i
标准差。
2 ˆ
n k 1 2 2 2 ˆ e y y i i i
2 2 2 2 2 ˆ ˆ ˆ yi 1 x1i 2 x2i
2 e
计算出 t 统计量后,要选定一个显著性水平 , 结合自由度 (n k 1) ,由 t 分布表(见书后附表) ,
第三节 回归模型的统计检验



对于样本回归模型拟合总体模型,我们通常要进 行经济检验、统计检验、计量检验等。 统计检验则是在一定概率下求出参数,检验样本 对总体的代表性、影响关系是否显著等问题。主 要通过一些统计检验方法来保证模型在统计意义 上(即以样本推断总体)的可靠性。 我们所要进行的统计检验包括两方面,一方面检 验回归方程对样本数据的拟合程度,通过可决系 数;另一方面检验回归方程的显著性,通过假设 检验对模型中被解释变量与解释变量之间的线性 关系在总体上是否显著成立作出判断,包括对回 归方程线性关系的检验和对回归系数显著性的检 验。

分布。
进一步根据数理统计学中的定义,如果构造一个统计量
ESS F RSS k
(n k 1)
则该统计量服从自由度为(k,n-k-1)的F分布。
2、方程显著性 F 检验的步骤
对回归方程线性关系显著性的检验采用 F 检验,检验 依据样本估计的回归方程所体现的被解释变量与解释 变量之间的线性关系在总体上是否显著成立, 即是检验 总体模型 Yi 0 1 X 1i 2 X 2i k X ki i i=1,2,…,n 中的参数是否显著不为 0。 按照假设检验的原理与程序, 首先提出假设,原假设为:
在应用过程中我们会发现,如果在模型中增加一 个解释变量,模型的解释功能增强了,可决系数 R 2 计
2 ˆ y y 算公式中的分子——回归平方和 i 就会增大,
因而 R 就增大。这就给人一种错觉:似乎要使模型拟 合得好,就必须增加解释变量。但是,在样本容量一 定的情况下,增加解释变量必定使得自由度减少。所 以,用以检验拟合优度的统计量必须能够防止这种倾 2 2 R R 向,我们可以用自由度来调整 ,用 来表示调整 后的可决系数,以剔除解释变量数目与样本容量的影 响,使具有不同样本容量和解释变量数目的回归方程 可以进行拟合优度的比较。
F检验与R2的关系

根据二者关系,有需注意的几个问题: ⑴F检验实际上也是判定系数的显著性检验。 ⑵如果模型对样本有较高的拟合优度,F检 验一般都能通过。 ⑶实际应用中不必过分苛求R2值的大小, 重要的是考察模型的经济意义是否合理。
如果所计算的 F > F ( k , n k 1) ,则在(1- ) 的置信概率下拒绝原假设 H 0 , 即模型的线性关系显 著成立,模型通过方程显著性检验。如果所计算的
2、拟合优度检验统计量:可决系数(判
定系数)R2和校正可决系数 R2
(1)可决系数
2 R 用可决系数 进行拟合优度检验,可决系
数的计算公式为:
2 ˆ y y R2 i 2 y y i
0 R 2 1 ,该统计量越接近于 1,模型
的拟合优度越高。
判定系数不仅反映了模型拟合程度的优劣,而且有 直观的经济含义:它定量地描述了y的变化中可以 用回归模型来说明的部分,即在被解释变量的变动 中,由模型中解释变量所引起的比例。 见前一节例题,解释意义 判定系数的特点: ⑴判定系数取值范围[0,1]。 ⑵随抽样波动,样本判定系数是随抽样而变动的随 机变量。 ⑶判定系数是非负的统计量。
t ( n k 1) 查得临界值 。
2
t ( n k 1 ) t t 如果计算出的 统计量的绝对值 > ,

2
则在(1-)的置信概率下拒绝原假设 H 0 。表
ˆ 明在(1-)的置信概率下, i 不是由 i 0 这样的
总体产生的,i 显著地不为 0,即变量X i 对被 解释变量的影响是显著的;
一、模型的拟合优度检验
所谓拟合优度,即模型对样本数据的近似 程度。由于实际观察得到的样本数据是对 客观事实的一种真实反映,因此,模型至 少应该能较好的描述这一部分客观实际情 况。为了考察模型的拟合优度,需要构造 一个指标——判定系数(可决系数)。 认识判定系数之前让我们回顾一下关于样 本与总体回归函数,了解总离差分解。
F < F ( k , n k 1) ,则在(1- )的置信概率下接受
原假设 H 0 ,即模型的线性关系显著不成立,模型未 通过方程显著性检验。
见书例题
三、解释变量的显著性检验

解释变量显著性检验即对回归系数的显著性 进行检验,如果变量是显著的,那么回归系 数应该显著地不为0。于是,在变量显著性 检验中设计的原假设为: H0:i=0 而备择假设为: H1: i0 其中 的下角标i,在一元回归模型中取值1: 在二元回归模型中取值1、2。
2
( n k 1)
ˆi y / k y 2 ˆ y y i i / n k 1
R /k F 2 1 R / n k 1
2


k 为模型中解释变量的个数, R 2 为判定系数, 其中,
n 为样本容量。
F 统计量服从自由度为 ( k , n k 1) 的 F 分布。选定 一个显著性水平 ,查 F 分布表(见本书附录) , 可以得到一个临界值 F ( k , n k 1) 。
相关主题