当前位置:文档之家› 一元线性回归预测

一元线性回归预测


系数检验表,查表明取自由度,得到相关系数临界值。
(3)进行判别。
当时,与在显著水平下显著相关,检验通过。
当时,与线性关系不显著。
3.检验
检验用来检验与之间是否存在显著的线性统计关系。如果检验结果
是否定的,即与之间不存在显著的线性统计关系,那么,所建立的回归
预测模型无效,不能用来进行预测。的计算公式为
从式(2-9)可以看到反映了回归预测模型所得的估计值与实际值的
平均误差,所以希望的值越小越好。一般要求
(2-11)
2.相关系数检验
相关系数,用来检验两个变量之间的线性相关的显著程度,其计算
公式为
(2-12)

(2-13)
此外,的另一种算法为
Hale Waihona Puke (2-14)数学上可以证明(2-12)式或(2-13)式与(2-14)式是完全等价的。
(2-15)

(2-16)
由式(2-16)可知值与值之间有一定关系,若显著水平已知时,由
表可查得的临界值,可以求出相应的相关系数临界值

(2-17)
和相关系数检验一样,检验也是通过查得临界值,然后进行比较来
进行判断的。其方法如下:
(1)按(2-15)或(2-16)式计算值;
(2)拟定显著性水平(一般取),查检验表,取自由度,得临界
系的。但是,事实上,自变量与因变更的关系并不完全是一条直线,而 只是近似一条直线。
但是怎样的直线才能最好地反映了与的关系呢?就是说,是否有一 种方法使所确定的回归系数、是最佳的呢?最常用的方法是最小二乘 法。即参数、的估计,一般采用最小二乘法。
对于预测对象,相关因素,可以收集到对数据: 如果经回归分析得到回归预测模型如式2-1所示,则对于每一个相关 因素的值对应有一个的估计值。 则实际值与估计值一般是不相等的,存在一个偏差,称为估计误差 或残差,用表示。 即 或写成 最小二乘法是以误差平方和最小这一原理来估计系数,从而建立回 归预测模型的。设以表示误差平方和,则有:
科技水平为基础的。此外,有时间序列数据的处理中,因采用内插、平
滑等方法,也会引起序列相关问题。因此,序列相关在回归分析中是经
常遇到的现象。 但是,由于存在序列相关,当采用最小二乘法建立回归预测模型
时,将会使、的估计不再具有最小方差,不再是有效的估计量,将会使 系统检验功能减小,置信区间过宽,使预测失效。因而,必须对回归预 测模型进行序列相关检验,以保证预测结果的有效性。
表2-1 检验判别表

检验结果
否定假设,有负序列相关
否定假设,有正序列相关
接受假设,无序列相关
检验无结论
检验无结论
但是,由于回归预测模型是经过数理统计方法得到,有一定的误 差,因而使预测结果也有一定的误差,即预测结果有一定的波动范围, 这个范围称为置信区间,其计算方法如下:
(1)按式(2-10)或(2-11)计算标准离差。 (2)确定置信区间 在大样本()时,如果取置信度为,则置信区间为
如果
则得

当时,实际值完全落在回归直线上,与有完全的线性关系。
当时,与有一定的线性正相关关系,即随的增加而增加。
当时,与有一定的线性负相关关系,即随的增加而减少。
当时,则说明与之间不存在线性关系,或许是因为两者之间的确没
关系,或是二者之间不存在线性关系,而存在某种其它关系。
由此可以看到,只有当接近于1时,才能用一元线性回归预测模型来
(2-2) 很显然,是参数、的函数,当求最小时,根据微分学中极值原理 有: 即
(2-3) (2-4) 求解上联立方程可得
取 为的平均值, 为的平均值。
代入(2-5),(2-6)式中,并将简写为,则有
按式(2-7)、(2-8)求得的参数所建立的一元线性回归预测模型具有 最小的误差平方和。
二、模型检验
(2-19) 式中是在显著性水平为,自由度为时的统计量,查检验表得到。 在小样本()的情况下,要对标准离差进行修正。对于给定自变量
的值,其修正系数为 则置信区间为
(2-20) (2-21)
型来说。
为随机误差项。回归模型的统计特征有一个假定,即是互不相关
的。如果这个假定不能满足,就称是相关的,即存在序列相关,反之,
是独立的,不存在序列相关。
应该认识到,序列相关是一种常见的现象,如在社会经济系统中,
人口的增加与前一年或几年人口有关,年的投资可能与年的投资有关,
甚至与、年或更早些时的投资有关,科技进步水平的提高也是与以往的
2.1 一元线性回归预测
回归预测在研究社会许多现象之间的定量关系方面有着十分广泛的 应用,一元线性回归预测是最基本的、最简单的预测方法,是掌握其它 回归预测方法的基础。
一、参数估计
一元线性回归预测模型的数学表达式是一元线性方程: (2-1)
式中:——预测对象,因变量或被解释变量; ——影响因素,自变量或解释变量; ——回归系数。 其含意表示事物主要受一个因素的影响,而且这种影响是呈线性关
描述与之间的关系,但在实际预测中,的值不一定十分接受于1,这
样,应该大到什么程度,回归预测模型才有实际意义呢?实际检验中是
通过与临界相关系数。的比较来判断的,这个过程叫相关性检验,其方
法如下:
(1)按式(2-12)、(2-13)或(2-14)计算;
(2)拟定显著性水平,(一般取,即95%的置信度),然后查相关
检验方法如下: (1)计算的值。 统计量定义为
(2-18) (2)拟定显著水平,查检验表,查得在样本个数为,变量个数时的 临界值。 (3)判别。判别的原则如表2-1。
三、回归预测模型的预测和置信区间计算
经以上检验并通过后,回归预测模型可用于预测。预测时,先确定 自变量的值,然后代入所建立的回归预测模型,便可计算得到因变量的 预测值。在确定自变量的值时,可能根据计算值得到,也可以通过其它 预测模型,如时间序列模型得到。
回归预测模型建立后,是否与实际数据有比较好的拟合度其模型的线
性关系的显著性如何?能否用来进行实际预测?必须进行数理统计和实
际意义检验。常用的统计检验有,标准离差()检验、相关系数检验、
显著性检验和随机性检验。
1.标准离差检验
标准离差,用来检验回归预测模型的精度,其计算公式为:
(2-9)

(2-10)
值;
(3)进行判别。
当时,认为与之间在显著水平下的存在线性统计关系,检验通过,
所建回归预测模型有效。
当时,认为与之间在显著水平不下存在线性统计关系,所建回归预
测模型无效。
4.检验
检验即为杜宾-瓦特森(Durbin-Watson)检验,又叫序列相关检验,
序列相关是指同一变量前后期之间的相关关系。以一元线性回归预测模
相关主题