当前位置：文档之家› 一元线性回归预测

一元线性回归预测

系数检验表，查表明取自由度，得到相关系数临界值。
（3）进行判别。
当时，与在显著水平下显著相关，检验通过。
当时，与线性关系不显著。
3．检验
检验用来检验与之间是否存在显著的线性统计关系。如果检验结果
是否定的，即与之间不存在显著的线性统计关系，那么，所建立的回归
预测模型无效，不能用来进行预测。的计算公式为
从式（2-9）可以看到反映了回归预测模型所得的估计值与实际值的
平均误差，所以希望的值越小越好。一般要求
（2-11）
2．相关系数检验
相关系数，用来检验两个变量之间的线性相关的显著程度，其计算
公式为
（2-12）
或
（2-13）
此外，的另一种算法为
Hale Waihona Puke （2-14）数学上可以证明（2-12）式或（2-13）式与（2-14）式是完全等价的。
（2-15）
或
（2-16）
由式（2-16）可知值与值之间有一定关系，若显著水平已知时，由
表可查得的临界值，可以求出相应的相关系数临界值
即
（2-17）
和相关系数检验一样，检验也是通过查得临界值，然后进行比较来
进行判断的。其方法如下：
（1）按（2-15）或（2-16）式计算值；
（2）拟定显著性水平（一般取），查检验表，取自由度，得临界
系的。但是，事实上，自变量与因变更的关系并不完全是一条直线，而只是近似一条直线。
但是怎样的直线才能最好地反映了与的关系呢？就是说，是否有一种方法使所确定的回归系数、是最佳的呢？最常用的方法是最小二乘法。即参数、的估计，一般采用最小二乘法。
对于预测对象，相关因素，可以收集到对数据：如果经回归分析得到回归预测模型如式2-1所示，则对于每一个相关因素的值对应有一个的估计值。则实际值与估计值一般是不相等的，存在一个偏差，称为估计误差或残差，用表示。即或写成最小二乘法是以误差平方和最小这一原理来估计系数，从而建立回归预测模型的。设以表示误差平方和，则有：
科技水平为基础的。此外，有时间序列数据的处理中，因采用内插、平
滑等方法，也会引起序列相关问题。因此，序列相关在回归分析中是经
常遇到的现象。但是，由于存在序列相关，当采用最小二乘法建立回归预测模型
时，将会使、的估计不再具有最小方差，不再是有效的估计量，将会使系统检验功能减小，置信区间过宽，使预测失效。因而，必须对回归预测模型进行序列相关检验，以保证预测结果的有效性。
表2-1 检验判别表
值
检验结果
否定假设，有负序列相关
否定假设，有正序列相关
接受假设，无序列相关
检验无结论
检验无结论
但是，由于回归预测模型是经过数理统计方法得到，有一定的误差，因而使预测结果也有一定的误差，即预测结果有一定的波动范围，这个范围称为置信区间，其计算方法如下：
（1）按式（2-10）或（2-11）计算标准离差。（2）确定置信区间在大样本（）时，如果取置信度为，则置信区间为
如果
则得
即
当时，实际值完全落在回归直线上，与有完全的线性关系。
当时，与有一定的线性正相关关系，即随的增加而增加。
当时，与有一定的线性负相关关系，即随的增加而减少。
当时，则说明与之间不存在线性关系，或许是因为两者之间的确没
关系，或是二者之间不存在线性关系，而存在某种其它关系。
由此可以看到，只有当接近于1时，才能用一元线性回归预测模型来
（2-2）很显然，是参数、的函数，当求最小时，根据微分学中极值原理有：即
（2-3）（2-4）求解上联立方程可得
取为的平均值，为的平均值。
代入（2-5），（2-6）式中，并将简写为，则有
按式（2-7）、（2-8）求得的参数所建立的一元线性回归预测模型具有最小的误差平方和。
二、模型检验
（2-19）式中是在显著性水平为，自由度为时的统计量，查检验表得到。在小样本（）的情况下，要对标准离差进行修正。对于给定自变量
的值，其修正系数为则置信区间为
（2-20）（2-21）
型来说。
为随机误差项。回归模型的统计特征有一个假定，即是互不相关
的。如果这个假定不能满足，就称是相关的，即存在序列相关，反之，
是独立的，不存在序列相关。
应该认识到，序列相关是一种常见的现象，如在社会经济系统中，
人口的增加与前一年或几年人口有关，年的投资可能与年的投资有关，
甚至与、年或更早些时的投资有关，科技进步水平的提高也是与以往的
2.1 一元线性回归预测
回归预测在研究社会许多现象之间的定量关系方面有着十分广泛的应用，一元线性回归预测是最基本的、最简单的预测方法，是掌握其它回归预测方法的基础。
一、参数估计
一元线性回归预测模型的数学表达式是一元线性方程：（2-1）
式中：——预测对象，因变量或被解释变量； ——影响因素，自变量或解释变量； ——回归系数。其含意表示事物主要受一个因素的影响，而且这种影响是呈线性关
描述与之间的关系，但在实际预测中，的值不一定十分接受于1，这
样，应该大到什么程度，回归预测模型才有实际意义呢？实际检验中是
通过与临界相关系数。的比较来判断的，这个过程叫相关性检验，其方
法如下：
（1）按式（2-12）、（2-13）或（2-14）计算；
（2）拟定显著性水平，（一般取，即95%的置信度），然后查相关
检验方法如下：（1）计算的值。统计量定义为
（2-18）（2）拟定显著水平，查检验表，查得在样本个数为，变量个数时的临界值。（3）判别。判别的原则如表2-1。
三、回归预测模型的预测和置信区间计算
经以上检验并通过后，回归预测模型可用于预测。预测时，先确定自变量的值，然后代入所建立的回归预测模型，便可计算得到因变量的预测值。在确定自变量的值时，可能根据计算值得到，也可以通过其它预测模型，如时间序列模型得到。
回归预测模型建立后，是否与实际数据有比较好的拟合度其模型的线
性关系的显著性如何？能否用来进行实际预测？必须进行数理统计和实
际意义检验。常用的统计检验有，标准离差（）检验、相关系数检验、
显著性检验和随机性检验。
1．标准离差检验
标准离差，用来检验回归预测模型的精度，其计算公式为：
（2-9）
或
（2-10）
值；
（3）进行判别。
当时，认为与之间在显著水平下的存在线性统计关系，检验通过，
所建回归预测模型有效。
当时，认为与之间在显著水平不下存在线性统计关系，所建回归预
测模型无效。
4．检验
检验即为杜宾-瓦特森（Durbin-Watson）检验，又叫序列相关检验，
序列相关是指同一变量前后期之间的相关关系。以一元线性回归预测模

e商务文档

一元线性回归预测

相关文档推荐：