多元线性回归分析预测法多元线性回归分析预测法(Multi factor line regression method ,多元线性回归分析法)C3[编辑]多元线性回归分析预测法概述在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。
而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。
例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。
这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。
多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。
当自变量与因变量之间存在线性关系时,称为多元线性回归分析。
[编辑]多元线性回归的计算模型⑴一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。
当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。
设y为因变量,I」-…为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:y = 6()+ ^1X1 + &2为2 丨■…+ b k Xk+ e其中,b o为常数项,•- ' ■「为回归系数,b i为’•' 「固定时,x i每增加一个单位对y的效应,即X i对y的偏回归系数;同理b2为’•二•,固定时,X2每增加一个单位对y的效应,即,X2对y的偏回归系数,等等。
如果两个自变量x i,X2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y = fto 4 &15C1 + 血力!2 + …+ bkXk I E其中,b o为常数项,• • ■ •「为回归系数,b i为固定时,X2每增加一个单位对y的效应,即X2对y的偏回归系数,等等。
如果两个自变量X i,X2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y = b o + b i X i + b2X2 + e建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果变量的选择,,应首先注意自其准则是:(1) 自变量对因变量必须有显著的影响,并呈密切的线性相关;(2) 自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3) 自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;(4) 自变量应具有完整的统计数据,其预测值容易确定。
多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(二「)为最小的前提下,用最小二乘法求解参数。
以二线性回归模型为例,求解回归参数的标准方程组为工>=宛馆+加刀巧I检刀牝刀衍“=论刀①1 + %力听+傀刀巧①2 刀x7y= % £叼I加刀①炖I直刀诡解此方程可求得b o,b i,b2的数值。
亦可用下列矩阵法求得多元线性回归模型的检验⑴多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。
1、拟合程度的测定。
与一元线性回归中可决系数 r 2相对应,多元线性回归中也有多重可决系数r 2,它是在因变量的总变化中,由回归方程解释的变动 (回归平方和)所占的比重,R 2越大,回归方各对样本数据点 拟合的程度越强,所有自变量与因变量的关系越密切。
计算公式为:丘2 =刀(@_@)2E(y - y)2=1 E(y-y)2 =E(y-y)2其中,力(妙一 y)2 =工/ —(悅£片+ % £②1“ +址5T ②汕+…+加5T 巩卩)I- y)2 =为『一:(为诉 I V2. 估计标准误差91 21JC-22 ^22£估计标准误差,即因变量y的实际值与回归方程求岀的估计值A之间的标准误差,估计标准误差越小,回归方程拟合程度越程Syy其中,k为多元线性回归方程中的自变量的个数。
3. 回归方程的显著性检验回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。
能常采用F检验,F统计量的计算公式为:= Ed歹尸/氐=页_卯加_应_ 1R2/k(l-7?2)/n-fr-l根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值F a,若F > F a,则回归方程具有显著意义,回归效果显著; F < F a,则回归方程无显著意义,回归效果不显著。
4. 回归系数的显著性检验在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。
t检验是分别检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。
检验时先计算统计量t i;然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值t a或t a / 2,t > t - a或t a / 2,则回归系数b i与0有显著关异,反之,则与0无显著差异。
统计量t的计算公式为:其中,C j是多元线性回归方程中求解回归系数矩阵的逆矩阵(x'x)-1的主对角线上的第j个元素。
对二元线性回归而言,可用下列公式计算:其中,5ii = 52(^1 -xi )2 = ”工 f 一 ](丫3严* If^12 = 刀(衍一們)(叼一勿)=521"①S --土(工叼)(工切5. 多重共线性判别若某个回归系数的 t 检验通不过,可能是这个系数相对应的自变量对因变量的影平不显著所 致,此时,应从回归模型中剔除这个自变量,重新建立更为简单的回归模型或更换自变量。
也可 能是自变量之间有共线性所致,此时应设法降低共线性的影响。
多重共线性是指在多元线性回归方程中,自变量之彰有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。
需要指岀的 是,在多元回归模型中,多重共线性的难以避免的,只要多重共线性不太严重就行了。
判别多元 线性回归方程是否存在严惩的多重共线性,可分别计算每两个自变量之间的可决系数 r 2,若r 2 >R 2或接近于R 2,则应设法降低多重线性的影响。
亦可计算自变量间的 相关系数矩阵的特征值的条件数k =入/ p Q 入为最大特征值,k 为最小特征值),k<100,则不存在多重点共线性;若100< k < 1000则自变量间存在较强的多重共线性,若k>1000,则自变量间存在严重的多重共线性。
降低多重共线性的办法主要是转换自变量的取值,如变 绝对数 为相对数或平均数,或者更换其他的自变量。
6. D.W 检验当回归模型是根据动态数据建立的,则误差项e 也是一个 时间序列,若误差序列诸项之间相互独立,则误差序列各项之间没有相关关系,若误差序列之间存在密切的相关关系,则建立的 回归模型就不能表述自变量与因变量之间的真实变动关系。
D.W 检验就是误差序列的自相关检验。
检验的方法与一元线性回归相同。
S22 S11S 滤-呢工(叼一血尸=12^2[编辑]多元线性回归分析预测法案例分析[编辑]案例一:公路客货运输量多元线性回归预测方法探讨[2]一、背景公路客、货运输量的定量预测,近几年来在我国公路运输领域大面积广泛地开展起来,并有效的促进了公路运输经营决策的科学化和现代化。
关于公路客、货运输量的定量预测方法很多,本文主要介绍多元线性回归方法在公路客货运输量预测中的具体操作。
根据笔者先后参加的部、省、市的科研课题的实践,证明了多元线性回归方法是对公路客、货运输量预测的一种置信度较高的有效方法。
二、多元线性回归预测线性回归分析法是以相关性原理为基础的•相关性原理是预测学中的基本原理之一。
由于公路客、货运输量受社会经济有关因素的综合影响。
所以,多元线性回归预测首先是建立公路客、货运输量与其有关影响因素之间线性关系的数学模型。
然后通过对各影响因素未来值的预测推算出公路客货运输量的预测值。
三、公路客、货运输量多元线性回归预测方法的实施步骤1. 影响因素的确定影响公路客货运输量的因素很多,主要包括以下一些因素:(1) 客运量影响因素人口增长量裤保有量、国民生产总值、国民收入工农业总产值,基本建设投资额城乡居民储蓄额铁路和水运客运量等。
(2) 货运量影响因素人口货车保有量(包括拖拉机),国民生产总值,国民收入、工农业总产值,基本建设投资额, 主要工农业产品产量,社会商品购买力,社会商品零售总额•铁路和水运货运量菩。
上述影响因素仅是对一般而言,在针对具体研究对象时会有所增减。
因此,在建立模型时只须列入重要的影响因素,对于非重要因素可不列入模型中。
若疏漏了某些重要的影响因素,则会造成预测结果的失真。
另外,影响因素太少会造成模型的敏感性太强•反之,若将非重要影响因素列入模型,则会增加计算工作量,使模型的建立复杂化并增大随机误差。
影响因素的选择是建立预测模型首要的关键环节,可采取定性和定量相结合的方法进行. 影响因素的确定可以通过专家调查法,其目的是为了充分发挥专家的聪明才智和经验。
具体做法就是通过对长期从事该地区公路运输企业和运输管理部门的领导干部、专家、工作人员和行家进行调查。
可通过组织召开座谈会•也可以通过采访,填写调查表等方法进行,从中选出主要影响因素为了避免影响因素确定的随意性,提高回归模型的精度和减少预测工作量,可通过查阅有关统计资料后,再对各影响因素进行相关度(或关联度)和共线性分析,从而再次筛选出最主要的影响因素•所谓相关度分析就是将各影响因素的时间序列与公路客货运量的时间序列做相关分杯事先确定一个相关系数,对相关系数小于的影响因素进行淘汰•关联度是灰色系统理论中反映事物发展变化过程中各因素之间的关联程度,可通过建空公路客、货运量与各影响影响因素之间关联系数矩阵,按一定的标准系数舍去关联度小的影响因素. 所谓共线性是指某些影响因素之问存在着线性关系或接近于线性关系•由于公路运输经济自身的特点,影响公路客,货运输量的诸多因素之问总是存在着一定的相关性,持别是与国民经济有关的一些价值型指标。
我们研究的不是有无相关性问题而是共线性的程度,如果影响因素之间的共线性程度很高,首先会降低参数估计值的精度。
其次在回归方程建立后的统计检验中导致舍去重要的影响因素或错误的地接受无显著影响的因素,从而使整个预测工作失去实际意义。
关于共线性程度的判定,可利用逐步分析估计法的数理统计理论编制计算机程序来实现。
或者通过比较rj和R2的大小来判定。