研究生课程考核试卷科目:数理统计教师:黄光辉姓名:张振学号:20142002036 专业:环境科学与工程类别:学术上课时间:2014 年9 月至2014 年11 月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)某商业银行不良贷款形成原因分析摘要根据某商业银行多家分行业务数据,建立线性回归模型,运用SPSS数理统计软件对此商业银行不良贷款情况进行运算与分析,以不良贷款为因变量(y),运用逐步回归法对变量数据进行筛选,最后以各项贷款余额(χ1)与本年固定资产投资额(χ4)为自变量,分别建立y与χ1的一元线性回归方程和y与χ1、χ4的二元线性回归方程,并对回归线性模型进行F检验、t检验和回归系数检验。
最后结合实践经验,对模型进行检验,并运用Pearson相关系数测量因变量(y)与自变量(χ1、χ4)的线性相关关系,以及两个变量之间的相关性。
一、问题提出与分析重庆一家某商业银行其业务主要是进行基础设施建设、重点项目建设、固定资产投资等项目的贷款。
最近一段时间,在贷款额平稳增长的基础上,该银行的不良贷款记录也有大比例提高。
为了弄清楚不良贷款形成的原因,该银行希望利用一些数据做些定量分析。
二、数据描述表1是项目参考的变量名称;表2给出了该银行所属20家分行在2012年的相关业务数据。
表1 项目参考变量名y:不良贷款(亿元)χ3:贷款项目个数(个)χ1:各项贷款余额(亿元)χ4:本年固定资产投资额(亿元)χ2:本年累计应收贷款(亿元)表2 相关业务数据分行编号不良贷款各项贷款余额本年累计应收贷款贷款项目个数本年固定资产投资额1 0.92 67.5 6.78 5 51.92 1.1 112.5 19.8 16 91.13 4.81 174.2 7.9 17 74.24 3.18 82.1 7.3 10 14.55 7.8 199.7 16.4 19 63.216 2.7 16.3 2.2 1 2.27 1.6 106.2 10.7 17 20.28 12.57 185.3 27.1 18 43.81 9 1.01 97.3 1.71 10 55.92 10 2.6 71.4 9.1 14 64.34 11 0.3 64.7 2.1 11 42.7 12 4 136.1 11.2 23 76.8 13 0.8 58.6 6 14 22.9 14 3.5 172.8 12.71 26 117.2 15 10.24 267.5 15.6 34 146.8 16 3 80.5 8.9 15 29.9 17 0.2 16 0.6 2 42.1 18 0.41 75.1 5.91 11 25.3 19 1 25.4 5 4 13.42 20 6.85 141.1 7.2 28 64.3三、数学模型(1)一元线性回归模型建立与模型检验 一元线性回归模型:εββ++=x y 10对应的一元线性回归方程:x y 10ˆˆˆββ+=通常假定,),0(~2σεN),(,),,(),,(2211n n y x y x y x 设是),(y x 的一组观测值,则ii i x y εββ++=10n i ,,2,1 =),0(~2σεN i ni ,,2,1 =假设观测值),(,),,(),,(2211n n y x y x y x 相互独立12,,,n y y y =>相互独立12,,,n εεε=>相互独立假设 12,,,n x x x 是确定性的变量,其值是可以精确测量和控制的.最小二乘法估计:最小二乘估计),(,),,(),,(2211n n y x y x y x 设是),(y x 的一组观测值,对每个样本观测值 (,)i i x y 考虑 i y 与其回归值ii x y E 10)(ββ+=的离差ii i i x y y E y 10)(ββ--=-综合考虑每个离差值,定义离差平方和()∑=-=ni i i y E y Q 1210)(),(ββ∑=--=ni i i x y 1210)(ββ所谓最小二乘法,就是寻找参数01,ββ的估计值1ˆβ使得离差平方和达到极小值,即选择使得0ˆ,β1ˆβ0ˆ,β),(min )ˆ,ˆ(1010ββββQ Q Q e ==满足上式的1ˆβ0ˆ,β称为回归参数二乘估计。
01,ββ的最小201011(,)()ni i i Q y x ββββ==--∑由于的极小值总是存在的4若记 21()nxx i i L x x ==-=∑1()()n xy i i i L x x y y ==--=∑21()nyy i i L y y ==-=∑1ˆ/,xy xxL L β=>=x y 10ˆˆββ-=x y 10ˆˆββ-=由221ni i x nx =-∑1ni i i x y nxy=-∑221nii yny =-∑x y 10ˆˆββ+=⇒[]∑∑==-+-=-=ni i i i ni i T y y y yy y S 1212)ˆ()ˆ()(∑∑==-+-=ni i i n i i T y y y yS 1212)ˆ()ˆ(残回S S +=01=β时,S S 回残与相互独立,且)1(~)ˆ(121222χσσ∑=-=ni iy yS 回)(残2~)ˆ(121222--=∑=n y y S ni i i χσσ检验假设 01:0,H β=11:0H β≠选取统计量 残回S S n F )2(-=对给定的显著性水平 (01)αα<<,0H 的拒绝域为)2,1()2(->-=n F S S n F α残回(2)多元线性回归模型建立与模型检验3 多元线性回归设随机变量y k x x x ,,,21 εββββ+++++=k k x x x y 22110与 之间呈线性相关 关系, 则其中 k βββ,,,10 是 1+k 个未知参数, εkk x x x y ββββˆˆˆˆˆ22110++++= 是随 机误差. 称方程为多元线性回归方程如果我们获得了n 组观察数据 ),,2,1)(,,,,(21n i y x x x i ik i i =则有ni x x x y i ik k i i i ,,2,1,22110 =+++++=εββββ矩阵形式 ε+=XB Y12,n y y Y y ⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭111212111,1k k n nk x x x x X x x ⎛⎫ ⎪⎪= ⎪ ⎪ ⎪⎝⎭01,k B βββ⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭⎪⎪⎪⎪⎪⎭⎫⎝⎛=n εεεε21基本假设:(1)k x x x ,,,21 是确定性变量, 且()1rank X k n =+<(2) n εεε,,,21 相互独立, ),0(~2σεN i 即 ),0(~2n I N σε其中 n I 是 n 阶单位方阵, 是对每一个变量i x 在线性回归方程中的作用进行检验,如果 i x 对 y 的作 用不显著,则它的系数 i β就可以取值为0. 因此检验变量i x 是否显著等价于检验假设 0:0=i H β0:1≠i H β)1(~22--k n Q eχσ,且 e Q iβˆ与 独立. 另一方面 ))(,(~ˆ12-X X B N BT σ记 )1()1(1)()(+⨯+-=k k ij T c X X 则 ),(~ˆ2iii i c N σββ())1(~)1()ˆ(2-----k n t k n Q c eiii i σσββ所以即 )1(~ˆˆ---k n t c ii ii σββ选取检验统计量 ii i c t σβˆˆ=其中1)ˆ(1ˆ12---=--=∑=k n yyk n Q ni i ieσ则当 0H 成立时 )1(~--k n t t 故对给定的显著性水平)10(<<αα, 假设检验问)1(ˆˆ2/--≥=k n t c t ii i ασβ题的拒绝域为四、计算方法设计和计算机实现使用SPSS 软件,并选用逐步回归法进行变量筛选,得到以下主要计量结果。
模型质量的汇总分析:表3给出了两个回归模型的质量的汇总分析结果。
表3 模型汇总模型R R 方调整 R方标准估计的误差更改统计量R 方更改 F 更改df1 df2Sig. F 更改1 .805a.648 .628 2.10970 .648 33.118 1 18 .0002 .855b.731 .699 1.89800 .083 5.239 1 17 .035a. 预测变量: (常量), 各项贷款余额。
b. 预测变量: (常量), 各项贷款余额, 本年固定资产投资额。
表3指出,在计算过程中,得到的第一个模型是一元线性回归模型,模型中被选用的自变量是各项贷款余额。
该模型的测定系数(R-Square)为R2=0.648,估计标准误差等于2.10970。
而第二个模型这是一个二元线性回归模型,自变量是各贷款余额和本年度固定资产投资,该模型的测定系数为R2=0.731调整的测定系数为0.699,估计标准误差等于1.89800。
表4是方差分析表。
它分别给出上述2个模型的F检验的结果。
第一个模型中,计算得到SSR=147.404,SSE=80.115,以及SST=227.519。
这三个统计量的自由度(df)分别为1、18、19。
由此计算出MSR=SSR/1=147.404,MSE=SSE/18=4.451。
第二个模型中,计算得到SSR=166.278,SSE=61.241,以及SST=227.519。
这三个统计量的自由度(df)分别为2、17、19。
由此计算出MSR=SSR/1=83.139,MSE=SSE/17=3.602。
综上所述,得到模型检验的F值为33.118、23.079,而相应F检验的P值均为0.000。
所以,两个模型都经过F检验。
表4 方差分析Anova c模型平方和df 均方 F Sig.1 回归147.404 1 147.404 33.118 .000a残差80.115 18 4.451总计227.519 192 回归166.278 2 83.139 23.079 .000b残差61.241 17 3.602总计227.519 19a. 预测变量: (常量), 各项贷款余额。
b. 预测变量: (常量), 各项贷款余额, 本年固定资产投资额。
c. 因变量: 不良贷款五、结果分析与检验 回归系数及相应的 t 检验:表5给出回归模型中的系数,以及相应的 t 检验的情况。
在表5中的第一列数据可以看出,第一个回归模型的形式为:1ˆy1.0760.042x =-+ 在该模型中,b 1等于0.042,1b S (Stol Error )为0.005,由此得到相应的 t 检验统计量等于5.755,而与之对应的P 值(Sig )为0.000,说明该变量 t 检验通过。