当前位置:文档之家› 项目二-相关与回归分析案例及练习要求

项目二-相关与回归分析案例及练习要求

项目二-相关与回归分析案例及练习要求项目二:相关与回归分析一、实验目的1、掌握Pearson简单相关分析方法,并根据相关系数判断两变量的相关程度。

2、熟悉偏相关系数、Kendall tau-b和Spearman等级相关系数的计算方法,理解其区别与联系。

3、掌握一元与多元回归分析方法,对回归模型估计和检验,并对结果进行分析。

4、了解曲线回归分析方法。

并对回归结果进行分析。

二、实验内容和要求1、现有杭州市区1978-2014 年的GDP、城镇居民年人均可支配收入和年人均消费支出的数据资料(example1.sav),如下:表5-1 杭州市区GDP、年人均可支配收入、人均消费支出和CPI指数年份GDP(亿元)人均可支配收入(元)人均消费支出(元)定基CPI指数(%)1978 14.1995 338 301 100.1 1979 16.7206 396 365 100.5 1980 20.8220 521 491 101.3 1981 22.9243 540 513 103.3 1982 24.8297 532 532 105.4 1983 28.2171 578 535 107.6 1984 35.3781 729 679 110.9 1985 44.8574 1026 908 130.01986 51.3639 1169 107213 7.81987 60.5234 1260 1118 152.3 1988 70.8474 1565 1515 185.7 1989 77.2208 1764 1615 218.7 1990 89.6496 1985 1685 228.8 1991 109.6628 2128 1894 245.9 1992 141.3287 2580 2296 271.5 1993 208.6571 3525 3183 329.6 1994 278.8314 5249 4559 400.5 1995 369.7794 6301 5559 466.5 1996 472.7377 7206 6095 515.5 1997 541.4265 7896 6766 550.1 1998 590.5726 8465 7235 560.0 1999 631.7335 9085 7424 562.2 2000 711.1586 9668 7790 566.7 2001 1226.0891 10896 8968 563.9 2002 1404.2278 11778 9215 557.12003 1664.7332 12898 9949.76554. 32004 2036.2738 14565 11212.78 568.2 2005 2349.5459 16601 13438 577.8 2006 2748.3121 19026.86 14471.74 584.8 2007 3273.8842 21689.36 14895.75 605.22008 3813.9834 24103.58 16719.10 634.9 2009 4069.8687 26863.93 18594.75 626.0 2010 4740.7788 30035 20219 650.4 2011 5589.8574 34065 22642 681.6 2012 6213.2486 37511 22800 698.7 2013 6639.8609 39310 24833 716.1 2014 9201.1600 44632 32165 730.5 数据来源:历年《杭州统计年鉴》和《2014年杭州市国民经济和社会发展统计公报》。

要求:(1)求人均可支配收入、GDP、人均消费性支出与消费价格指数的双变量Pearson相关系数。

相关性income bcpiincome Pearson 相关性 1 .841**显著性(双侧).000 N 37 37bcpi Pearson 相关性.841** 1 显著性(双侧).000N 37 37**. 在 .01 水平(双侧)上显著相关。

相关性gdp bcpigdp Pearson 相关性 1 .751**显著性(双侧).000 N 37 37bcpiPearson 相关性.751** 1显著性(双侧).000N 37 37 **. 在 .01 水平(双侧)上显著相关。

相关性payout bcpipayout Pearson 相关性 1 .873**显著性(双侧).000 N 37 37bcpi Pearson 相关性.873** 1 显著性(双侧).000N 37 37**. 在 .01 水平(双侧)上显著相关。

(2)画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并给出方程的估计标准误差。

模型汇总模型R R 方调整 R 方标准估计的误差1 .994a.989 .988 912.186a. 预测变量: (常量), income。

的估计标准误差。

模型汇总模型R R 方调整 R 方标准估计的误差1 .985a.969 .969 2250.284a. 预测变量: (常量), gdp。

(4)求人均消费支出倚GDP的直线回归方程。

解释方程结果,并给出方程的估计标准误差。

模型汇总和参数估计值因变量: payout方程模型汇总参数估计值R 方 F df1 df2 Sig. 常数b1线性.952 698.757 1 35 .000 2500.690 3.553自变量为 gdp。

模型汇总模型R R 方调整 R 方标准估计的误差1 .976a.952 .951 1865.083a. 预测变量: (常量), gdp。

(5)若将GDP的单位改为万元,再做第3和第4题,观察单位变化对回归方程的影响。

无影响(6)求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。

(7)求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。

(8)以定基居民消费价格指数为控制变量,对居民年人均可支配收入和消费支出进行偏相关分析。

(9)计算居民年人均消费支出倚GDP,居民年人均可支配收入和消费价格指数的多元线性回归方程,确定最终模型并对估计结果进行解释。

*(10)求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数(提示:一个变量Y对另一个变量X的弹性系数E定义为:E=Y的增长率÷X 的增长率)。

2、由表5-2所示的2013年浙江省各地级市GDP、第三产业就业人数数据资料(example2.sav),进行Kendall tau-b和Spearman等级相关分析。

表5-2 2013年浙江省11地市经济数据单位:亿元/万人地区杭州宁波嘉兴湖州绍兴舟山GD P 8343.527128.873147.661803.153967.29930.85三产就业人数288.93200.44101.8263.52 114.00 30.98地区温州金华衢州台州丽水--GD P 4003.862958.781056.573153.34983.08--三259.5113.51 40.14 147.150.54 --产就业人数6 4数据来源:《2014年浙江统计年鉴》。

练习一、请打开数据文件exercise1.sav,该数据文件是有关浙江省人均可支配收入、服务业产值等基本信息资料。

试根据文件中的数据资料,运用SPSS软件进行以下分析。

1、Pearson线性相关分析:计算城镇居民人均可支配收入、地区生产总值、服务业产值和服务业就业人数的Pearson线性相关系数和sig值,并判断变量间的相关程度。

表1 双变量间的Pearson线性相关系数居民人均可支配收入地区生产总值服务业产值服务业就业人数居民人均可支配收入地区生产总值服务业产值服务业就业人数相关性城镇居民可支配收入地区生产总值服务业产值服务业城镇就业人数城镇居民可支配收入Pearson 相关性 1 .995**.990**.996**显著性(双侧).000 .000 .000N 30 30 30 30 地区生产总值Pearson 相关性.995** 1 .998**.997**显著性(双侧).000 .000 .000N 30 30 30 30 服务业产值Pearson 相关性.990**.998** 1 .995**显著性(双侧).000 .000 .000N 30 30 30 30 服务业城镇就业人数Pearson 相关性.996**.997**.995** 1 显著性(双侧).000 .000 .000N 30 30 30 30 **. 在 .01 水平(双侧)上显著相关。

相关程度判断:各项Sig<0.01,表明在置信度99%下,相关系数在0.990到0.998之间,高度相关2、偏相关分析:以地区生产总值为控制变量,计算双变量的偏相关系数和sig值,并将计算结果填入下表。

居民人均可支配收入服务业产值服务业就业人数居民人均可支配收入服务业产值服务业就业人数相关性控制变量城镇居民可支配收入服务业产值服务业城镇就业人数地区生产总值城镇居民可支配收入相关性 1.000 -.464 .497显著性(双侧). .011 .006df 0 27 27 服务业产值相关性-.464 1.000 -.002显著性(双侧).011 . .993df 27 0 27 服务业城镇就业人数相关性.497 -.002 1.000显著性(双侧).006 .993 .df 27 27 03、一元线性回归分析(1)建立居民人均可支配收入倚服务业产值的直线回归方程,将计算结果填入下表:表2 居民人均可支配收入的一元线性回归回归系数T值P值常数项3205.977 7.814 0.000 服务业产值 2.050 36.912 0.000得到的线性回归方程:Y=3205.977+2.050X 。

(2)分析回归模型的判别系数及其含义:P值等于0,小于0.05,表明拟合效果显著。

(3)回归方程的经济含义是,服务业产值每增加1亿元,_ 城镇居民可支配收入增加2.050元。

_(4)回归方程整体显著性检验sig<0.05,整体拟合效果显著。

4、多元线性回归分析(1) 建立以居民人均可支配收入为因变量,外商直接投资和服务业就业人数为自变量的直线回归方程,将计算结果填入下表:表3 居民人均可支配收入的多元线性回归回归系数T值P值共线性统计量容差VIF常数项-5714.828 -7.241 .000服务业就业人数38.607 10.826 .000 .043 23.335 外商直接投资34.240 1.886 .070 .043 23.335 得到的线性回归方程:居民可支配收入=-5714.828+38.607*服务业就业人数+34.240*外商直接投资。

相关主题