《应用回归分析》实验指导书倪伟才编二00四年十一月《应用回归分析》实验指导书一、实验教学简介《应用回归分析》是统计专业的必修课程,同时也是核心课程。
该课程教学是以数学分析、线性代数、概率统计为预备知识,同时为计量经济学课程的教学奠定基础。
本课程在系统介绍回归分析基本理论和方法的同时,结合社会、经济、医学等领域的实际例子,把回归分析方法和实际应用相结合,注意定性分析和定量分析的紧密结合。
实验教学是该课程必不可少的、重要的组成部分。
本实验课程的案例中的数据处理主要运用我国已较流行的SPSS统计软件来实现,再结合SAS与Excel。
通过本课程的学习,使学生能够熟练地运用SPSS 统计软件进行回归分析,利用回归的方法解决一些实际问题,同时介绍SPSS使用中的一些小技巧。
实验教学的主要内容有:一元线性回归模型的估计、回归系数的检验、回归方程的检验、预测;多元线性回归模型的估计、回归系数的检验、回归方程的检验、预测;异方差的检验(多种检验方法);加权最小二乘估计;自相关性的诊断及差分法;逐步回归法;多重共线性的诊断;岭回归;多项式回归;曲线回归等。
二、实验教学目的与任务通过对本课程的实验教学,不仅使学生掌握回归分析的基本概念、基本原理、基本方法,而且能够熟练地运用SPSS统计软件进行回归分析,利用回归的方法解决一些实际问题,同时掌握SPSS使用中的一些小技巧。
强调定性分析与定量分析的有机结合,注重理论水平和实际操作的有机结合。
三、实验教学数据的存放本实验指导书涉及到的数据均以SPSS格式或Excel格式给出,并放在班级的服务器上,学生完全可以共享。
为了保持实验指导书的完整性,所有的数据也附在每一个实验的题目后面。
四、实验内容实验一:一元线性回归模型的估计、回归系数和回归方程的检验、预测(验证性实验2课时)实验题目:一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。
经过10周时间,收集了每周加班工作时间的数据及签发的新保单数目,x为每周签发的新保单数目,y为每周加班工作时间(小时),数据如下:1:画散点图;3:用最小二乘法估计回归方程;4:求回归标准误;5:求回归系数的置信度为95%的区间估计;6:计算x与y的决定系数;7:对回归方程做方差分析;8:做回归系数β1的显著性检验;9:做相关系数的显著性检验;10:该公司预测下一周签发新保单x0=1000,需要的加班时间是多少?11:分别给出置信水平为95%的均值与个体预测区间;12:请在散点图的基础上画出回归线,均值的预测区间图,个体的预测区间图。
实验目的:掌握用OLSE估计回归方程并根据方程进行预测,掌握拟合度的分析,掌握t检验与F检验,会做相关系数的显著性检验,会画散点图并通过编辑散点图掌握画回归线、置信区间图的SPSS使用的小技巧。
SPSS主要操作:(1)散点图:Graphs-Scatter;(2)回归方程、回归标准误、方差分析表、决定系数、回归系数的t显著性检验:Analyze-Regression-Linear,各选项采用默认项;(3)相关系数的检验:Correlate-Bivariate;(4)回归系数的置信度为95%的区间估计:Analyze-Regression-Linear-Statistics-Regression coefficients-Confidence;(5)置信水平为95%的均值与个体预测区间:Analyze-Regression-Linear-statistics-Save-Prediction Intervals-Mean , Individual;(6)画回归线,均值的预测区间图,个体的预测区间图:在散点图的基础上,双击散点图,使图形处于编辑状态,Chart-Options-Fit line-Total-Fit options-Fit method-Linear regression, Regression Prediction line-Mean, Individual .SPSS输出结果及答案:1:散点图2:由散点图知:x与y之间大致成线性关系3:用最小二乘法估计回归方程;由上述输出结果得到回归方程:y=0.118+0.003585x4:求回归标准误;由上述输出结果得到回归标准误:0.4805:求回归系数的置信度为95%的区间估计;由上述输出结果得到回归系数的置信度为95%的区间估计:(0.003,0.005)6:计算x与y的决定系数;7:对回归方程做方差分析;ANOV A就是方差分析表,主要是为了得到回归方程的F统计量值8:做回归系数β1的显著性检验;由上述输出结果得到回归系数β1的t统计量值为8.509,相伴概率为2.79×10-5。
SPSS小技巧:如何在输出结果中读出2.79×10-5。
具体操作:双击表格,再双击单元格,后使用键盘上的左右键来显示小数点的位数!9:做相关系数的显著性检验;由上述输出结果得到x,y的相关系数为0.949,在1%的显著性水平上是显著的。
10:该公司预测下一周签发新保单x0=1000,需要的加班时间3.73032611:分别给出置信水平为95%的均值与个体预测区间均值的预测区间:(3.28373,4.12279)个体的预测区间:(2.51949,4.88703)12:回归线,均值的预测区间图,个体的预测区间图结果如下:注意:①图形中中间的直线是回归线;②均值的预测区间要必个体的预测区间要窄,理由是Ey只考虑样本的抽样误差,y不仅考虑样本的抽样误差,而且考虑了误差项的影响(即其它因素的影响)。
实验二:掌握多元回归模型的矩阵计算 (验证性实验 1课时) 实验题目:请用矩阵求线性回归模型的系数估计值 1:计算矩阵形式X’X2:计算矩阵形式(X’X )-1 3:计算矩阵形式X’Y4:计算矩阵形式系数的估计值实验目的:SPSS 不能计算矩阵的转置、逆、乘法,故用Excel 计算,当然也可以用Matlab 。
此实验主要目的使学生学会多元回归模型的矩阵计算。
Excel 主要操作: Excel 中涉及到的主要函数:转置函数Transpose , 逆矩阵minverse, 矩阵乘法mmult ; 注意事项:求以上函数时首先选中区域,最后要按F2,使处于编辑状态,再按ctrl-shift-enter 完成计算。
Excel 输出结果及答案:1:X'1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1839 1844 1831 1881 1883 1910 1969 2016 2126 2239 2336 2404 2487 2535 2595 123456789 10 11 12 13 14 15X'X15 31895 120 31895 68922513 272144 12027214412402:(X'X)-137.23277183 -0.022508116 1.3367066 -0.02250812 1.37155E-05 -0.0008319 1.336706597 -0.000831941 0.05403457Y x1x2 1673 1839 1 1688 1844 2 1666 1831 3 1735 1881 4 1749 1883 5 1756 1910 6 1815 1969 7 1867 2016 8 19482126 9 20482239 10 21282336 11 2165 2404 12 2257 2487 13 23162535 14 23242595153: 4:X'Y29135 62905821 247934实验三:检验关于参数的一个线性组合的假设 (综合性实验 1课时) 实验题目:现在, 我们使用住房价格的对数作为因变量: log(price) =β0+β1sqrft +β2bdrms +u.1:你想在住宅中增加一间150平方英尺的卧室的情况下,估计并得到 price 变化百分比的一个置信区间;以小数形式表示就是 θ1 = 150β1 +β2 . 使用 hprice1.sav 中的数据去估计θ1.2:用θ1和β1表达β2,并代入log(price)的方程.3:利用的2小题中的结果,得到ˆθ1的标准误,并使用这个标准误构造一个 95% 置信区间.(该题目来源于Wooldridge 《计量经济学导论 现代观点》第4章 习题4.14) 数据如下:n logprice sqrft bdrms n logprice sqrft bdrms 1 12.61 2438 4 45 12.83 2293 5 2 12.82 2076 3 46 12.49 1764 3 3 12.16 1374 3 47 12.65 2768 3 4 12.18 1448 3 48 12.94 3733 4 5 12.83 2514 4 49 12.44 1536 3 6 13.05 2754 5 50 12.66 1638 4 7 12.71 2067 3 51 12.48 1972 3 8 12.66 1731 3 52 12.45 1478 2 9 12.24 1767 3 53 12.25 1408 3 10 12.39 1890 3 54 12.1 1812 3 11 12.56 2336 4 55 12.43 1722 3 12 12.61 2634 5 56 12.43 1780 4 13 12.91 3375 3 57 12.25 1674 4 14 12.26 1899 3 58 12.46 1850 4 15 12.49 2312 3 59 12.57 1925 3 16 12.33 1760 4 60 12.66 2343 4 17 12.39 2000 4 61 12.32 1567 3 18 12.56 1774 3 62 12.49 1664 4 19 12.5 1376 363 12.64 1386 6 ^300.2862573 0.741980831 8.043562722012.64183546413.06261752112.49204836512.72232142212.51212436613.11263842312.32176836712.54191542411.92173246812.85258942512.42144036912.69270942612.52193237012.3158732712.35193237112.28169432812.75210637212.39153632913.0835*******.49366253012.77205147412.35173633112.35157347512.63220523212.72282947612.96150233312.43163037712.67169643412.37184047812.71218633512.8206647912.41192843612.151********.32129433712.79275048111.62153543813.26388058212.5198033912.25185448312.4209044012.32142128412.59183734112.41166238512.37171534213.48333158612.22157434312.42165648712.3118524412.35117138812.417744实验目的:对于多元线性回归模型,SPSS的输出结果给出的只是单独的系数的t检验和整个方程的F检验,但没有直接给出参数的一个线性组合的假设检验。