SPSS 统计分析
多元线性回归分析方法操作与及分析
实验目的:
引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。
实验变量:
以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。
实验方法:多元线性回归分析法
软件:spss19.0
操作过程:
第一步:导入Excel数据文件
1.open data document——open data——open;
2. Opening excel data source——OK.
第二步:
1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise.
进入如下界面:
2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的
Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.
3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.
4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals (残差)选项组中的Unstandardized;点击Continue.
5.点击右侧Options,默认,点击Continue.
6.返回主对话框,单击OK.
输出结果分析:
1.引入/剔除变量表
Variables Entered/Removed a
Model Variables Entered Variables
Removed Method
1 城市人口密度
(人/平方公里) . Stepwise (Criteria: Probability-of-F-t o-enter <= .050, Probability-of-F-t o-remove >= .100 ).
2 城市居民人均可
支配收入(元) . Stepwise (Criteria: Probability-of-F-t o-enter <= .050, Probability-of-F-t o-remove >= .100 ).
该表显示模型最先引入变量城市人口密度(人/平方公里),第二个引入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。
2.模型汇总
Model Summary c
Mode
l R R Square Adjusted R
Square
Std. Error of
the Estimate
Durbin-Wat
son
1 1.000a 1.000 1.000 35.187
2 1.000b 1.000 1.000 28.351 2.845
a. Predictors: (Constant), 城市人口密度(人/平方公里)
b. Predictors: (Constant), 城市人口密度(人/平方公里), 城市居
民人均可支配收入(元)
c. Dependent Variable: 商品房平均售价(元/平方米)
该表显示模型的拟合情况。
从表中可以看出,模型的复相关系数(R)为1.000,判定系数(R Square)为1.000,调整判定系数(Adjusted R Square)为1.000,估计值的标准误差(Std. Error of the Estimate)为28.351,Durbin-Watson检验统计量为2.845,当DW≈2时说明残差独立。
3.方差分析表
ANOVA c
Model Sum of
Squares df
Mean
Square F Sig.
1 Regressi
on 38305583.
506
1 38305583.
506
30938.6
20
.000a
Residual 11143.039 9 1238.115
a. Dependent Variable: 商品房平均售价(元/平方米)
Total 38316726.
545
10
2 Regressi
on 38310296.
528
2 19155148.
264
23832.1
56
.000b
Residual 6430.018 8 803.752
Total 38316726.
545
10
a. Predictors: (Constant), 城市人口密度(人/平方公里)
b. Predictors: (Constant), 城市人口密度(人/平方公里), 城市居
民人均可支配收入(元)
c. Dependent Variable: 商品房平均售价(元/平方米)
该表显示各模型的方差分析结果。
从表中可以看出,模型的F统计量的观察值为23832.156,概率p值为0.000,在显著性水平为0.05的情形下,可以认为:商品房平均售价(元/平方米)与城市人口密度(人/平方公里),和城市居民人均可支配收入(元)之间有线性关系。
4.回归系数
Residuals Statistics a
Minimu
m Maximu
m Mean
Std.
Deviation N
Predicted Value 3394.71 8382.83 5465.64 1957.302 11 Residual -47.035 40.271 .000 25.357 11 Std. Predicted
Value
-1.058 1.490 .000 1.000 11 Std. Residual -1.659 1.420 .000 .894 11 a. Dependent Variable: 商品房平均售价(元/平方米)
该图为回归标准化残差的直方图,正态曲线也被显示在直方图上,用以判断标准化残差是否呈正态分布。
但是由于样本数只有11个,所以只能大概判断其呈正态分布。
9.回归标准化的正态P-P图
该图回归标准化的正态P-P图,该图给出了观测值的残差分布与假设的正态分布的比较,由图可知标准化残差散点分布靠近直线,因而可判断标准化残差呈正态分布。
10.因变量与回归标准化预测值的散点图
附件:
原始数据:
自变量散点图:
由散点图可以看出,可进入分析的变量为城市人口密度、城市居民人均可支配收入。