城镇居民家庭收入的逐步回归分析
07级数学1班盛平0707021012
摘要:用多元统计中逐步回归分析的方法和SAS软件解决了可支配收入与其他收入之间的关系,并用此模型预测在以后几年里居民平均每人全年家庭可支配收入。
关键词:逐步回归分析多元统计SAS软件
正文
1 模型分析
各地区城镇居民平均每人全年家庭可支配收入y与工薪收入x1、经营净收入x2、财产性收入x3和转移性收入x4有关,共观测了15组数据,试用逐步回归法求‘最优’回归方程。
各地区城镇居民平均每人全年家庭收入来源(2007年)
单位:元
2模型的理论
(1)基本思想:逐个引入自变量,每次引入对y影响最显著的自变量,并对方程中的老变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的方程中既不漏掉对Y影响显著的变量,又不包含对Y影响不显著的变量。
(2)逐步筛选的步骤:首先给出引入变量的显著性水平
和剔除变量的显著性
in
水平
;然后按图4.1的框图筛选变量。
out
3模型的求解
(1)源程序:
data ch;
input x1 x2 x3 x4 x5 y @@;
cards;
28.2 47.9 44.1 3.8 23.9 100.0
31.3 47.1 43.6 3.5 21.6 100.0
30.2 48.2 43.9 4.3 21.6 100.0
¡¡
31.9 46.1 41.9 4.2 22.0 100.0
33.4 44.8 40.6 4.1 21.8 100.0
33.2 44.4 39.9 4.5 22.4 100.0
32.1 43.1 38.7 4.4 24.8 100.0
28.4 42.9 38.3 4.6 28.7 100.0
¡¡
27.2 43.7 38.6 5.1 29.1 100.0
26.8 43.6 38.0 5.5 29.6 100.0
25.7 43.8 38.4 5.4 30.5 100.0
25.1 42.8 38.2 4.7 32.1 100.0
27.1 41.3 36.7 4.6 31.6 100.0
¡¡
24.5 41.8 37.1 4.7 33.7 100.0
21.8 43.4 38.2 5.3 34.8 100.0
19.7 46.6 40.2 6.4 33.7 100.0
19.8 46.6 40.4 6.2 33.6 100.0
19.9 47.2 41.0 6.1 32.9 100.0
¡¡
19.7 47.5 41.4 6.2 32.8 100.0
18.3 47.5 41.7 5.9 34.2 100.0
17.6 46.2 40.3 5.9 36.2 100.0
16.5 45.8 40.0 5.8 37.7 100.0
15.1 45.9 40.4 5.6 39.0 100.0
¡¡
14.4 45.1 39.7 5.4 40.5 100.0
13.7 44.8 39.4 5.4 41.5 100.0
12.8 46.0 40.5 5.5 41.2 100.0
13.4 46.2 40.8 5.4 40.4 100.0
12.2 47.7 42.2 5.5 40.1 100.0
¡¡
11.3 48.7 43.1 5.6 40.0 100.0
11.3 48.6 43.0 5.6 40.1 100.0
¡¡ ¡¡ ¡¡ ¡¡ ¡¡ ¡¡ ¡¡
;
proc reg;
model Y=X1-X5;
model Y=X1-X5/selection=stepwise;
run;
(2)输出的结果:
(3)结果的分析
可以看出该模型明显优于第一步和第二步得到的回归模型,因为R平方接近于1,且C(P)统计量有了显著的下降。
此时得到的回归模型是:
Y=653.89241+0.8982X1+1.24728X2+0.82709X4
由模型的参数估计及相应的P值可以得到,X1,X2,X4这三个变量对Y的影响是显著的。
参考文献:
【1】国家统计局中国统计年鉴-2007【M】中国统计出版社 2007
【2】高惠璇《应用多元统计分析》【M】北京大学出版社 2005.01。