统计学2班
第三次作业
1、⑴存在.2
3223223232
322
)
())(()
)(())((ˆ∑∑∑∑∑∑∑--=i i i i i i i i i i i x x x x x x x y x x y β
当X 2和X 3之间的相关系数为0时,离差形式的
∑i
i x
x
32=0
2
222232
22
322
ˆ)
)(()
)((ˆ∂==
=∴∑∑∑∑∑∑i
i i i
i
i i i x
x y x x x x y β 同理得:33
ˆˆγβ= ⑵2
ˆβ会等于1ˆα和1ˆγ二者的线性组合。
33221ˆˆˆX X Y βββ--= 且221ˆˆX Y αα-=,331ˆˆX Y γγ-= 由⑴可得22
ˆˆαβ=和33ˆˆγβ= 22221ˆˆˆX Y X Y βαα-=-=∴,3
3331ˆˆˆX Y X Y βγγ-=-= 212
ˆˆX Y αβ-=∴,3
1
3ˆˆX Y γβ-= 则:33
1
2213
3221ˆˆˆˆˆX X Y X X Y Y X X Y γαβββ----=--= ⑶存在。
∑-=)
1()ˆ(223
2
22
2
r x
Var i
σβ
X 2和X 3之间相关系数为0,)ˆ()
1()ˆ(2222
223
2
22
2
α
σσβVar x
r x
Var i
i
==
-=∴∑∑ 同理可得)ˆ()ˆ(33
γβVar Var =
2、逐步向前回归和逐步向后回归的程序都存在不足,逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入新的变量,就保留在方程中,逐步向后法泽一旦剔除一个解释变量就再没有机会重新进入方程。
而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而不同。
所以采用逐步回归比较好。
吸收了逐步向前和逐步向后的优点。
3、
Y :商品进口额/亿元 GDP:国内生产总值/亿元CPI :居民消费价格指数(1985年为100)% 建立模型:i t t t CPI GDP Y μβββ+++=ln ln ln 321
估计结果为:t t t CPI GDP Y ln 057053.1ln 656674.1060141.3ln -+-= T (-9.068993) (17.96693) (-4.924595) 992218.02
=R 991440.02
=R F=1275.080 ⑵
居民消费价格指数CPI 的符号不能合理解释。
并且做lnGDP 和lnCPI 的相关系数矩阵可以发现,lnGDP 和lnCPI 之间的相关系数高,存在严重多重共线性。
⑶①i t t GDP A A Y 121ln ln υ++=
t t GDP Y ln 218572.1090659.4ln +-=
T= (-10.64574) (34.62212)
982783.02=R 981963.02=R F=1198.691
②i t t CPI B B Y 221ln ln υ++=
t t CPI Y ln 663789.2442411.5ln +-=
T (-4.341211) (11.68091)
866619.02=R 860267.02=R F=136.4436
③i t t CPI C C GDP 321ln ln υ++=
t t CPI GDP ln 245971.2437984.1ln +-=
T (-1.958231) (16.814)
930855.02=R 927563.02=R F=282.7107
GDP 和CPI 均对Y 有影响,由②可以知道CPI 对Y 也为正向影响,但两个因素同时作用时方
向发生变化。
所以存在严重共线性。
单个方程拟合效果都较好,回归系数显著,可决系数较高。
所以相关关系需要通过相关系数的分析才可以知道。
⑷若仅做预测。
可以不考虑多重共线性。
5、 3
21121.0452.0059.1133.8ˆX X X Y +++= 标准误差:(8.92) (0.17) (0.66) (1.09) 95.02
=R F=107.37
①由题结果可知,数据从1921-1950(略去1942-1944)年。
共计27个。
所以n=27。
在给
定显著性水平α=0.05,查得F 0.05(k-1,n-k )=F 0.05(3,23)=3.028,计算的
F=107.37>F 0.05(3,23)=3.028,可决系数95.02
=R ,表明方程是显著的。
模型整体拟合程度较高。
②由题结果已知标准误差:(8.92) (0.17) (0.66) (1.09),由)ˆ(ˆi
i
i SE t ββ=可以计
算出各回归系数的T 统计量:
91.092.8133.81==
t 23.617.0059.12==t 69.066.0452.03==
t 11.009
.1121
.03==t 在给定显著性水平α=0.05,查得T 0.05(25)=2.06.所以 除X 1(工资收入)外,其余所有
因素均不通过检验。
说明模型中存在严重的多重共线性。
6、Y :能源消费标准煤总量/万吨 X 1:国民总收入/亿元 X 2:国内生产总值/亿元 X 3:工业增加值/亿元 X 4:建筑增加值/亿元 X 5:交通运输邮电业增加值/亿元 X 6:人均生活电力消费/亿元 X 7:能源加工转换效率/% ⑴
建立模型如下:
776655443322110ln ln ln ln ln ln ln ln x x x x x x x y ββββββββ+++++++=
由分析可知:
994234.02=R 991543.02=R F=3694546.
所以总体拟合效果好。
但是同时可以看出6543ln ,ln ,ln ,ln x x x x 所求得参数T 检验所对应的p 值分别为0.7667,0.2375,0.0723.0.3809.在给定显著性水平α=0.05下均不通过检验。
并且532ln ,ln ,ln x x x 的参数估计为负值。
与实际不符。
⑵会。
因为 X 1:国民总收入/亿元 和X 2:国内生产总值/亿元代表了经济发展水平。
具有密切的相关关系。
而X 3:工业增加值/亿元 X 4:建筑增加值/亿元 X 5:交通运输邮电业增加值/亿元 X 6:人均生活电力消费/亿元 X 7:能源加工转换效率/%则可能也具有相关关系。
通过相关关系矩阵。
我们也可以看出654321ln ,ln ,ln ,ln ,ln ln x x x x x x 和间互相具有高度相关。
其相关系数高于0.9。
⑶运用逐步回归法,在α=0.05下得出结果如下。
5
6ln 623276.0ln 344307.188028.10ln x x y -+=
7、⑴
根据相关关系表可以看出解释变量间相关系数高。
农业增长值,工业增长值,建筑业增长值,最终消费间的相关系数均大于0.9.有显著相关关系。
所以会出现本章开始时所出现的异常结果。
⑵尝试采用逐步回归法
得最终结果
(注:可编辑下载,若有不当之处,请指正,谢谢!)。