当前位置:文档之家› 第三章 多元线性回归模型(Stata)

第三章 多元线性回归模型(Stata)

一、邹式检验(突变点检验、稳定性检验)1.突变点检验1985—2002年中国家用汽车拥有量(t y ,万辆)与城镇居民家庭人均可支配收入(t x ,元),数据见表6.1。

表6.1 中国家用汽车拥有量(t y )与城镇居民家庭人均可支配收入(t x )数据年份 t y (万辆)tx (元)年份 t y (万辆)tx (元)1985 28.49 739.1 1994 205.42 3496.2 1986 34.71 899.6 1995 249.96 4283 1987 42.29 1002.2 1996 289.67 4838.9 1988 60.42 1181.4 1997 358.36 5160.3 1989 73.12 1375.7 1998 423.65 5425.1 1990 81.62 1510.2 1999 533.88 5854 1991 96.04 1700.6 2000 625.33 6280 1992 118.2 2026.6 2001 770.78 6859.6 1993155.77 2577.4 2002968.98 7702.8下图是关于t y 和t x 的散点图:从上图可以看出,1996年是一个突变点,当城镇居民家庭人均可支配收入突破4838.9元之后,城镇居民家庭购买家用汽车的能力大大提高。

现在用邹突变点检验法检验1996年是不是一个突变点。

H0:两个字样本(1985—1995年,1996—2002年)相对应的模型回归参数相等H1:备择假设是两个子样本对应的回归参数不等。

在1985—2002年样本范围内做回归。

在回归结果中作如下步骤(邹氏检验):1、Chow 模型稳定性检验(lrtest)用似然比作chow检验,chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的估计结果保存为All* 用似然比检验检验结构没有发生变化的约束得到结果如下;(如何解释?)2.稳定性检验(邹氏稳定性检验)以表6.1为例,在用1985—1999年数据建立的模型基础上,检验当把2000—2002年数据加入样本后,模型的回归参数时候出现显著性变化。

* 用F-test作chow间断点检验检验模型稳定性* chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的估计结果保存为All* 用F 检验检验结构没有发生变化的约束*计算和显示 F 检验统计量公式,零假设:无结构变化然后 dis f_test 则 得到结果;* F 统计量的临界概率然后 得到结果* F 统计量的临界值然后 得到结果(如何解释?)二、似然比(LR )检验有中国国债发行总量(t DEBT ,亿元)模型如下:0123t t t t t DEBT GDP DEF REPAY u ββββ=++++其中t GDP 表示国内生产总值(百亿元),t DEF 表示年财政赤字额(亿元),t REPAY 表示年还本付息额(亿元)。

1980—2001年数据见表6.2。

表6.2国债发行总量t DEBT 、t GDP 、财政赤字额t DEF 、年还本付息额(t REPAY )数据1980 43.01 45.178 68.9 28.58 1991461.4216.178 237.14 246.8 1981 121.74 48.624 -37.38 62.89 1992 669.68266.381 258.83 438.57 1982 83.86 52.947 17.65 55.52 1993 739.22 346.344293.35 336.22 1983 79.41 59.345 42.57 42.47 1994 1175.25 467.594574.52 499.36 1984 77.34 71.71 58.16 28.91995 1549.76 584.781581.52882.961985 89.8589.644-0.57 39.56 1996 1967.28 678.846 529.56 1355.03 1986 138.25 102.02282.950.17 1997 2476.82 744.626 582.42 1918.37 1987 223.55 119.625 62.8379.83 1998 3310.93 783.452922.23 2352.921988 270.78 149.283 133.97 76.76 1999 3715.03 820.6746 1743.59 1910.53 1989 407.97 169.092 158.88 72.37 2000 4180.1 894.422 2491.27 1579.82 1990 375.45 185.479 146.49 190.07 20014604959.333 2516.54 2007.73对以上数据进行回归分析:得到以下结果:对应的回归表达式为:4.310.35 1.000.88t t t t DEBT GDP DEF REPAY =+++(0.2) (2.2) (31.5) (17.8)20.999, 2.1,5735.3R DW F ===现在用似然比(LR )统计量检验约束t GDP 对应的回归系数1β等于零是否成立。

(现在不会)三、Wald 检验(以表6.2为例进行Wald 检验,对输出结果进行检验。

)检验过程如下:1. 已知数据如表3.2(1) :0111i i i Y X u αα=++ 0222i i i Y X u λλ=++ 01122i i i i Y X X u βββ=+++(2) 回答下列问题:11αβ=吗?为什么?22λβ=吗?为什么?对上述3个方程进行回归分析,结果分别如下:0111i i i Y X u αα=++得到结果如下:0222i i i Y X u λλ=++得到结果如下:从上述回归结果可知:11ˆˆαβ≠,22ˆˆλβ≠。

二元回归与分别对1X 与2X 所作的一元回归,其对应的参数估计不相等,主要原因在于1X 与2X 有很强的相关性。

其相关分析结果如下:可见,两者的相关系数为0.9679。

01122i i i i Y X X u βββ=+++得到结果如下:3. 表3.3列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。

年份 Y/千克X/元 P 1/(元/千克)P 2/(元/千克)P 3/(元/千克)年份 Y/千克 X/元 P 1/(元/千克) P 2/(元/千克)P 3/(元/千克)1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 4593.955.537.921995 4.01 11655.8312.3514.291984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 22586.64 14.10 22.16 1990 4.04 768 3.867.32 10.61 2002 5.29 24787.0416.8223.261991 4.03 8433.986.7810.48(1) 求出该地区关于家庭鸡肉消费需求的如下模型:01213243ln ln ln ln ln Y X P P P u βββββ=+++++(2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。

先做回归分析,过程如下:依次生成变量 lnvar2 lnvar3 lnvar4 lnvar5 lnvar6回归结果如下:所以,回归方程为:123ln 0.73150.3463ln 0.5021ln 0.1469ln 0.0872ln Y X P P P =-+-++(-2.463) (4.182) (-4.569) (1.483) (0.873)由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显著。

(AIC 和SC 准则不会算)去掉猪肉价格P 2与牛肉价格P 3重新进行回归分析。

得出结果如下:(AIC 和SC 准则不会算)2.某硫酸厂生产的硫酸的透明度指标一直达不到优质要求,经分析透明度低与硫酸中金属杂质的含量太高有关。

影响透明度的主要金属杂质是铁、钙、铅、镁等。

通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。

测量了47组样本值,数据见表3.4。

表3.4 硫酸透明度y与铁杂质含量x数据序数X Y 序数X Y1 31 190 25 60 502 32 190 26 60 413 34 180 27 61 524 35 140 28 63 345 36 150 29 64 406 37 120 30 65 257 39 110 31 69 308 40 81 32 74 209 42 100 33 74 4010 42 80 34 76 2511 43 110 35 79 3012 43 80 36 85 2513 48 68 37 87 1614 49 80 38 89 1615 50 50 39 99 2016 52 70 40 76 2017 52 50 41 100 2018 53 60 42 100 2019 54 44 43 110 1520 54 54 44 110 1521 56 48 45 122 2722 56 50 46 154 2023 58 56 47 210 2024 58 52硫酸透明度与铁杂质含量的散点图如下:得到以下结果:所以应该建立非线性回归模型。

相关主题