第一章习题1.1变量间统计关系和函数关系的区别是什么?1.2回归分析与相关分析的区别和联系是什么?1.3回归模型中随机误差项的意义是什么?1.4线性回归模型中的基本假设是什么?1.5回归变量设置的理论依据是什么?在设置回归变量时应注意哪些问题?1.6收集、整理数据包括哪些基本内容?1.7构造回归理论模型的基本依据是什么?1.8为什么要对回归模型进行检验?1.9回归模型有哪几个方面的应用?1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?第二章 习题2.1一元线性回归模型有哪些基本假定? 2.2 考虑过原点的线性回归模型1,1,,i i i y x i n βε=+=误差1,,n εε仍满足基本假定。
求1β的最小二乘估计。
2.3证明(2.27)式,10nii e==∑,10ni i i x e ==∑。
2.4回归方程01Ey x ββ=+的参数01,ββ的最小二乘估计与极大似然估计在什么条件下等价?给出证明。
2.5 证明0ˆβ是0β的无偏估计。
2.6 证明(2.42)式 ()()222021,i x Var n x x βσ⎡⎤=+⎢⎥-⎢⎥⎣⎦∑成立 2.7 证明平方和分解式SST SSR SSE =+2.8 验证三种检验的关系,即验证:(1)t ==(2)2212ˆ1ˆ2xx L SSR F t SSE n βσ===-2.9 验证(2..63)式:()()221var 1i i xx x x e n L σ⎡⎤-=--⎢⎥⎢⎥⎣⎦2.10 用第9题证明()2211ˆˆ2n i ii y y n σ==--∑是2σ的无偏估计。
2.11* 验证决定系数2r 与F 值之间的关系式 22Fr F n =+-以上表达式说明2r 与F 值是等价的,那么我们为什么要分别引入这两个统计量,而不是只使用其中的一个。
2.12* 如果把自变量观测值都乘以2,回归参数的最小二乘估计0ˆβ和1ˆβ会发生什么变化?如果把自变量观测值都加上2,回归参数的最小二乘估计0ˆβ和1ˆβ会发生什么变化? 2.13 如果回归方程01ˆˆˆy x ββ=+相应的相关系数r 很大,则用它预测时,预测误差一定较小。
这一结论成立吗?请说明理由。
2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y (万元)和广告(1) 画散点图(2) X 与y 之间是否大致成线性关系 (3) 用最小二乘估计求出回归方程(4)求回归标准误差ˆσ(5) 给出0ˆβ与1ˆβ的置信度为95%的区间估计 (6) 计算x 与y 的决定系数(7) 对回归方程作方差分析 (8) 做回归系数1β显著性的检验(9) 做相关系数的显著性检验(10) 对回归方程做残差图并作相应的分析(11) 求当广告费用为4.2万元时,销售收入将达到多少,并给出置信度95%的置信区间 2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。
经过10周时间,收集了每周加班工作时间的数据和签发的新保单数目,x 为每周签发的新保单数目,(1) 画散点图(2) X 与y 之间是否大致成线性关系? (3) 用最小二乘估计求出回归方程(4)求回归标准误差ˆσ(5) 给出0ˆβ与1ˆβ的置信度为95%的区间估计 (6) 计算x 与y 的决定系数(7) 对回归方程作方差分析 (8) 做回归系数1β显著性的检验 (9) 做相关系数的显著性检验(10) 对回归方程做残差图并作相应的分析(11)该公司预计下一周签发新保单01000x ,需要的加班时间是多少。
(12)给出y的置信度为95%的精确预测区间和近似预测区间。
(13)给出Ey的置信度为95%的区间估计。
2.16* 表2.8 是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和对学生的人均经费收入x(美元)。
(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?(2)建立y对x的线性回归。
(3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。
第三章 习题3.1 写出多元线性回归模型的矩阵表示形式,并给出多元线性回归模型的基本假设。
3.2 讨论样本量n 与自变量个数p 的关系,它们对模型的参数估计有何影响?3.3 证明21ˆ1SSE n p σ=--是误差项方差2σ的无偏估计。
3.4 一个回归方程的复相关系数R=0.99,样本决定系数20.9801R =,我们能判断这个回归方程就很理想吗?3.5 如何正确理解回归方程显著性检验拒绝0H 或接受0H ? 3.6 数据中心化和标准化在回归分析中的意义是什么? 3.7 验证(3.52)式*ˆˆ,1,,jjj p ββ==3.8 利用(3.60)式证明(3.61)式成立,即12;3r =3.9 证明y 与自变量j x 的偏决定系数与(3.42)式的偏F 检验值j F 是的等价的。
3.10* 验证决定系数与F 值之间的关系式 ()21FR F n p p=+--3.11 研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的关系。
数据见表3.9。
(1)计算出y ,1x ,2x ,3x 的相关系数矩阵。
(2)求y 关于1x ,2x ,3x 的三元线性回归方程。
(3)对所求得的方程作拟合优度检验。
(4)对回归方程作显著性检验。
(5)对每一个回归系数作显著性检验。
(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验。
(7)求出每一个回归系数的置信水平位95%的置信区间。
(8)求标准化回归方程。
(9)求当01020375,42, 3.1x x x ===时的0ˆy,给定置信水平为95%,用SPSS 软件计算精确置信区间,用手工计算近似预测区间。
(10)结合回归方程对问题做一些基本分析。
3.12* 用表 3.10的数据,建立GDP 对1x ,2x 的回归。
对得到的二元回归方程12ˆ2914.60.607 1.709yx x =++,你能够合理的解释两个回归系数吗?如果现在不能给出合理的解释,不妨在学过第6章多重共线性后再来解释这个问题,在学过第七章岭回归后再来改进这个问题。
第四章 习题4.1 试举例说明产生异常差的原因。
4.2 异常差性带来的后果有哪些?4.3 阐述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
4.4 阐述用加权最小二乘法消除多元线性回归中异常差性的思想与方法。
4.5 验证(4.5)式一元加权最小二乘回归系数估计公式。
4.6 验证(4.8)式多元加权最小二乘回归系数估计公式。
4.7 有同学认为当数据存在异常差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异常差越严重,两者之间的差异就越大。
你是否同意这位同学的观点?说明原因。
4.8 对例4.3的数据,用公式iw iw e '=计算出加权变换残差iwe ',绘制加权变换残差图,根据绘制出的图形说明加权最小二乘回归估计的效果。
4.9 参见参考文献[2],表4.11是用电高峰每小时用电量y 与每月总用电量x 的数据。
(1)用普通最小二乘法建立y 与x 的回归方程,并画出残差散点图。
(2)诊断该问题是否存在异常差。
(3)如果存在异常差,用幂指数型的权函数建立加权最小二乘回归方程。
(4)用方差稳定性变换y '=4.10 试举一可能产生随机误差项系列相关的经济例子。
4.11 序列相关性带来的严重后果是什么? 4.12 总结DW 检验的优缺点。
4.13 表4.12中是某软件公司月销售额数据,其中,x 为总公司的月销售额数据(万元);y 为某分公司的月销售额(万元)。
(1)用普通最小二乘法建立y 与x 的回归方程。
(2)用残差图及DW 检验诊断序列的自相关性。
(3)用迭代法处理序列相关,并建立回归方程。
(4)用一阶差分法处理数据,并建立回归方程。
(5)比较以上各方法所建回归方程的优良性。
4.14* 某乐队经理研究其乐队CD 盘的销售额(y ),两个有关的影响变量是每周演出场次1x 和乐队网站的周点击率2x ,数据见表4.13.(1)用普通最小二乘法建立y 与1x ,2x 的回归方程,用残差图及DW 检验诊断序列的自相关性。
(2)用迭代法处理序列相关,并建立回归方程 (3)用一阶差分法处理数据,并建立回归方程。
(4)比较以上各方法所建回归方程的优良性。
4.15 说明引起异常值的原因和消除异常值的方法。
4.16 对第三章思考与练习第11题做异常值检验。
5.1 自变量选择对回归参数的估计有何影响? 5.2 自变量选择对回归预测有何影响?5.3 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣? 5.4 试述前进法的思想、方法。
5.5试述后退法的思想、方法。
5.6 前进法、后退法各有哪些优缺点? 5.7 试述逐步回归法的思想、方法。
5.8 在运用逐步回归法时,α进与α出的赋值原则是什么?如果希望回归方程中多保留一些自变量,α进应如何赋值?5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。
为了建立国家财政收入回归模型,我们以财政收入y (亿元)为因变量,自变量如下:1x 为农业增加值(亿元);2x 为工业增加值(亿元);3x 为建筑业增加值(亿元);4x 为人口数(万人);5x 为社会消费总额(亿元);6x 为受灾面积(万公顷)。
据《中国统计年鉴》获得1978-1998年共21个年份的统计数据,见表5.5。
由定性分析知,所选自变量与变量y 有较强的相关性,分别用后退法和逐步回归法做自变量选元。
5.10* 表5.6的数据时1968-1983年间美国与电话线制造有关的数据,各变量的含义如下:1x ——年份;2x ——国民生产总值(10亿美元); 3x ——新房动工数(单位:1000); 4x ——失业率(%);5x ——滞后6个月的最惠利率; 6x ——用户用线增量(%);y ——年电话线销量(百万尺双线);(1) 建立y 对的线性回归方程。
(2) 用后退法选择自变量。
(3) 用逐步回归法选择自变量。
(4) 根据以上计算结果分析后退法与逐步回归法的差异。
6.1 试举一个产生多重共线性的经济实例。
6.2 多重共线性对回归参数的估计有何影响?6.3 具有严重多重共线性的回归方程能否用来作经济预测?6.4 多重共线性的产生与样本量的个数n、自变量个数p有无关系?6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?6.6 对第5章思考与练习第9题财政收入的数据,分析数据的多重共线性,并根据多重共线性剔除变量,将所得结果与用逐步回归法所得的选元结果相比较。