当前位置：文档之家› 第三章-K元线性回归模型

第三章-K元线性回归模型

第三章 K 元线性回归模型一、填空题1. 对于模型i ik k i i i u X X X Y +++++=ββββΛ22110，i=1,2,…,n ，一般经验认为，满足模型估计的基本要求的样本容量为_ _2. 对于总体线性回归模型i i i i i u X X X Y ++++=3322110ββββ，运用最小二乘法欲得到参数估计量，所要求的最小样本容量n 应满足或至少_________。

3. 多元线性计量经济学模型的矩阵形式，对应的样本线性回归模型的矩阵形式，模型的最小二乘参数估计量及其方差估计量。

4. 总平方和可以分解为回归平方和和残差平方和，可决系数为。

5. 多元回归方程中每个解释变量的系数β（偏回归系数），指解释变量变化一个单位引起的被解释变量平均变化 β 个单位。

6. 线性模型的含义，就变量而言，指的是回归模型变量的；就参数而言，指的是回归模型中参数的。

通常线性回归模型指的是。

二、问答题1．什么是多元回归模型？它与一元、二元回归模型有何区别？ 2．极大似然法（maximum likehood ）的原理是什么？ 3．什么是拟合优度（R 2）检验？有什么作用？指对样本回归直线与样本观测值之间的拟合程度的检验。

4．可决系数R 2低的可能的原因是什么？5．多元回归的判断系数R 2具有什么性质？运用R 2时应注意什么问题？6．多元线性回归模型的基本假设是什么？试说明在证明最小二乘估计量的无偏性和有效性的过程中，哪些基本假设起了作用？ 7．说明区间估计的含义。

三、实践题1．下表给出三变量模型的回归结果：方差来源平方和（SS ）自由度（d.f.）均方差(MSS) 回归平方和(ESS) 65965 3 21988.33残差平方和(RSS) 77 11 7 总平方和(TSS)66042144717.48要求：（1）样本容量是多少？（2）求RSS ？（3）ESS 和RSS 的自由度各是多少？（4）求2R 和2R ？（5）检验假设：1X 和2X 对Y 无影响。

你用什么假设检验？为什么？（6）根据以上信息，你能否确定1X 和2X 各自对Y 的贡献吗？2．下面给出依据15个观察值计算得到的数据，其中小写字母代表了各值与其样本均值的离差。

693.367=Y ， 760.4021=X ，0.82=X ，269.660422=∑i y096.8485521=∑ix，0.28022=∑ix，346.747781=∑ii xy9.42502=∑ii xy ，0.479621=∑ii x x要求：（1）估计三个多元回归系数；（2）估计它们的标准差；并求出2R 与2R ？（3）估计1β、2β95%的置信区间；（4）在%5=α下，检验估计的每个回归系数的统计显著性（双尾检验）；（5）给出方差分析表。

（1）3．考虑以下方程（括号内为估计标准差）：19=n ，873.02=R(0.658) (0.072) (0.080) 560.2004.0364.0562.8ˆ1tt t i U P P W -++=-其中：W —t 年的每位雇员的工资和薪水；P —t 年的物价水平；U —t 年的失业率。

要求：（1）对个人收入估计的斜率系数进行假设检验；（2）讨论1-t P 在理论上的正确性，对本模型的正确性进行讨论；1-t P 是否应从方程中删除？为什么？4．克莱因和戈德伯格曾用1921-1941年与1945-1950年（1942-1944年战争期间略去）美国国内消费C 和工资收入W 、非工资—非农业收入P 、农业收入A 的共27年时间序列资料，利用普通最小二乘法估计得出了下列回归方程：(1.09)(0.452) (0.17) (8.92) 121.0452.0059.1133.8t t t t A P W C +++=，107.37F ,95.02==R式中括号中的数字为相应参数估计量的标准误。

试对该模型进行评价，指出其中存在的问题。

（显著性水平%5=α，已知069.2)23( t ,03.3)23,3(0.02505.0==F ）5．某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为fedu medu sibs edu 210.0131.0094.036.10++-=，R 2=0.214式中，edu 为劳动力受教育年数，sibs 为该劳动力家庭中兄弟姐妹的个数，medu 与fedu 分别为母亲与父亲受到教育的年数。

问（1）sibs 是否具有预期的影响？为什么？若medu 与fedu 保持不变，为了使预测的受教育水平减少一年，需要sibs 增加多少？（2）请对medu 的系数给予适当的解释。

（3）如果两个劳动力都没有兄弟姐妹，但其中一个的父母受教育的年数为12年，另一个的父母受教育的年数为16年，则两人受教育的年数预期相差多少？6．以企业研发支出（R&D ）占销售额的比重为被解释变量（Y ），以企业销售额（X1）与利润占销售额的比重（X2）为解释变量，一个有32个企业的样本估计结果如下：099.0,)046.0()22.0()37.1(05.0)log(32.0472.0221=++=R X X Y其中括号中为系数估计值的标准差。

（1）解释log(X1)的系数。

如果X1增加10%，估计Y 会变化多少个百分点？这在经济上是一个很大的影响吗？（2）针对R&D 强度随销售额的增加而提高这一备择假设，检验它不虽X1而变化的假设。

分别在5%和10%的显著性水平上进行这个检验。

（3）利润占销售额的比重X2对R&D 强度Y 是否在统计上有显著的影响？（3）对X2，参数估计值的t 统计值为0.05/0.46=1.087，它比在10%的显著性水平下的临界值还小，因此可以认为它对Y 在统计上没有显著的影响。

7．下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值（括号内为p-值）（如果某项为空，则意味着模型中没有此变量）。

数据为美国40个城市的数据。

模型如下：μββββββββ++++++++=statetax localtax unemp popchangincome value density g hou 76543210sin式中housing ——实际颁发的建筑许可证数量，density ——每平方英里的人口密度，value ——自由房屋的均值（单位：百美元），income ——平均家庭的收入（单位：千美元），popchang ——1980~1992年的人口增长百分比，unemp ——失业率，localtax ——人均交纳的地方税，statetax ——人均缴纳的州税变量模型A 模型B 模型C 模型D C 813 (0.74) -392 (0.81) -1279 (0.34) -973 (0.44) Density0.075 (0.43)0.062 (0.32)0.042 (0.47)Value -0.855 (0.13) -0.873 (0.11) -0.994 (0.06) -0.778 (0.07) Income 110.41 (0.14) 133.03 (0.04) 125.71 (0.05) 116.60 (0.06) Popchang 26.77 (0.11) 29.19 (0.06) 29.41 (0.001) 24.86 (0.08) Unemp -76.55 (0.48) Localtax -0.061 (0.95)Statetax -1.006 (0.40) -1.004 (0.37) RSS 4.763e+7 4.843e+7 4.962e+7 5.038e+7 R 20.349 0.338 0.322 0.312 e S1.488e+6 1.424e+6 1.418e+6 1.399e+6 AIC1.776e+61.634e+61.593e+61.538e+6（1）检验模型A 中的每一个回归系数在10%水平下是否为零（括号中的值为双边备择p-值）。

根据检验结果，你认为应该把变量保留在模型中还是去掉？（2）在模型A 中，在10%水平下检验联合假设H 0：βi =0(i=1,5,6,7)。

说明被择假设，计算检验统计值，说明其在零假设条件下的分布，拒绝或接受零假设的标准。

说明你的结论。

（3）哪个模型是“最优的”？解释你的选择标准。

（4）说明最优模型中有哪些系数的符号是“错误的”。

说明你的预期符号并解释原因。

确认其是否为正确符号。

参考答案一、填空题1.n≥30或至少n≥3（k+1）；2. n≥30或至少n≥24；3.u X Y +=β，e Xb Y +=，Y X X X b ''=-1)(，12)()(-'=ii u X X b Var σ; 4.回归平方和；残差平方和；回归平方和与残差平方和之比。

5. β ；6.非线性；非线性；变量非线性而参数为线性。

二、问答题1. 答：回归模型与一元线性回归模型的区别表现在如下几方面：一是解释变量的个数不同；二是模型的经典假设不同，多元线性回归模型比一元线性回归模型多了“解释变量之间不存在线性相关关系”的假定；三是多元线性回归模型的参数估计式的表达更复杂。

2. 答：极大似然法（ML ）是不同于OLS 法的另一种模型参数估计方法。

ML 方法需要利用有关模型随机扰动项分布的知识构建似然函数，然后利用使似然函数最大的方法得出参数估计。

其基本思路是确定观察到的样本数据最可能来自某个分布，该分布的参数值即为总体参数的估计量。

3. 答：所谓拟合优度检验，指对样本回归直线与样本观测值之间拟合程度的检验。

如果所有的观测值都落在回归线上，称为“完全拟合”。

这种情况很少发生。

一般情况下，总会出现围绕在回归直线周围的正或负的残差。

通过对残差的分析，有助于衡量回归直线与样本观察值的拟合程度。

反映回归模型拟合优劣的一个数量指标是样本可决系数R 2，也称判定系数。

另一个是对回归模型的F 统计检验。

估计方程的目的常常不是为了获得高R 2，而是要得到可靠的参数估计，以便利用估计结果进行统计推断。

注意不要将判断系数作为评价模型优劣的唯一标准。

4. 答：可能由于：X 不是Y 的良好解释变量；模型形式设定有误。

一般地，利用时间序列数据估计的模型R 2值较高，而利用截面数据估计的模型R 2值较低。

5. 答：R 2的取值取决在0～1之间。

若Y 的全部变异都得到了解释，则R 2=1，若解释变量没有如何解释能力，有R 2=0。

在模型中不包含常数项的情况下，R 2的值可能超出0～1范围；是解释变量的非减函数，即增加解释变量不会降低R 2，在大多数情况下，R 2会增大。

e商务文档

第三章-K元线性回归模型

相关文档推荐：