当前位置:文档之家› 第3章计算机习题答案

第3章计算机习题答案

第3章 多元回归分析:估计C3.1 使用数据bwght.dta(i)β2的符号应该为正,更高的收入一般意味着母亲有更好的营养和更好的产前照顾。

(ii)一方面,收入增加通常会增加对物品的消费,所以cigs 和faminc 正相关。

另一方面,高收入家庭会有更高的教育水平,而教育水平与吸烟数量可能是负相关的。

Cigs 和faminc 这两个变量的样本相关系数是-0.173,这显示它们是负相关的。

(iii)包含faminc 和不包含faminc 的回归结果分别是2ˆ119.770.5141388,0.023bwghtcigs n R =-==和2ˆ116.970.4630.093min 1388,0.030bwghtcigs fa c n R =-+==当faminc 被加入回归后,吸烟数量对婴儿体重的效应轻微缩小了,与未加入faminc 的回归相比,cigs 的系数仅仅从-0.514上升到-0.463,因此cigs 对bwght 的影响并没有发生实质差别。

这是因为cigs 和faminc 相关性较小,faminc 的系数实际上也是比较小的。

(变量faminc 的衡量单位是千美元,因此以1988年美元计算的收入每增加10000美元,婴儿体重的预测值仅仅增加0.93盎司。

)C3.2 使用数据hprice1.dta(i)估计方程是2ˆ19.320.12815.2088,0.632pricesqrft bdrms n R =-++==(ii)保持住房平方尺数不变,ˆ15.20pricebdrms ∆=∆,所以ˆprice 会增加15.20,即15200美元。

(iii)现在ˆ0.2815.200.12814015.2033.12price sqrft bdrms ∆=∆+∆=⨯+=,或者说33120美元。

因为房子的面积增加了,这个效应比(ii)中的效应大得多。

(iv)大约63.2%。

(v)第1套住房的预测价格是354.605,或者说354605美元。

(vi)残差是-54.605。

这说明买者在某种程度上少支付了一部分钱。

但是,住房的很多其他特征也影响价格,有些因素我们甚至无法量化,我们不能完全控制这些因素。

因此,我们不能说购买者为这套住房支付了过低或过高的价格。

C3.3使用数据ceosal2.dta(i)常弹性方程是2ˆlog() 4.620.162log()0.107log()177,0.299salary sales mktval n R =++==(ii)我们不能把利润的对数形式加入模型是因为样本中有9家企业的利润是负值。

我们在回归模型加入利润的水平形式,可以得到2ˆlog() 4.690.161log()0.098log()0.000036177,0.299salary sales mktval profits n R =+++==Profits 的系数非常小。

这里,profits 的度量单位是百万美元。

所以如果利润增加10亿美元,这意味着1000profits ∆=,这是一个很大的变动,但是预测这个变动只会使salary 增加大约3.6%。

当然,记得我们需要保持sales 和mktval 的值不变。

总体来看,这些变量(我们可以舍去profits ,这并不会有任何不同)只解释了log(salary)的样本变异的大约30%。

这肯定谈不上解释CEO 薪水变异中的“大部分”。

(iii)增加ceoten 后方程变为2ˆlog() 4.560.162log()0.102log()0.0000290.012177,0.318salary sales mktval profits n R =++++==这意味着CEO 每增加1年任期,预测salary 增加大约1.2%。

(iv)Log(mktval)和profits 的样本相关系数是大约0.78,这是相当高的。

我们知道,这不影响OLS 估计量的无偏性,但会使得它的方差变大。

由于市场价值和企业利润有如此高的相关性,回归时加入利润根本无助于解释CEO 的薪水。

而且,profits 是一个短期术语,它衡量了企业当前经营的方式;而mktval 的大小则基于企业过去、当前和预期未来的利润获取能力。

C3.4 使用数据attend.dta(i)这3个变量的最小值、最大值和平均值如下表估计方程是2ˆ75.7017.26 1.72680,0.291atndrtepriGPA ACT n R =+-==这里的截距意味着对一个学生来说,如果他以前学期的GPA 为0,并且他的ACT 成绩也是0,那么预测他的出勤率为75.7%。

很显然这没有什么意义。

(事实上,在大学的总体中,没有任何学生priGPA=0,ACT=0) (iii)priGPA 的系数意味着,如果一个学生以前学期的GPA 提高1个点(如从2.0提高到3.0),出勤率大约会提高17.3个百分点。

上面的结论需要保持ACT 不变。

ACT 的系数为负,也许这有点奇怪。

ACT 提升5个点会在给定priGPA 水平下使得出勤率降低8.6个百分点。

由于priGPA 衡量大学成绩(至少可以部分反映过去的出勤率),而ACT 可以衡量大学潜力,这显示had more promise(这意味着天赋能力更高)的学生认为他们即使上课次数较少也可以通过考试。

(iv)我们有ˆ75.7017.26 3.65 1.7220104.299atndrte=+⨯-⨯=。

当然,一个学生的出勤率不可能超过100%。

当使用存在自然上界和下界的因变量进行回归时经常会得到这样的预测值。

在实践中,我们可以预测这个学生的出勤率为100%。

(实际上,这个学生的出勤率仅为87.5%) (v)对于A 和B 来说,预测出勤率的是22.26.C3.5使用数据wage1.dta用educ 对exper 和tenure 作回归,得到12ˆ13.570.0740.048526,0.101educ exper tenure r n R =-++==现在我们用log(wage)对1ˆr 作回归,得到 12ˆˆlog() 1.620.092526,0.207wage r n R =+==我们得到式(3.19)2log()0.2840.0920.0040.022526,0.316wage educ exper tenure n R =+++==和预期的一样,第二次回归中1ˆr的系数等于式(3.19)中educ 的系数。

注意到第二次回归的R 2小于式(3.19)的R 2。

事实上,对1ˆr的回归仅仅使用educ 中与exper 和tenure 不相关的那部分来解释log(wage)。

C3.6 使用数据wage2.dta(i)用IQ 对educ 的简单回归的斜率系数13.53383δ= (ii)用log(wage)对educ 作回归的斜率系数10.05984β= (iii)用log(wage)对educ 和IQ 做回归的斜率系数分别是1ˆ0.03912β=和2ˆ0.00586β=。

(iv)我们有121ˆˆ0.039120.00586 3.533830.05983ββδ+=+⨯≈ ,它非常接近于0.05984。

C3.7 使用数据meap93(i)回归结果是2ˆ1020.36 6.23log()0.305408,0.180mathexpend lnchprg n R =-+-==斜率系数的符号意味着在给定lnchprg 的情况下,更多的支出将会提高通过率;并且在支出给定的情况下,更高的贫困率(用lnchprg 代表)会降低通过率。

(ii)一般来说,截距是当所有解释变量为0时因变量的预测值。

如果贫困率很低,那么lnchprg=0是可以理解的。

但log(expend)=0是没有道理的,因为此时expend=1,spend 衡量的是每个学生支出的美元数。

显然,这个假设超过了合理范围。

毫不奇怪,此时预测值-20.36是没有意义的。

(iii)这个简单回归的结果是2ˆ1069.3411.16log()408,0.030mathexpend n R =-+==这里估计的支出效应超过第(i)部分,这是值得怀疑的。

(iv)这里lexpend 和lnchprg 之间的样本相关系数是大约-0.19,这意味着,平均来说,贫困学生更多的高中每个学生的支出较少。

这是有道理的,特别是在1933年,密歇根州的学校所需资金完全取决于当地的财产税筹集情况。

(v)我们可以使用式3.23。

因为corr(x 1,x 2)<0,这意味着10δ< ,而且2ˆ0β<,简单回归系数1β 大于多元回归估计量1ˆβ。

直觉上来看,没有考虑贫困率导致对支出效应的过度估计(overestimate)。

C3.8 使用数据discrim.dta(i)样本中prpblck 的平均值约为0.113,标准差约为0.182;income 的平均值为47053.78,标准差为13179.29。

prpblck 的度量单位是比值,income 的单位应是美元。

(ii)回归结果是2ˆ0.9560.1150.0000016401,0.0642psodaprpblck income n R =++==prpblck 的系数的含义是在income 保持不变时,人口中黑人比例如果增加十个百分点(比如从0.20上升到0.30),那么苏打的价格会上升0.0115美元。

这个数字在经济上是个很小的数字。

(iii)回归结果:2ˆ 1.0370.065401,0.0181psodaprpblck n R =+==在控制收入变量后,这种歧视效应更大了。

(iv)常弹性方程的回归结果是:2ˆlog()0.7940.1220.077log()401,0.0681psoda prpblck income n R =-++==若prpblck 提高0.01,即1个百分点,估计会使得psoda 上升0.122%;因此,若prpblck 提高0.20,即20个百分点,估计会使得psoda 上升2.44%。

(v)回归结果是:2ˆlog()0.4630.0730.137log()0.380401,0.0681psoda prpblck income prppov n R =-+++==加入变量prppov 后,ˆprpblck β由0.122下降到0.073,几乎下降了一半。

(vi)Log(income)和prppov 的相关系数大约是-0.84。

大致符合我的预期。

因为prppov 是各邮区的贫困率,显然,若某邮区的贫困率(prppov)较高,则该邮区平均家庭收入的中位数(income)就会较低,进而log(income)也较低。

相关主题