第四章上机习题C4.1 如下模型可以用来研究竞选支出如何影响选举结果:()()u prtystrA endB endA voteA ++++=3210ex p ln ex p ln ββββ其中,voteA 表示候选人A 得到的选票百分数,endA exp 和endB exp 表示候选人A 和B 的竞选支出,而则是对A 所在党派实力的一种度量(A 所在党派在最近一次总统选举中获得的选票百分比)。
(1)如何解释1β?解 在回归方程()()u prtystrA endB endA voteA ++++=3210ex p ln ex p ln ββββ中,保持()endB ex p ln 、prtystrA 不变,可得:().ex p ln 1endA voteA ∆=∆β因为()endA endA ex p %ex p ln 100∆≈∆⋅,所以()()()()()()endA endA endA voteA exp %100exp ln 100100exp ln 111∆⋅≈∆⋅⋅=∆=∆βββ 所以1001β表示当endA exp 变动%1时vote 变动多少个百分点。
注意:100%112⋅-=∆x x x x ,x ∆%表示x 的百分数变化。
(2)用参数表示如下虚拟假设:A 的竞选支出提高%1被B 的竞选支出提高%1所抵消。
解 虚拟假设可以表示为210:ββ-=H 或者0:210=+ββH(3)利用RAW VOTE .1中的数据估计上述模型,并以通常的方式报告结论。
A 的竞选支出或影响结果吗?B 的竞选支出呢?你能用这些结论来检验第(2)部分中的假设吗?解 估计方程为()()()()793.0,14.10052,173062.0379.0382.0926.3152.0)ln(exp 615.6)ln(exp 083.6079.452===+-+=∧R SSR n prtystrA endB endA voteA从回归结果可知,()endA ex p ln 的系数估计值等于6.083,标准误等于0.382,t 统计量为15.919,p 值为0.0000。
()endB ex p ln 的系数估计值等于-6.615,标准误等于0.379,t 统计量为-17.463,p 值为0.0000。
由此可以看出()endA ex p ln 和()endB ex p ln 的斜率系数在非常小的显著性水平下都是统计上显著异于零,所以A 的竞选支出和B 的竞选支出都会影响竞选结果。
在保持其他因素不变的情况下,若A 的竞选支出增加%10,则A 得到的选票百分数将提高约0.608个百分点;若B 的竞选支出增加%10,则A 得到的选票百分数将下降约0.662个百分点.从以上叙述中我们知道,∧1β和∧2β的符号相反且都符合预期,重要程度相当,但是我们不能根据这些结论得出∧∧+21ββ的标准误差,也就不能计算相应的t 统计量,所以不能用这些结论来检验(2)中的假设。
(4)估计一个模型,使之能直接给出检验第(2)部分中假设所需要的t 统计量。
你有什么结论?(使用双侧对立假设)解 令21ββθ+=,则21βθβ-=,把它代入原始的回归方程可得: ()()()()u prtystrA endA endB endA voteA ++-++=320ex p ln ex p ln ex p ln ββθβ 利用RAW VOTE .1的数据重新估计以上方程,得到的估计方程为()()()()()()()()793.0,14.10052,173062.0379.0533.0926.3152.0exp ln exp ln 615.6exp ln 532.0079.452===+---=∧R SSR n prtystrAendA endB endA voteA 从回归结果可知,532.0-=∧θ,533.0=⎪⎭⎫ ⎝⎛∧θse ,∧θ的t 统计量为-0.998,p 值为0.3196,所以对θ所做的估计在%5的显著性水平下是不显著的,我们不能在%5的显著性水平上拒绝虚拟假设0:210=+ββH 。
比较(3)和(4)可以看到:两估计方程截距、prtystrA 的斜率估计值及其标准误都是相同的,(4)中新变量()endB ex p ln -()endA ex p ln 的系数和标准误与(3)中()endB ex p ln 的系数和标准误相同,两估计方程的SSR ,2R 都是相同的。
此外,(3)中的∧1β也可以根据∧2β和∧θ计算得出。
C4.2 本题要用到RAW LAWSCH .85中的数据。
(1)使用与习题3.4一样的模型,表述并检验虚拟假设:在其他条件不变的情况下,法学院排名对起薪中位数没有影响。
解 由题意可知,我们构造回归模型如下()()()u t libvol gpa lsat rank salary ++++++=cos ln ln ln 543210ββββββ则虚拟假设可以表述为0:10=βH利用RAW LAWSCH .85的数据可得估计方程为()()()()()()()()()842.0,1360321.00333.0cos ln 0376.0ln 0950.0090.000401.0000348.0533.0248.000470.000333.0343.8ln 2==++++-=∧R n t libvol gpa lsat rank salary从回归结果可以看出,rank 斜率估计值00333.01-=∧β,000348.01=⎪⎭⎫ ⎝⎛∧βse ,t 统计量为-9.541,p 值等于0.0000,由此可知rank 即使是在很小的显著性水平上也是统计显著的,所以我们完全有理由拒绝0H 。
(2)新生年级的学生特征(gpa lsat ,)对解释salary 而言是个别或者联合显著的吗?解 从(1)的估计方程可知,lsat 的t 统计量为1.171,p 值等于0.2437;gpa 的t 统计量为2.749,p 值等于0.0068。
所以在%5的显著性水平上只有gpa 是个别显著的。
为了说明gpa lsat ,是不是联合显著的,我们做如下的虚拟假设:0,0:320==ββH其对立假设为不全为零321,:ββH 。
(1)已经给出了不受约束模型的估计方程,受约束模型的估计方程如下:()()()()()()()822.0,1410295.00325.0000298.0343.0cos ln 0265.0ln 129.000417.0880.9ln 2==++-=∧R n t libvol rank salary两个模型的样本容量不同,是由gpa lsat ,的数据缺失造成的。
不受约束模型中841.02=ur R ,受约束模型的822.02=r R ,136=n ,5=k ,2=q ,由此可得: ()()()767.72130841.01822.0841.011222≈⋅--=----=k n R q R R F ur r ur 分子自由度为2,分母自由度为130,显著性水平为%5的F 统计量的临界值为 3.00,,所以gpa lsat ,在%5的显著性水平上是联合显著的。
(3)检验要不要在方程中引入入学年级的规模(clsize )和教职工的规模(faculty );只进行一个检验。
解 回归模型如下()()()u faculty clsize t libvol gpa lsat rank salary ++++++++=76543210cos ln ln ln ββββββββ再次利用RAW LAWSCH .85的数据得到其估计模型为()()()()()()()()()()()844.0,13100040.0000154.00347.00404.00000675.0000134.0cos ln 0296.0ln 0552.00932.000418.0000357.0552.0266.000558.000343.0416.8ln 2==++++++-=∧R n faculty clsize t libvol gpa lsat rank salary 回归样本容量为131,这是受到clsize 和faculty 数据缺失的影响。
从回归结果可知,clsize 和faculty 的t 统计量的值分别为0.875、0.169,p 值分别为0.383、0.866。
由此可知,在%5,甚至是%10的显著性水平上clsize 和faculty 在统计上都不显著。
以(1)中的模型为受约束模型,本题中的模型为不受约束模型,就可以检验clsize 和faculty 的联合显著性了。
844.02=ur R ,受约束模型的842.02=r R ,131=n ,7=k ,2=q ,由此可得: ()()()788.02123844.01842.0844.011222≈⋅--=----=k n R q R R F ur r ur 分子自由度为2,分母自由度为123,显著性水平为%5的F 统计量的临界值为3.00,,gpa lsat ,在%5的显著性水平上是联合显著的,所以不应该把clsize 和faculty 放进模型中。
(4)还有哪些因素可能影响到法学院排名,但又没有被包括在薪水回归中?解 教师质量、性别差异、种族差异、学生能力测试成绩等。
C4.3 参考习题3.14,现在我们使用住房价格的对数作为因变量:()u bdrms sqrft price +++=210ln βββ(1)你想在住房增加一个150平方英尺的卧室的情况下,估计并得到price 变化百分比的一个置信区间。
以小数形式表示就是211150ββθ+=。
使用RAW HPRICE .1中的数据去估计1θ。
解 使用RAW HPRICE .1中的数据得到估计方程为()()()()588.0,3.3,880296.00000432.0097.00289.0000379.0766.4ln 2===++=∧R SSR n bdrms sqrft price 由以上回归结果可知,000379.01=∧β,0289.02=∧β,所以08575.0289.0000379.01501=+⨯=∧θ 这意味着增加一个150平方英尺的卧室的情况下,price 预期大约增长%6.8。
(2)用1θ和1β表达2β,并代入()price ln 的方程。
解 112211150150βθβββθ-=⇒+=,代入方程可得:()()()ubdrms bdrms sqrft ubdrms sqrft price ++-+=+-++=1101110150150ln θβββθββ(3)利用第(2)步中的结果得到∧1θ的标准误,并使用这个标准误构造一个%95的置信区间。