1、已知回归模型:,为起始薪金(元),为受教育水平(年),为随机干扰分布未知:⑴、的含义⑵是否满足线性、无偏、有效?⑶是否可对作t检验?⑷若E的单位为100元,各变量有什么变化?解:⑴表示没有接受过教育的员工的平均起始薪金;表示每单位N变化所引起的E的变化,即每多接受一年教育所对应的薪金的增加值。
⑵满足线性、无偏、有效性,因为这些性质的成立无需随机干扰项μ的正态分布假设。
(3)如果的分布未知,则所有的假设检验都是无效的。
因为t检验与F检验是建立在μ的正态分布的基础上的。
⑷设表示以百元为度量单位的薪金,=++所以,估计的截距项与斜率项均为原回归系数的1/1002、下面是根据10组数据的X和Y的观察值得到的数据:;;;假定满足所有的古典线性回归模型的假设,要求: (1)和的估计值及其标准差? (2)R 2的值(3)对和分别建立95%的置信区间?利用置信区间法,你可以接受零假设:吗? 解: (1)因为n =10 且所以0.5344 =21.22若要求标准差,则需首先求出随机干扰项方差的估计:=77.60故∑=22ˆˆ1i x S σβ=0.0484==∑∑222ˆˆ0i i x n X S σβ8.5913 (2) ∑∑-=22)ˆ(i ii Y Y e =620.81∑-2)(Y Y i=10090故TSSRSS TSS ESS R -==12=0.9365 (3)对自由度为8 的分布,在5%的显著性水平下的临界值⎪⎪⎩⎪⎪⎨⎧∑-∑∑∑-∑=∑-∑∑∑-∑∑=2212220)(ˆ)(ˆi i i i i i i i i i i i i X X n X Y X Y n X X n X Y X Y X ββ2ˆ22-=∑n e iσ为t 0。
025(8)=2.306,故0β、1β的95%的置信区间分别为(02ˆ0ˆβαβs t ⨯-,02ˆ0ˆβαβs t ⨯+)=(1.4085 ,41.0315) )ˆ,ˆ(122ˆ11ˆ1ββααββs t s t ⨯+⨯-=(0.4228 ,0.6460) 由于β1=0不在β1的置信区间内,故拒绝原假设:β1=02、 最小二乘法是指(D )最小: A 、 B 、∑-i i Y Y ˆC 、 max ∑-i i Y Y ˆD 、∑-2)ˆ(i i Y Y4、Blue 是指(ABC )A 、 无偏B 、有效C 、线性D 、一致5、回归方程,通常假定μi服从(C )A 、N(0,B 、t(n-2)C 、N (0,)D 、t(n) 6、R 2的范围是[0,1]1.若要能得到k 个参数估计量,所要求的最小的样本容量为( )i i i X Y μββ++=10A.n ≥kB.n ≥k+1C.n ≥30D.n ≥3(k+1) 答案:A 分析:题中说的是k 个参数估计量,而不是解释变量,若题干说有k 个解释变量,那么应该选择B ,因为还要加上0β。
2.当R 2=1时,F=( )A.F=1B.F=-1C.F →+∞D.F=0 答案:C3.n=30,在一个包含3个变量的线性回归中R 2=0.85,则2R = 答案:0.833 解:2213011(1)1(10.85)0.83313031n R R n k --=--=--⨯=----4.Biddle and Hameresh (1990)研究工作与休息之间关系,sleep 代表休息,work 代表工作,edu 代表教育年限,age 代表年龄,0123sleep work edu age ββββμ=++++706个样本回归得到:(括号为回归样本标准差),sleep=3638.25-0.148work-11.13edu+2.20age (112.3) (0.02) (5.88) (1.45)R 2=0.11,SE 2=419.4。
(1)求2R ,F,标准差Std(2)给定5%的检验水平,检验3β是否显著,如果是10%的显著水平呢?(t 0.025(702)=1.65,t 0.05(702)=1.28) 解:(1)∵RSS=SE 2×(n-k-1)=419.4×(706-3-1)=294418.8 ∴TSS=RSS/(1- R 2)=330807.6404则:Std =2211(1)0.1061n R R n k -=--=--22/28.92(1)/(1)R kF R n k ==--- (2) ∵33ˆˆ 2.201.521.45t S ββ=== ∴t 0.05(702)=1.28<1.52<t 0.025(702)=1.65 ∴5%的检测水平不能拒绝原假设,不显著10%的检测水平应拒绝原假设,显著1.容易产生异方差的数据( )A.时序列数据B.虚变量数据 C 横截面数据 D.年度数据 答案:C2.如果存在异方差,则模型参数的普通最小二乘法估计量( ) A.无偏、有效估计量 B.无偏、非有效估计量 C.有偏、有效估计量 D.有偏、非有效估计量 答案:B3.当出现异方差时,估计方法可用( )A.加权最小二乘法B.工具变量法C.广义差分D.贝叶斯估计 答案:A4.戈里瑟检验表明OLS 回归得到0.457i i i e X v =+则加权最小二乘估计权数为( ) A.i X B.21i X C.1i X答案:D5.用G-Q 检验存在异方差0112233i i i i i Y X X X ββββμ=++++,标本容量为40, 按i X 由大到小排序后,去掉10个样本,并对余下的样本i X 按大小分为2组,作回归得到残差RSS 1=0.36,RSS 2=0.0466。
写出检验步骤。
(F 0.05(11,11)=2.82) 解:提出假设:H 0:i μ具有同方差 H 1:i μ具有递增型异方差计算F 统计量:2110.466211 1.29440.361112T C RSS K F T C RSS K -⎛⎫-- ⎪⎝⎭===-⎛⎫-- ⎪⎝⎭显然1.2944<F 0.05(11,11)=2.82 ∴无法拒绝原假设,即i μ具有同方差。
1.D.W.统计量可用来检验( ),其中ε为0,均值、方差均为常数且无序列相关。
A. 1t t t μρμε-=+ B.1122t t t t μρμρμε--=+++L L C.t t μρε= D.21t t t μρμρε-=++L L 答案:A分析:D.W.检验只适用于一阶自相关。
2.随即干扰项t μ具有一阶自回归形式:1t t t μρμε-=+,其中()0t E ε=,()2t Var εεσ=,则t μ的方差()t Var μ=( )A.221εσρ-B.221ερσρ-C.21ρρ- D.2221ρσρ- 答案:A3.研究劳动力在制造业中所占比率变化趋势,据1949-1964年度数据得如下方程:A.Y t =0.4579-0.0041t R 2=0.5484 DW=0.8052B.Y t =0.4786-0.00127t R 2=0.6692 DW=1.82Y 代表劳动比率,t 代表时间。
从DW 判断是否存在自相关?(0.05α=) 解:A :由题可知:n=1964-1949+1=16 k=1 ∴查表(书P391)可知d L =1.10,d U =1.37 显然,0<DW=0.8052<d L =1.10 ∴存在自相关。
B :由题可知:n=1964-1949+1=16 k=2 ∴查表(书P391)可知d L =0.98,d U =1.54 显然,d U =1.54<DW=1.82<4-d U =2.46 ∴无自相关。
分析:4.采用一阶差分模型,克服一阶线性相关问题适用于序列相关ρ=( ) A.ρ≈0 B.ρ≈1 C.-1<ρ<0 D.0<ρ<1 答案:B0 4 d L d U 2 4-d U 4-d L 正自相关不确定不确定负自相关无自相关1.存在随机解释变量问题,OLS 估计量( )A.无偏、一致B.无偏、不一致C.有偏、但一致D.有偏、不一致 答案:D分析:通常我们讨论的都是小样本问题2.对0112231t t t t t Y X X Y ββββμ-=++++,假设1t Y -与μ相关,为消除相关性,采用工具变量法,先用t Y 关于1t X 与2t X 回归得到t Y ,然后在做0112231ˆt t t t t Y X X Y ββββμ-=++++回归,问:是否可以消除原模型中1t Y -与t μ的相关性?答:可以消除,因为1t X 、2t X 与t μ无关,用t Y 关于1t X 与2t X 回归得到的也与tμt Y 无关,从而估计的1t Y -与t μ无关。
3.在线性回归中,若1X 与2X 存在21X kX =,k 为非零常数,则模型存在( ) A.异方差 B,多重共线性 C,序列相关 D,设定误差答案:B4.若检验方程F 统计量显著,而t 统计量不显著,则认为出现了多重共线性。
( ) 答案:√5.若模型存在近似的多重共线性,则最小二乘估计量是无偏、非有效的。
( ) 答案:√6.存在多重共线性时,模型无法估计。
( ) 答案:×分析:只有在完全多重共线性时,模型才无法估计1.对于一元回归模型*01t t t Y X ββμ=++,假设解释变量*t X 的实测值有偏误*t t t X X e =+,其中t e 是0均值,无序列相关且*t X 及t μ不相关。
(1)可否把*t t t X X e =-代入原模型,使之变为01t t t Y X ββυ=++后进行估计?t υ为变换后的干扰项(2)进一步假设t μ与t e 之间,以及它们之间无异期相关,则()10t t E X υ-=g 成立吗?t X 与1t X -相关?(3)从(2)看,用什么工具变量变换后的模型进行估计? 解:(1)由题可知:()01011t t t t t t t Y X e X e ββμβββμ=+-+=+-+ 011t t t X e ββμβ=++- 又∵*t t t X X e =+ ∴t X 与t e 存在相关性∴不能把*t t t X X e =-代入原模型,使之变为01t t t Y X ββυ=++后进行估计。
(2)()()()*111t t t t t t E X E X e e υμβ--⎡⎤=+-⎣⎦g**1111110t t t t t t t t E X X e e e e μβμβ----⎡⎤=-+-=⎣⎦∴成立且t X 与1t X -相关(3) 从(2)看,用1t X -作为工具变量变换后的模型进行估计。
2012年11月21日如果模型中遗漏了重要的解释变量,且被遗漏变量与包含的解释变量相关,则用最小二乘法得到的估计量( )A.有偏,非一致B.无偏,一致C.有偏,一致D.无偏,非一致 答案:A解析:本题实质是出现了随机变量问题2012年11月23日一个由209个样本估计解释CEO 薪水的方程12123ˆln 4.590.257ln 0.011ln 0.1580.1810.283Y X X D D D =++++- (15.3) (8.03) (2.75) (1.775) (0.181) (-2.895)其中Y 为年薪水平(单位万元),1X 表示公司年收入(单位万元),2X 表示公司股票收益(万元),123,,D D D 分别为金融业、消费品工业和公用事业。