部分作业答案:(各题只要回答到如下程度就是满分哦)第1章 概论一、填空1. 近似,散点;2. 平均值,平均值第2章 线性回归的基础理论一、填空1. 因变量Y ,解释变量X 二、单项选择题 1-2 AB三、名词解释总体:实验所有可能结果的集合称为总体或样本空间。
样本:也叫样本点,是指总体的某个元素或某种结果。
随机实验:至少有两个可能的结果,但不确定哪一个结果会出现的某个观察或测度过程。
估计量:是指总体参数的估计方法或计算公式。
估计值:估计量的某一具体取值称为估计值。
变量线性:是指因变量的条件均值是解释变量的线性函数。
参数线性:是指因变量的条件均值是参数B 的线性函数,而变量之间不一定是线性的。
四、简述 1. 答:14世纪英国逻辑学家奥卡姆提出简单有效原理,即“如无必要,勿增实体”,亦即“切勿浪费较多东西去做用较少的东西同样可以做好的事情”。
因此,模型应尽量简化,只要不遗漏重要变量即可,即便某些变量对Y 有影响,但它们的综合影响如果是有限的,非随机的,都可以不予考虑,即归入u 中。
2. 答:对双变量回归模型而言,如果总体回归线接近于直线,可用函数表示为E(Y ︱X i )=B 1+B 2X i ,其中,B 1为截距,B 2为斜率,该函数就称为非随机总体回归函数。
它表示在给定X 的条件下,Y 分布的均值。
对双变量回归模型而言,如果总体回归线接近于直线,回归方程可表示为Y i =B 1+B 2X i +u i ,其中,B 1+B 2X i 表示在给定X 的条件下Y 分布的均值,u i 为随机误差项。
它表示真实的Y 值是如何在均值附近波动的。
对双变量回归模型而言,若样本回归线接近于直线,则非随机样本回归函数可表示为ˆi Y =b 1+b 2X i ,其中,ˆiY =总体条件均值E(Y ︱X i )的估计量,b 1=真实截距B 1的估计量,b 2=真实斜率B 2的估计量。
对双变量回归模型而言,若样本回归线接近于直线,则随机样本回归函数可表示为Y i =b 1+b 2X i +e i ,其中,b 1+b 2X i 表示总体条件均值E(Y ︱X i )的估计量,e i 表示误差项u i 的样本估计量,称为残差。
五、论述题什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了)答:回归分析的目的是根据SRF (样本回归函数)估计PRF (总体回归函数),普通最小二乘法是获得SRF 最主要的方法。
随机PRF (Y i =B 1+B 2X i +u i )不能直接观察,但能通过随机SRF (Y i =b 1+b 2X i +e i )估计。
由SRF 得e i =Y i -b 1-b 2X i ,而ˆi Y =b 1+b 2X i ,因此,e i =Y i -ˆiY =实际的Y i -估计的Y i 。
残差的绝对值越小,表示SRF 与PRF 越靠近,即估计越好。
残差的平方和最小即可表示SRF 与PRF越靠近,用数学公式表示为:2i Min e ∑2ˆ()i iMin Y Y =-∑212()i i Min Y b b X =--∑。
该式中,X 和Y 可由观测得到,2i e ∑是b 1和b 2的函数。
因此,2i Min e ∑等价于2i e ∑分别对b 1和b 2求偏导等于0。
由此,得到:12ii Ynb b X =+∑∑212i ii i Y Xb X b X =+∑∑∑其中,n 为样本容量。
此联立方程称为最小二乘正规方程。
求解正规方程得到:12b Y b X =- 22222()()()i iiii i iiix y X X Y Y X Y nXYb x X X X nX---===--∑∑∑∑∑∑其中,样本截距b 1是总体截距B 1的估计量,样本斜率b 2是总体斜率B 2的估计量。
x i ,y i 表示变量与其相应均值的离差,即x i =X i -X ,y i =Y i -Y 。
第3章 常用概率分布一、填空1. 正态;倒扣的钟形2. 随机抽样(或随机样本);独立同分布3. 正态分布;正态分布4. N(0,1);n-1;学生t 分布5. χ26. χ2 二、单项选择题 1-5 DCBAC 三、名词解释概率密度函数:是指连续型随机变量在某一特定范围或区域内的概率。
期望:是随机变量的可能取值的加权平均,权重为各可能取值的概率。
换言之,随机变量的期望就是该变量可能取值与其对应概率之积的加总。
方差:等于随机变量与均值之差的平方的期望,即var(X)=2x σ=E(X-μx )2,其中,μx =E(X)。
方差表明随机变量X 的取值与均值的偏离程度。
自由度:是指计算统计量(如样本均值或方差)时独立观察值的个数。
第4章 统计推断的基本理论一、填空1. 估计,假设检验2. 固定值,随机变量 二、单项选择题 1 B三、名词解释统计推断:是指根据来自总体的某个随机样本,对总体的某些特征作出推论。
抽样误差:因样本不同而导致估计值的差异叫做抽样变异或抽样误差。
估计:概率分布函数的性质由其参数决定,通常根据样本估计总体参数,假设样本容量为n 的随机样本来自服从某概率的总体,用样本均值作为总体均值的估计量,样本方差作为总体方差的估计量,这个过程称为估计。
BLUE:最优线性无偏估计量。
如果一个估计量是线性的和无偏的,并且,在所有无偏估计量中,它的方差最小,则称它是最优线性无偏估计量。
一致估计量:如果随着样本容量的增加,估计量接近参数的真实值,则称该估计量为一致估计量。
p值:即概率值,定义为拒绝零假设最低的显著水平,又称为统计量的精确显著水平。
第5章回归的假设检验一、填空题1. 无自相关,正的自相关,负的自相关2. 0,σ2,正态分布,中心极限二、单项选择题1-3 ADB三、名词解释高斯-马尔柯夫定理:如果满足经典线性回归模型的基本假定,则在所有线性估计量中,OLS 估计量具有最小方差性,即OLS估计量是最优线性无偏估计量(BLUE)。
残差直方图:是用于推断随机变量概率密度函数(PDF)形状的一种简单图形工具。
在横轴上,把变量值(如OLS残差)划分为若干适当的区间,在每个区间上,建立高度与观察值个数即频率相一致的长方形。
第6章多元回归模型一、填空1. 大于,t,大于二、单项选择题1-3. CBD三、名词解释方差分析:对因变量Y的总变异TSS的各组成部分进行分析的过程称为方差分析。
受限最小二乘法:采用OLS法估计受限模型就称为受限最小二乘法。
非受限最小二乘法:采用OLS法估计未受限模型就称为非受限最小二乘法。
四、简答题1. 三变量总体回归函数E(Y t)=B1+B2X2t+B3X3t中,B2和B3称为偏回归系数,也称为偏斜率系数。
它们的含义:B2度量了在X3保持不变的情况下,X2单位变动引起Y的均值E(Y)的变化量。
同样地,B3度量了在X2保持不变的情况下,X3单位变动引起Y的均值E(Y)的变化量。
五、分析题根据表1,可得出以下几点结论:R和F值都为0,并且截距等于因变量的均值。
(1)当仅对截距回归时,R2,2R大于模型1的,(2)当价格对截距和年代回归时,年代变量的t=5.8457>1,模型2的2因此,应增加该变量。
(3)当价格对截距和人数回归时,人数变量的t=2.3455>1,模型3的2R 大于模型1的,因此,应增加该变量。
(4)当价格对截距、年代和人数回归时,年代变量的t=13.9653>1,人数变量的t=9.7437>1。
模型4的2R 既大于模型2的,也大于模型3的,因此,应该采用两个解释变量的模型。
(5)模型2中,年代变量的t 值的平方等于模型的F 值;模型3中,人数变量的t 值的平方等于模型的F 值。
一般地,对于双变量模型,斜率系数的t 值与模型的F 值有如下关系:21,k k t F = (1)其中,k 为自由度,k=n-2,n 为观察值个数。
(6)对于多元回归模型,t 与F 之间则不存在等式(1)。
第7章 回归模型的函数形式一、单项选择题 1-2. DA二、名词解释不变弹性模型:双对数模型最简单的PRF 形式为:lnY i =B 1+B 2lnX i +u i ,由于斜率系数2dY XB dX Y=⋅,是Y 对X 的点弹性。
与其他点弹性值随X 而变化不同,该值是个常数,因此,双对数模型又称为不变弹性模型。
半对数模型:模型的因变量和解释变量一个是线性一个是对数形式,包括两种形式:一是对数—线性模型,最简单的PRF 形式为:lnY t =B 1+B 2t+u t ;二是线性—对数模型,最简单的PRF 形式为:Y t =B 1+B 2lnX t +u t 。
增长率模型:对数—线性模型最简单的PRF 形式为:lnY t =B 1+B 2t+u t ,斜率系数2Y B t =的变化率的变化量,可表示增长率,因此对数—线性模型又称为增长率模型。
倒数模型:形如Y i =B 1+B 21i X +u i 的模型称为倒数模型,随着X 的无限增大,1X趋近于0,Y 的期望趋近于B 1。
三、简答题1. 考虑如下三变量对数线性模型:lnY i =B 1+B 2lnX 2i +B 3lnX 3i +u i其中,偏斜率系数B 2和B 3又称为偏弹性系数。
因此,B 2度量了X 3不变条件下,Y 对X 2的弹性,即在X 3为常数时,X 2变动1%,引起Y 变化的百分数。
由于X 3的影响保持不变,所以称此弹性为偏弹性。
类似地,B 3度量了X 2不变条件下Y 对X 3的偏弹性。
总之,在多元对数线性模型中,每一个偏斜率系数都度量了在其他变量保持不变的条件下,因变量对某解释变量的偏弹性。
第8章 虚拟变量回归模型一、填空题1. B 1;B 1+B 2;差别截距系数二、名词解释ANOV A模型:方差分析模型,是指解释变量仅包括虚拟变量的回归模型。
ANCOV A模型:协方差分析模型,是指回归中既有定性,又有定量解释变量的模型。
三、简答题1. 虚拟变量个数选择遵循的原则:如果模型有截距项B1,且定性变量有m种分类,则需引入m-1个虚拟变量。
如果违背上述原则,如选择m个虚拟变量,则将陷入虚拟变量陷阱,即虚拟变量之间存在完全共线性。
凡是讲过的内容(含附录),都属于考试范围。
第1章一、填空1. 拟合即( )的意思,拟合直线是指直线对( )的近似。
2. 回归一词的使用始于高尔顿对人体身高的研究。
他发现一个规律:父母高,子女也高;父母矮,子女也矮。
当父母身高既定时,子女的身高趋向于或“回归”到身高相同父母的全部子女的( )。
简记为,回归即指回归到( )。
第2章一、填空1. 总体回归线代表( )与( )的变动关系。
二、单项选择题1. 下列函数中,哪个是参数线性但非变量线性的函数?A. E(Y)=B 1+B 22i XB. E(Y ︱X i )=B 1+B 2X iC. Y i =B 1+B 2X i +u iD. ˆiY =b 1+b 2X i 2. 下列函数中,哪个是变量线性但非参数线性的函数?A. E(Y)=B 1+B 21iX B. E(Y)=B 1+22B X i C. E(Y ︱X i )=B 1+B 2X i D. ˆi Y =b 1+b 2X i 三、名词解释总体;样本;随机实验;估计量;估计值;变量线性;参数线性 四、简述1. 奥卡姆剃刀原则如何应用到模型设定中?2. 什么是非随机总体回归函数?什么是随机总体回归函数?什么是非随机样本回归函数?什么是随机样本回归函数? 五、论述题什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了)第3章一、填空1. 如果连续随机变量的概率密度函数(PDF )有如下形式:221())2x μσ--⋅, (-∞<x<∞) 其中,μ和σ2分别是分布的均值和方差,那么该变量被称为是( )分布的,其图形呈( )。