当前位置:
文档之家› 袁卫《统计学》(第3版)课后习题-相关与回归分析(圣才出品)
袁卫《统计学》(第3版)课后习题-相关与回归分析(圣才出品)
以计算总体因变量 y 的条件期望 E( y xi ),并将其表现为自变量 x 的某种函数,这个函数
称为总体回归函数(简记为 PRF)。 (2)如果把因变量 y 的样本条件期望表示为自变量 x 的某种函数,这个函数称为样本
回归函数(简记为 SRF)。 (3)总体回归函数和样本回归函数的区别
2 / 24
量以外的所有因素对 y 的影响,称为随机误差项。
(2)因变量 y 的实际观测值 yi 并不完全等于样本条件期望 yˆi ,二者之偏差称为残差项 或剩余项,用 ei 表示,则 yi − yˆi = ei 。
(3)总体回归函数中的 i 是不可直接观测的,而样本回归函数中的 ei 是只要估计出样
本回归的参数就可以计算的数值。
圣才电子书 十万种考研考证电子书、题库视频学习平台
①总体回归函数虽然未知,但它是确定的;而由于从总体中每次抽样都能获得一个样本, 就都可以拟合一条样本回归线,所以样本回归线是随抽样的样本而变化的,可以有许多条。 所以,样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 7 章 相关与回归分析
思考题 1.相关分析与回归分析的区别和联系是什么? 答:(1)相关分析与回归分析的联系 相关分析与回归分析具有共同的研究对象,都是对变量间相关关系的分析,二者可以相 互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相 关关系时,进行回归分析去寻求变量间相关的具体数学形式才有实际的意义。同时,在进行 相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多 个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。 (2)相关分析与回归分析的区别 ①从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的 方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去 估计和预测因变量的平均值。 ②从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系, 也就是不区分自变量和因变量,相关的变量不一定具有因果关系,均视为随机变量;回归分 析是在变量因果关系分析的基础上研究其中的自变量的变动对因变量的具体影响,必须明确 划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自 变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。
圣才电子书 十万种考研考证电子书、题库视频学习平台
答:总体方差反映总体的波动情况,对一个特定的总体而言,是一个确定的值。在最小
二乘估计中,由于总体方差在大多数情况下并不知道,所以用样本数据去估计 2 :
ˆ 2 = ei2 。其中 n 为样本数,k 为待估参数的个数。ˆ 2 是 2 线性无偏估计,为一个随
n−k
机变量。
7.如果要分析“影响中国妇女生育水平的决定因素是什么?”的问题,你认为对此问 题可以建立什么样的回归方程去研究?
答:妇女生育水平除了受计划生育政策影响以外,还可能与社会、经济、文化等多种因 素有关。理论上,影响妇女剩余水平的主要和决定因素是社会经济发展水平,社会经济发展 水平通过影响人们的生育医院,决定着妇女的生育水平。同时在一定的社会经济水平下的宗 教文化传统,也对人们的生育观念产生影响,从而影响妇女生育率。计划生育政策作为上层 建筑的一部分,建立在一定的社会经济发展基础之上,与一定时期的社会经济发展水平相适 应,它通过法律的强制力量控制生育,影响妇女生育率。但计划生育因素对生育率的作用以 社会经济因素的作用为基础,因而成为从属地位的影响因素。所以,应对此问题建立多元线 性回归方程去研究。
2.简单线性相关系数与等级相关系数的区别是什么? 答:(1)两个变量之间线性相关程度可以用简单线性相关系数去度量,这种相关系数是
1 / 24
圣才电子书 十万种考研考证电子书、题库视频学习平台
最常用的,也简称为相关系数。对于人们所研究的总体,两个相互联系的变量的相关系数称
②总体回归函数的参数 和 β 是确定的常数;而样本回归函数的参数ˆ 和 ˆ 是随抽样 而变化的随机变量。此外,总体回归函数中的 i 是不可直接观测的,而样本回归函数中的 ei
是只要估计出样本回归的参数就可以计算的数值。
4.什么是随机误差项和残差?它们之间的区别是什么?
答:(1)对于一定的 xi,y 的个别值 yi 分布在条件期望 E( y xi )的周围,若令各个 yi 值与条件期望 E( y xi )的偏差为 i ,显然 i 是个可正可负的随机变量,代表排除在自变
(2)Spearman 等级相关系数 rs 为:
rs
=1−
6 di2
n(n2 −1)
(3)两个变量之间简单线性相关系数要求两个随机变量的联合分布是二维正态分布。
当变量不满足正态分布要求时,或者所研究的变量不是数量型变量时,简单线性相关系数的
相关分析方法不宜使用,这时可以用 Spearman 等级相关系数作相关性分析。
为总体相关系数,通常用 表示,其公式为:
= Cov(x,y) Var(x)Var( y)
变量 x 和 y 的样本相关系数通常用 rxy 表示,或简记为 r,其公式为:
rxy =
(x − x)(y − y) / n
=
(x − x)2 / n (y − y)2 / n
(x − x)(y − y) (x − x)2 (y −为等级的变量。但是,对于变量值表现为数值的变
量,如果无法假定其总体分布,或者其中有一个变量只能用等级表现时,有时也可以用等级
相关系数分析其相关性。
3.什么是总体回归函数和样本回归函数?它们之间的区别是什么? 答:(1)假如已知所研究的经济现象总体中因变量 y 和自变量 x 的每个观测值,便可
5.为什么在对参数进行最小二乘估计之前,要对模型提出一些基本的假定? 答:在古典假定条件下,OLS 估计得到的参数估计量是该参数的最佳线性无偏估计,具 有无偏性、有效性、线性。总之,作古典假定是为了使所作出的估计具有较好的统计性质和 方便地进行统计推断。
6.总体方差与参数估计方差的区别是什么?
3 / 24