当前位置:文档之家› 双变量回归模型基本概念

双变量回归模型基本概念

mediocrity
• The height of the children of unusually tall or unusually short parents tends to move toward the average height of the population.
3
• 回归的现代含义:
13
再次强调数据的质量
• Because of all these and many other problems, the researcher should always keep in mind that the results of research are only as good as the quality of the data.
6
几个例子
• 1. Reconsider Galton’s law of universal regression.
• In the modern view our concern is finding out how the average height of sons changes given the fathers’ height.
问题:能从一次抽样中获得总体的近似的 信息吗?如果可以,如何从抽样中获得总 体的近似信息?
30
31
32
画两条样本回归线尽可能拟合这些散点
33

• 图中直线(曲线)称为样本回归线 • 在总体回归函数(总固体回归线)不知情的情况
下,无法判断哪一条样本线能代表真实的总体线 • 姑且他们都能代表总体回归线 • 但因抽样波动,他们最多只是真实总体线的一个
• 不满意的结论,并不一定是模型不够优美 ,有时是数据质量问题。
14
二、回归分析的基本概念
• 总体回归函数(PRF) • 随机干扰项 • 样本回归函数(SRF)
15
总体回归函数
• 包含60个家庭的例子,分成10个子总体
16
• 子总体的均值,称为“条件均值”,E(Y | X)
17
• 每个子总体内,呈现一个分布 • 子总体的均值,随着收入增加而增加
4
深入理解
变量间的关系:
• 经济变量之间的关系,大体可分为两类:
• 确定性关系或函数关系:研究的是确定现象非随
机变量之间的关系。 • 例:圆面积= f ( , r)= r2
• 统计依赖关系:研究的是非确定现象随机变量间
的关系。
• 例:农作物产量=f(气温,降雨量,阳光,施肥量等)
• 对变量间统计依赖关系的考察主要是通过相关分析 或回归分析来完成的
• 正是来自于理论上(或者假设)的因果关 系,才假设因变量依赖于自变量。而不是 相反。
11
几个术语:
12
• simple, or two-variable, regression analysis.
• 简单回归分析或者双变量回归分析,或单 元回归分析
• multiple regression analysis. • 多元回归分析
2)变量观测值的观测误差的影响;
3)模型关系的设定误差的影响;
4)其它随机因素的影响。
产生并设计随机误差项的主要原因:
1)理论的模糊性;
2)数据的欠缺;
3)核心变量和周边变量;
4)人类行为的内在随机性;
5)糟糕的替代变量;
6)节省原则;
7)错误的函数形式。
29
样本回归函数
总体的信息往往无法掌握,现实的情况只 能是在一次观测中得到总体的一个样本。
• 相关分析指线性相关分析。 • 不线性相关并不意味着不相关 • 相关分析对称地对待任何(两个)变量,两个变
量都被看作是随机的。 • 回归分析对变量的处理方法存在不对称性,即区
分因变量和解释变量:前者是随机变量,后者 不 是。
10
概念辨析:回归与因果关系
• 回归分析/相关分析研究一个变量对另一个 (些)变量的统计依赖关系,但它们并不意 味着一定有因果关系
21
• 含义:
回归函数(PRF)说明被解释变量Y的平均状态 (总体条件期望)随解释变量X变化的规律。
• 函数形式:
可以是线性或非线性的。 引例中,将消费支出看成是其可支配收入的线 性函数时:
22
“线性”的两种含义
• 对变量为线性:
Y的条件均值是Xi的线性函数
• 对参数为线性
Y的条件均值是 的线性函数
• In other words, our concern is with predicting the average height of sons knowing the height of their fathers.
7
年龄与身高
8
Phillips curve
9
概念辨析:回归分析与相关分析
计量经济学 Econometrics
孙坚强 Ph.D. in Finance jqsunmath@
1
双变量回归模型:基本概念
• 一、回归的含义 • 二、回归分析的基本概念
2
1、回归的含义
• “回归”的由来 Francis Galton, Karl Person:regression to
18
• 收入与消费支出的关系;收入与子总体均值的关系: • 图中的黑点表示不同X值下Y的条件均值 • 条件均值的连线称为总体回归线(总体回归曲线)
19
20
概念
• 在给定解释变量Xi条件下,被解释变量Yi的 期望轨迹称为总体回归线(PRL),或更一般 地称为总体回归曲线。
• 相应的函数:
称为(双变量)总体回归函数(PRF)。
5
深入理解
• 回归分析是研究因变量对另一(些)解释变量的依赖关 系的计算方法和理论。
• 其用意:在于通过后者的已知或设定值,去估计和( 或)预测前者的(总体)均值。
• 回归分析构成计量经济学的方法论基础,其主要内容 包括:
(1)根据样本观察值对经济计量模型参数进行估计,求 得回归方程;
(2)对回归方程、参数估计值进行显著性检验; (3)利用回归方程进行分析、评价及预测。
计量经济学中的线性回归模型(LRM)是指 参数为线性的情况,对解释变量可以是或者不 是线性的。
23
24
随机干扰项
25
例1.1中,个别家庭的消费支出为:
26
27
• 对总体回归函数的随机形式(随机设定形 式、单值形式)取条件期望:
28
随机误差项主要包括下列因素的影响:
1)在解释变量中被忽略的因素的影响;
相关主题