第10章路径分析
两个非饱和模型中将路径较多的称为模型1,路径较少的 称为模型2,模型2嵌套在模型1中。将模型1作为基准模型 ,模型2作为检验模型。
设模型 1中包含p个方程,它们的决定系 数分别为:
2 Rc21 , Rc22 ,...,Rcp , 那么,该模型能够解释 的方差为: 2 Rc2 1 1 Rc21 1 Rc22 1 Rcp ,
量划分为自变量和因变量,而是分为 外生变量(exogenous variable)和内生 变量(endogenous variable)。路径分 析的主要功能是将自变量对因变量的 毛作用(简单相关系数或简单回归系 数)分解为直接作用和各种形式的间 接作用,使整个模型中变量的因果关 系更为具体,因果关系的机制更清楚。
探索性:事先没有明确的理论假设,而是完全依赖统计 得到较高拟合度的模型。
验证性:事先已有理论依据及假设设置的模型,检验经 过修正的模型与原假设模型是否不同。
路径模型的识别
模型的识别
模型中所有变量间的相关系数都可以用路径系数函数的 形式来表示,那么所有变量间的路径系数是否能够完全 以相关系数来表示,就是模型的识别问题。
相关原因模型
z1 e1
e1 z1 p31 p21 z2 e2 p32 z3 e3 r 1 12
z 2 p21 z1 e2 z3 p31 z1 p32 z 2 e3 1 z1 p21 z1 e2 n n z1 z1 p z1e2 p 0 p 21 21 21 n n 1 1 r13 z1 z3 z1 p31 z1 p32 z 2 e3 n n z1 z1 z1 z 2 z1e3 p31 p32 n n n 1 p31 r12 p32 0 p31 p21 p32
z1 z2
中介原因模型
注意:r23中p32是z2对z3的直 接作用部分,p21p31是伪相 1 1 r23 z 2 z3 z 2 p31 z1 p32 z 2 e3 关部分,就是由于z1的变化 n n 同时引起z2、z3变化的部分。 z1 z2 z2 z2 z1e3
直接作用:p41 间接作用路径1:p42p21 间接作用路径2: p43p31 间接作用路径3 :p43p32p21
z1对z4的作用分解:
e3 z3 p43 p41 p21 p32 z2 z4
p31 z1
p42
e4
ˆ2 p21 z1 z ˆ3 p31 z1 p32 z 2 z ˆ4 p41 z1 p42 z 2 p43 z3 z
由于原因变量相关而产生的未析部分
由于共同原因的存在而产生的伪相关部分
路径模型的修正与检验
饱和模型:所有变量间都有单向路径或相关连接
饱和模型是拟合度最理想,但不是最理想的模型,修正模 型就是要找到既简约又与饱和模型的拟合度没有显著差异 的非饱和模型。往往将模型中最不显著的路径删除,再看 模型的拟合度如何,直到找到最理想的模型。 模型检验分两种情况
z1
z2
z1
z3
直接反馈
z2 自反馈
z1
z3
z2 间接反馈
z1
z2 误差项与外生变量相关
z1
z2 误差项相关
z3
递归模型分析的假设条件
各变量之间均为线性、可加的因果关系; 内生变量的误差与前置变量不相关,同时不能与 其他内生变量的误差相关;
模型中因果关系必须是单向的,不得包含各种形 式的反馈作用;
路径分析图的特点
定量研究(quantitative):相关与回归分析的应用;
可识别的(identified):可求解;
递归的(recursive); 变量都是可测的(directly observed); 线性的(linear):变量间的关系是线性的; 可加的(additive):效应是可以叠加的,不包含交互作用; 标准化的(standardized):在一个群体或相似群体间可以相互 比较。 没有多重共线性问题(multicollinearity)
n n r12 p31 p32 p21 p31 p32 p31 p32 n
相关系数分解的四种组成部分:
直接作用
如:中介模型中r13分解中的p31部分
间接作用
如:中介模型中r13分解中的p32p21部分
如:相关模型中r13分解中的p32r21部分 如:中介模型中r23分解中的p31p21部分
路径分析
路径分析
探索因果关系模型的统计方法
路径图中首先应明确设置自变量和因变量,通
过分析考察自变量对于因变量的作用方向、作 用强度和解释能力
多元回归模型中,各自变量处于相同的地位,
是并列关系,其回归系数表示在控制了其他变 量的条件下每个自变量对于因变量单独的净作 用。
在路径分析模型中,不是简单地将变
xy x x y y 1 x x y y 1 zx z y rxy n x y n x y n x y
变量相同而模型设置不同,相关系数的分解结果 会有所不同,看下面三个例子。
递归路径模型与非递归路径模型
递归模型
指全部为单向链条关系、无反馈作用的模型;各内生变 量与其原因变量的误差之间、两个内生变量的误差之间 相互独立。 可以直接利用最小二乘法(OLS)求解。 判断方法:一个模型中不包含非递归模型的特征。
非递归模型
有下列情况即为非递归模型:(不能用最小二乘法求解) 某两个变量之间存在双向因果关系; 某个变量存在自身反馈,即该变量每个值影响下一个值; 变量之间虽然没有直接反馈,但存在间接反馈作用; 一个结果变量的误差项与其原因变量相关; 不同变量的误差项之间存在相关。
模型的识别
不可识别的(under-identified):路径数多于相关系 数数量(方程数) 可识别的(identifiable)
恰好识别(just-identified):路径数等于方程数
过度识别(over-isentified):路径数少于方程数
e1 z1 p31 p21 z2 e2 p32 z3
r12 p21 r31 p31 p32 p21 r23 p31 p21 p32 解上述方程组得: p21 r12 p31 p32 r13 r12 r23 2 1 r12 r23 r12 r13 2 1 r12
三个未知数(路径), 三个方程能够得到 唯一解,所以是恰 好识别的模型
1 Rc2 Q , 2 1 RtΒιβλιοθήκη 以饱和模型作为基准模型的检验
假如非饱和模型中缺少路径pa,pc,pf,则零假设为: H0: pa=pc=pf=0
设饱和模型中包含 p个方程,它们的决定系 数分别为:
2 Rc21 , Rc22 ,...,Rcp , 那么,饱和模型能够解 释的方差为: 2 Rc2 1 1 Rc21 1 Rc22 1 Rcp ,
e2
控制z2后z1对z4的作用分解:
直接作用:p41 间接作用路径: p43p31 控制变量z2对z4的作用: 直接作用:p42 间接作用:p43p32
ˆ4 p41 z1 p42 z 2 p43 p31 z1 p32 z 2 z p41 z1 p42 z 2 p43 p31 z1 p43 p32 z 2 p41 p43 p31 z1 p42 p43 p32 z2
各变量是等距的;
各变量的测量不存在误差
分解简单回归系数的路径分析
计算一个变量对最终变量的直接影响和间接影响 在控制某些变量的条件下,对总影响的分解 报告各种影响作用分解
e3 z3 p43 p41 p21 p32 z2 z4
p31 z1
p42
e4
ˆ2 p21 z1 z ˆ3 p31 z1 p32 z 2 z ˆ4 p41 z1 p42 z 2 p43 z3 z
模型设定
x1
b1
z1
p31 p21 z2 z3 p32
y
x2 b2
多元回归模型因果关系图
路径模型因果关系图
外生变量:模型中它只影响别的变量,没有其它因素影响它;外生
变量间可以用双箭头的直线或曲线表示相关。
内生变量:模型中由其它因素影响的变量,它也可能影响别的变量;
用单箭头表示影响关系,所在结果变量的下标作为路径系数的第一下 标,原因变量下标作为路径系数的第二下标,如p32就是由z2指向z3。
e2
p41 z1 p42 p21 z1 p43 p31 z1 p32 p21 z1 p41 p42 p21 p43 p31 p43 p32 p21 z1
ˆ4 p41 z1 p42 p21 z1 p43 p31 z1 p32 z 2 z
对过度识别模型的整体检验
饱和模型能够完全拟合数据,即通过路径系数能 够完美地反映出变量之间实测的相关系数,所以 饱和模型可以作为评价非饱和模型的标准。 非饱和模型是从饱和模型中删除某些路径后得到 的模型,是嵌套在饱和模型中的。是过度识别的 。这里要求模型都是递归的模型。
两个嵌套的非饱和模型之间差异的比较
路径分析的基本步骤
根据相关理论与文献,建构一个可以验证的初始 模型,并画出路径图。
用多元线性回归分析(通常用Enter法)估计路径
2 残差系数 1 R 系数并检验是否显著,进而估计残差系数(1减去