当前位置:
文档之家› 多元统计分析(何晓群)第十章 路径分析
多元统计分析(何晓群)第十章 路径分析
耐用性
使用的简单性 感知价值 通话效果 客户忠诚度
价格
e5
e6
图10—2
10.1.2 内生变量和外生变量
路径图上的变量分为两大类:一是外生变量 (exogenous variable, 又称独立变量,源变量), 它不受模型中其他变量的影响,如图10—2的耐用 性、使用的简单性、通话效果和价格;与此相反, 另一类是内生变量(endogenous variable, 又称因 变量或下游变量),在路径图上至少有一个箭头指 向它,它被模型中的其他一些变量所决定,如图 10—2的感知价值由耐用性、使用的简单性、通话 效果和价格四个变量和随机误差e5决定,忠诚度取 决与四个外生变量、感知价值和随机误差e6。此 外,我们可以将路径图中不影响其他变量的内生变 量成为最终结果变量(ultimate response variable),最终结果变量不一定只有一个。图 10—2中忠诚度是最终结果变量。
(3) 每一内生变量的误差项不得与其前置变量相 关,同时也不得与其他内生变量机器误差项相关。 这是对模型递归性的要求。另外,模型不考虑外生 变量的相关性,即不对外生变量的相关性进行分析。 (4) 模型中得因果关系必须为单向,不得包括各 种形式的反馈作用。这同样是对模型递归性的要求。 (5) 各变量均为可观测变量,并且各变量的测量 不能存在误差。这两个弱点在SEM技术中得到了克 服,已经发展了一套成熟的处理隐变量和测量误差 的技术。 (6) 变量间的多重共线性程度不能太高,否则路 径系数估计值的误差将会很大。
10.1.3 直接作用和间接作用
其他变量(A)对内生变量(B)的影响有两种情况: 若A直接通过单向箭头对B具有因果影响,称A对B 有直接作用(direct effect);若A对B 的作用是间 接地通过其他变量(C)起作用称A对B有间接作用 (indirect effect),称C为中间变量(mediator variable)。变量间的间接作用常常由多种路径最终 总合而成。图10—2中,四个外生变量耐用性、使 用的简单性、通话效果和价格既对忠诚度有直接作 用,同时又通过感知价值对忠诚度具有间接作用。
(7) 需要足够的样本量。克兰(Kline,1998)建议样本量 得个数应该是需要估计的参数个数得10倍(20倍更理想) 。 上述假设条件用数学符号很容易说明,但有些抽象。任何 一个(递归)路径模型都可以用结构方程组表示,假设 ' η = (η1 ,η2 ,...,ηm )和 ξ = (ξ1 , ξ 2 ,..., ξ n ) ' 分别为模型中的内生和外 生可观测变量向量: B ×m 是 η 的参系数矩阵,可以证明, m Γ 若为路径递归模型,则 Bm×m总可以写成上三角矩阵, m×n 是 ξ 的参系数矩阵,e为内生变量所对应的误差项,满足期望 为零,两两不相关。则该路径模型的结构方程组为:
C2 = p12 A + p22 B + p11r12 AC1 + p21r12 BC1 + pe2 e2
(10.1)
式(10.1)实际上是普通的多元回归方程,多元回 归分析是因果关系模型的一种,但它是一种比较简 单的因果关系模型,各个自变量对因变量的作用并 列存在,它仅包含一个环节的因果结构。路径分析 的优势在于它可以容纳多环节的因果结构,通过路 径图把这些因果关系很清楚的表示出来,据此进行 更深层次的分析,如比较各种因素之间的相对重要 程度,计算变量和变量之间的直接和间接影响,这 在后面会涉及。图10—2是有关一种消费性电子产 品(如手机)路径分析的例子(这里省略了路径系 数),四个变量中,耐用性、使用的简洁性、通话 的效果和价格两两相关,决定感知价值,同时通过 感知价值决定客户忠诚度。相对于图10—1,它具 有两层因果关系。接下来主要是以图10—2为例, 说明路径图中的一些基本概念。
20世纪初,“Pearsn原理”在生物遗传学(在过 去几乎就是我们现在所称的统计学)中占统治地 位。Pearsn原理的一个基本内容就是相关关系是 现实生活中最基本的关系,而因果关系仅是完全 相关的(理论)极限。这种理论认为没必要寻找 变量之间的因果关系,只需计算相关系数。然而 相关分析逐渐暴露出自身的很多局限:一是仅反 映变量之间的线性关系;二是反映变量之间的关 系是对称的,而很多变量之间的关系是非对称 的;三是只有在正态假设下,正态细想才是有效 的。
10.1.4 间接作用的检验
如果模型中包含中间变量,首先从理论角度考虑,这个中间作用是否 有理论依据,其次实际工作者会提出这样的问题:“模型中中间变量的中 间影响显著吗?”这些问题涉及对中间变量的间接作用进行检验。巴伦和 肯尼(R. M. Barron, D.Kenny,1986)提出了检验中间变量间接作用是否 统计显著的一种做法。 第一步:用中间变量(感知价值)对外生变量耐用性,使用的简单性、 通话效果和价格四个变量进行回归; 第二步:用内生变量(感知价值)对外生变量耐用性、使用的简单性、 通话效果和价格四个变量进行回归; 第三步:用忠诚度对第一步中的四个变量以及中间变量感知价值进行 回归。 阿加沃尔和蒂斯(S. Agarwal, R. K. Teas, 1997)的工作表明“如果 (a)在第一步的估计中解释变量统计显著;(b)在第二步的估计中解 释变量统计显著;(c)在第三步的估计中变量统计显著,则说明中间变 量的间接作用显著”。 假设对图10—2进行简介作用检验,得到表10—1,见文献[4]。
第十章
学习目标
路径分析
1. 了解路径分析和回归分析的区别,了解路径分析的假设 条件; 2. 理解路径分析所涉及的基本概念; 3. 理解路径系数的求解原理,并能使用软件求出路径系 数; 4. 能够检验中间变量的中间作用; 5. 能够使用Wright规则对路径图中的相关系数进行分解; 6. 理解对模型进行调试的意义,并能对模型进行检验; 7. 能够运用合适的软件,采用路径分析解决实际问题。
表10—1 因变量 自变量 耐用性 使用的简单性 通话效果 价格 感知价值 0.26 0.08 0.15 0.39
间接影响的检验结果 第一步 感知价值 第二步 忠诚度 0.65 0.07 0.14 0.08 第三步 忠诚度 0.62 0.06 0.12 Ns 0.12
说明 部分间接作用 部分间接作用 部分间接作用 完全间接作用
e1
P 12 P 21
B
r12
P 22
C2
P2 e
e2
图 10—1
图10—1是一个简单的路径图,A表示父亲智商, B表示母亲智商,C1,C2是两个成年子女的智商, e1, e2是与A, B不相关的另外原因变量。一般来 说,父母亲的智商之间不存在关系;父母亲的智商 对子女的智商存在因果关系,用单箭头表示;子女 间存在相关关系,用双箭头表示。箭头上的字母表 示路径系数,路径系数反映原因变量对结果变量的 相对影响大小。在路径分析中,一般采用经过标准 化后的变量,没有特别说明,均指经过标准化后的 变量。可以把图10—1写成方程式的形式: C1 = p11 A + p21 B + p12 r12 AC2 + p22 r12 BC2 + pe1 e1
路径分析现在成为多元分析的一种重要方 法,广泛应用于遗传学、社会学、心理学、 经济问题和市场调研领域。然而习惯上把基 于最小二乘的传统的路径分析称作路径分 析,而把基于极大似然的路径分析称作结构 方程式模型(structural equation modeling , SEM)。本章主要介绍传统的路径分析,不 进行特别说明,本章所提到的路径分析均指 基于最小二乘的路径分析,结构方程模型放 在下章介绍。
注:所有的间接作用参数均为统计显著的。
对每一外生变量,存在三种可能的中间结果:没 有间接作用(no mediation)、部分间接作用 (partial mediation)和完全间接作用(full mediation)。如果第一步中外生变量的回归系数不 是统计显著或者第三步中(中间变量)感知价值的 回归系数不显著,说明该外生变量不存在间接作 用;如果某一外生变量(如耐用性、使用的简单性、 和通话效果)再第一步和第三步中的回归系数都是 统计显著的,说明该外生变量存在部分间接作用; 如果某外生变量(价格)的回归系数在第一不显 著,而在第三部不显著,说明该外生变量存在完全 的间接作用。
如果一个路径模型包括以下四种情况,便是非递归模型。 (1) 模型中任何两个变量之间存在直接反馈作用,在路 径图上表示为双向因果关系。如图10-—3(a)所示。 (2) 某变量存在自身反馈作用,即该变量存在自相关, 如图10—3(b)所示。 (3) 变量之间虽然没有直接反馈作用,但是存在间接反 馈作用,及顺着某一变量及随后变量得路径方向循序前进, 经过若干变量后,又能返回这一起始变量,如图10—3(c) 所示。 (4) 内生变量的误差项与其它有关项相关,如结果变量 得误差项与其原因项相关(图10—3(d)),或者不同变量 之间的误差项之间存在相ቤተ መጻሕፍቲ ባይዱ(图10—3(e))。
在遗传学中,很多现象具有明显的因果关系,如 父代与子代的基因关系,父代在前,子代在后, 二者的关系只能是单向的,而非对称的。对这种 变量结构进行思考,遗传学家休厄尔·赖特 (Sewall Wright)于1918—1921提出路径分析 (path analysis),用来分析变量间的因果关系。 现代的路径分析由于生物遗传学家、心理测验学 家、计量经济学家以及社会学家的推进,引入隐 变量(laten variable,又称unmeasured variable,不可观测变量),并允许变量间具有测 量误差,并用极大似然估计代替了最小二乘法, 成为路径系数主流的估计方法。
10.1 基本概念和理论
关于基本概念如路径图、直接作用、间接 作用的理解对于掌握路径分析非常重要,这 些概念共同构成了路径分析的基本理论。
10.1.1
路径图
P 11
A
P 21
C1
路径分析的主要工具是 路径图,它采用一条带箭头 的线(单箭头表示变量间的 因果关系,双箭头表示变量 间的相关关系)表示变量间 预先设定的关系,箭头表明 变量间的关系是线性的,很 明显,箭头表示着一种因果 关系发生的方向。在路径图 中,观测变量一般写在矩形 框内,不可观测变量一般写 在椭圆框内,对于简单的路 径模型,可以直接用字母表 示变量,绘出路径图。