结构方程模型(SEM)
为什么要采用SEM
• 差不多所有心理、教育、社会研究中涉及的变量 (如智力、学习动机、家庭社会经济地位)均难 以直接准确测量(latent variable),我们只好退而 求其次,用一些外显指标(observable indicators)去 间接地测量这些潜变量。结构方程模型能同时处 理潜变量及其指标。
• SEM提供一个处理(自变量)测量误差的方法, 采用多个指标去反映潜变量,也令估计整个模型 因子间关系,较传统回归方法更为准确合理。
• 结构方程模型可用以比较不同的模型(拟合优 度)。
SEM的来源
• 从统计学与方法学的发展脉络来看,结构 方程模式并不是一个崭新的技术,而是因 子分析(factor analysis)与路径分析(path analysis)两种在社会与行为科学非常重要 的统计技术的结合体。相对于这两大分析 技术的发展轨迹,Kaplan(2000)指出 SEM的历史根源系来自两个重要的计量学 科:心理计量学与经济计量学,这两个学 术领域对于SEM的发展有着重要的影响。
• 与传统的探索性因子分析不同,在结构方 程模型中,我们可提出一个特定的因子结 构,并检验它是否吻合数据(即验证性因 子分析)。
探索性因子分析 VS. 验证性因子分析
• 相同点:两种因子分析都是以普通因子模
型为基础的。因子分析的基本思想是通过 变量的相关系数矩阵内部结构的研究,找 出能控制所有变量的少数几个随机变量去 描述多个变量之间的相关关系,但在这里, 这少数几个随机变量是不可观测的,通常 称为因子。然后根据相关性的大小把变量 分组,使得同组内的变量之间相关性较高, 但不同组的变量相关性较低。
• 双向弧形箭头表示相关 • 单向箭头指向因子表示
内生潜变量未被解释的 部分(即残差项) • 单向箭头指向指标表示 测量误差
SEM基本模型
• 结构模型:指标(外显变量)含有随机(或系统)性的测量误
差,但潜变量则不含这些部份。SEM可用以下结构方程 表示潜变量之间的关系(例如社会经济地位与学业成就 的关系):
结构方程模型(SEM)
重庆大学经管学院 闫 威
什么是SEM
• 结构方程模型(Structural Equation Modeling,简 称SEM)是一门基于统计分析技术的研究方法学 (statistical methodology),用以处理复杂的多变 量研究数据的探究与分析。
• 在社会科学以及经济、管理、市场等研究领域, 有时需要处理多个原因、多个结果的关系,或者 会碰到不可直接观测的变量(即潜变量),这些 都是传统的统计方法不好解决的问题。20世纪80 年代以来,结构方程分析迅速发展,弥补了传统 统计方法的不足,成为多元统计分析的重要工具。
• 后者则是产生SEM的计量数据来评估SEM模型的 优劣好坏,并进行适当或必要的修正,此时所着 重的是分析工具与统计软件(例如LISREL、EQS、 AMOS、MPLUS等)的操作与应用。
SEM分析的基本步骤
• (概念)模型发展
理论性发展:以理论为基础,经过观念的厘清、 文献整理与推导、或是研究假设的发展等理论 性的辩证与演绎过程,最终提出一套有待检证 的假设模型。
SEM的来源
• 经济计量学:
• Haavelmo在1943年利用一系列的联立方程式 (simultaneous equation)来探讨经济学变量的 相互关系 ,是为经济计量学中的联立方程模 型。
• 联立方程模型分析虽然可以用来探讨复杂变量 的关系,对于总体经济现象的解释有其效力, 但是它所遭到的最大批评在于无法针对特定的 经济现象进行精确有效的时间序列性预测。
SEM发展现状
• 软件包:
• LISREL(Jöreskog & Sörbom, 1989, 1996) • AMOS(Arbuckle,1997) • EQS(Bentler,1985,1995) • MPLUS(Muthén & Muthén, 1998) • CALIS(Hartmann,1992) • RAMONA(Browne,Mels,& Cowan,1994)等 。
• 期刊与论文:
• 专门期刊:《结构方程模型》(Structural Equation Modeling )
• 论文:见诸于国内外许多一流期刊
SEM概述
• 很多社会、心理等变量,均不能准确地及直接地 量度,这包括智力、社会阶层、学习动机等,我 们只好退而求其次,用一些外显指标(observable indicators),去反映这些潜变量。
探索性因子分析 VS. 验证性因子分析
• 不同点:
• 基本思想的差异:是否利用了先验信息?探索 性因子分析主要是为了找出影响观测变量的因 子个数,以及各个因子和各个观测变量之间的 相关程度;而验证性因子分析的主要目的是决 定事前定义因子的模型拟合实际数据的能力。 验证性因子分析要求事先假设因子结构,我们 要做的是检验它是否与观测数据一致。
SEM与回归分析的区别
• 与传统的回归分析不同,结构方程分析能 同时处理多个因变量。
• 同时,回归分析假设自变量为确定、非随 机的,即自变量是没有测量误差的,而 SEM却没有这样的严格假设。
• 若各因子可以直接测量(因子本身就是指 标),则结构方程模型就是回归分析。
SEM与传统因子分析的不同
• 若不考虑因子间的因果关系,即没有结构 模型这部分,则结构方程模型就是传统的 探索性因子分析。
SEM应用的主要类型
• Jöreskog & Sörbom(1996)指出SEM的模块化应用策略 有三个层次,第一是单纯的验证(confirmatory),也就 是针对单一的先验假设模型,评估其适切性,称为验证 型研究;第二是模型的产生(model generation),其程 序是先设定一个起始模型,在与实际观察数据进行比较 之后,进行必要的修正,反复进行估计的程序以得到最 佳契合的模型,称为产生型研究;第三是替代模型的竞 争比较,以决定何者最能反应真实资料,称为竞争型研 究。
A review of Steps in SEM
• Step 1: Developing a theoretically based model (基于 理论提出一个或多个基本模型)
• Step 2: Constructing a path diagram of causal relationships
y2
11 21
y3
y4
31 41
1
11
21
1 21
2
52
62
y5
y6
5
6
72 82
y7
y8
7
8
SEM分析的基本步骤
• SEM分析的基本步骤可以分为(概念)模型发展 与模型估计修正两个阶段。
• 前者在发展SEM分析的原理基础并使SEM模型符 合特定的技术要求,此时研究者的主要工作在概 念推导与SEM分析的技术原理的考虑。
探索性因子分析是在一张白纸上作图, 而验证性因子分析是在一张有框架的图上完善和修改。
探索性因子分析 VS. 验证性因子分析
• 不同点:
• 分析方法的差异
• 探索性因子分析——传统因子分析(管理统计中已 讲)。主要步骤包括:收集观测变量、获得协方差 矩阵(或相关系数矩阵) 、提取因子 、因子旋转 、 解释因子结构 、计算因子得分 。
Measurement Model
测量模型
12
1
11
21
X1
X2
1
2
31 41
X3
X4
3
4
2
52
62
X5
X6
5
6
72 82
X7
X8
7
8
SEM路径图常用图标的含义
• 圆或椭圆表示潜变量或 因子
• 正方形或长方形表示观 测变量或指标
• 单向肩头表示单向影响 测量方程 (measurement equation)和结构方程 (structural equation)两部分。
• 测量方程描述潜变量与指标之间的关系, 如家庭收入指标等社会经济地位的关系、 三科成绩与学业成就的关系。而结构方程 则描述潜变量之间的关系,如社会经济地 位与学业成就的关系。
• 例如:我们以学生父母教育程度、父母职业及其 收入(共六个外显变量),作为学生家庭社会经济 地位(潜变量)的指标,我们又以学生中、英、数 三科成绩(三个外显变量),作为学业成就(潜变量) 的指标。
SEM的特点
• 理论先验性 • 同时处理测量与分析问题 • 以协方差的应用为核心 • 适用大样本分析
SEM的来源
• 心理计量学:
• Spearman认为,人类心智能力测验得分之间的相互关 系,可以被视为是由这些分数背后所具有的一个潜的 共同因素(common factor)的影响结果。
• Thurston认为,在复杂的智力测量背后,应该存在着 不同且独立的一组共同因素,他称之为核心心智能力 (primary mental abilities),由于这一组共同因素的存 在,构成了智力测验得分的复杂关系。研究者必须找 出这些因素,才能利用此一因素结构来对智力测验得 分之间的共变(协方差)关系,得到最理想的解释, 得出最大的解释力。
η=Bη+Γξ+ζ • η——内生(依变)潜变量(如学业成就) • ξ——外源(自变)潜变量(如社会经济地位) • B——内生潜变量间的关系(如学业成绩与其他内生潜变
量的关系) • г——外源潜变量对内生潜变量的影响(如社会经济地位对
学业成就的影响) • ζ——结构方程的残差项,反映了η在方程中未能被解释
的部分。
潜变量之间的关系,即结构模型,通常是研究的重点。
Path Model
结构模型
X1
11
12
X2