结构方程模型入门
12
13
结构方程模型是用来检验观测变量与潜在变 量之间假设关系及测量误差的一种统计技术,或 者说是模型构建与检验的方法。
结构方程模型是通过观测变量集合的间的协 方差结构和相关结构出发,从定量的角度建立模 型来研究变量间的因果关系的一种方法。
δ1 δ2 δ3
x1
x2 x3 λ2
λ1
ξ
λ3
误差
观测变量
9
方法的进步与革命常常导致相应学科的 进步与革命。就统计方法而盲,回归分析是 相关分析的深人, 而结构方程模型(SEM) 则是对回归分析的深入。
10
一、结构方程模型的概念
结构方程模型(structural equation modeling,简称 SEM) ,早期称为线性结构关系(Linear Structural Relationships ,简称LISREL) ,是评价理论模型与经 验数据一致性的统计方法。
18
SEM的模式
结构模式 (structural model) 结构模式旨在考验潜在变项间之因果路径关系, 主要针对潜在变量进行径路分析,以考验结构模式的 适配性 。
潛在变量路徑分析(Path Analysis with Latent Variables, PA-LV) 19
20
例3:研究生研究论文
兩因子模型下,且能提供良好適合度,本例題 測試在單因子模型下是否能提供更加適合度? 樣本數 :145個學生 指標變數:文章閱讀, 造句能力, 字彙能力, 加法能力, 計數能力 潛伏變數:語言, 數學
40
路徑圖:學生智力測驗成績 (P.192)
語言
=1
採用Single
數學
dimension 文章 閱讀 δ1 造句 能力 δ2 字彙 能力 δ3 加法 能力 計數 能力
注:袁振国,教育部社会科学司副司长,北京师范大学教育学院教授、博士生导师。
1
2
结构方程模型(SEM)入门
云南大学 高等教育研究院 解亚宁
SEM
3
导言-1
心理学或教育学研究的一个主要 目的是通过分析变量与变量之间的关系 来揭示心理或教育现象的发展以及变化 规律与特点,如相关分析。
X1
r
X2
相关分析(Correlational Analysis)
37
模型的估计
用观测资料估计模型的参数方法有很多, 最常用的有三种,即最大概似法、广义 最小平方法和渐近分布自由法。
38
拟合概念
当我们测试某一模型时,其实是在研究自 己所提的模型(即哪些变量之间有关,哪 些则没有) 是否与数据拟合。
39
三、分析过程与结果示例
例題:學生智力測驗成績之前分析建立在
(二)整体模型拟合度指标数值范围及临界值
49
50
五、结构方程模型的用途
(一)李茂能(2007) 1、考验理论模式(test of theory) 2、考验测量工具的建构信度(construct reliability)或因素结构 效度(validity of factorial structure)
軟體操作:學生智力測驗成績 (P.192)
43
軟體操作:學生智力測驗成績 (P.192)
參數最大概似估計、標準誤、t值:
語言:相關性較大、標準誤0.07、t值顯著>2 數學:相關性小、標準誤0.09、t值<2不顯著
兩潛伏變數之間 的相關係數為1
殘差變異數估計、 標準誤、t值
44
軟體操作:學生智力測驗成績 (P.192)
35
模型的发展策略
即研究者先利用理论界定出一个起始模型, 再搜集一组资料检验其匹配程度。如果不是 相当匹配,可运用SEM统计中的某种指数了 解需要修正的地方,如果需修正处有着健全 的理论可解释则将其修正,这是一般研究者 常用的策略。
36
模型识别
模型的识别分为低识别、恰好识别和过度识 别三种。 对SEM理论不十分清楚的研究者,往往会忽 略模型识别的问题,只是将其交给统计软件 处理,即不知其中存在诸多复杂的问题,对 此应当阅读有关书藉,详细了解模型识别的 问题。
引言
袁振国在译完威廉·维尔斯曼的教育研究方法 导论》后在其前言中评论道“ 总觉得教育研究方 法过于传统,研究的手段也比较落后。而在世纪 年代中期由瑞典统计学家—心理测量学家提出的 结构方程模型(简称SEM)则提供了一种新的统计方 法和研究思路。它能有力地解决教育研究中的问 题,应当引起教育界的重视,理应成为教育研究 的有力工具。
47
(二)整体模型拟合度指标数值范围及临界值
指 標 名 稱 與 性 質 卡方檢驗 2 test 理論模型與觀察模型的契合程度 2/df(Wheaton et al.) 考慮模式複雜度後的卡方值 適合度指標 GFI(Bentler, 1983) 假設模型可以解釋觀察資料的比例 AGFI(Bentler, 1983) 考慮模式複雜度後的 GFI PGFI(Mulaik, 1989) 考慮模式的簡約性 NFI(Bentler & Bonett, 1980) 比較假設模型與獨立模型的卡方差異 NNFI(Bentler & Bonett, 1980) 考慮模式複雜度後的 NFI 0-1 0-1* 0-1 0-1 0-1* >.90 >.90 >.50 >.90 >.90 說明模型解釋力 不受模式複雜度 影響 說明模型的簡單 程度 說明模型較虛無 模型的改善程度 不受模式複雜度 48 影響 P>.05 <2 說明模型解釋力 不受模式複雜度 影響 範圍 判斷值 適用情形
卡方值 χ2 = 59.47
GFI = 0.88 <0.90 AGFI= 0.63 <0.80 RMR = 0.14 >0.05
(皆低於可接受水準) 模型配適度不佳
45
學生智力測驗成績-綜合比較
二因子模型
卡方值 GFI AGFI 2.93 0.99 0.97
單因子模型
59.47 0.88 0.63
33
验证模型策略
即根据搜集的经验资料严格检验研究者 界定的理论模型,以确定所检验理论模 型是接受还是拒绝,所谓严格检验是指 当模型被拒绝时,不再寻找接受模型的 可能线索。
34
竞争模型策略
即研究者事先界定多个可替代的理论模型, 再搜集一组经验资料以检验哪一个理论模型 与经验资料最匹配。譬如对智力既可用 Spearman的二因素理论解释,也可用 Thurstone的群因素理论解释,还可以用卡特 尔的简明层次论解释等,对于哪一种解释方 式最好,以往的统计技术难以处理, SEM却 可以有效地处理这类问题,采用竞争模型更 符合实际情况。
δ4
δ5
χ2、 GFI、AGFI、
41
軟體操作:學生智力測驗成績 (P.192)
指標變數
Title Confirmatory Factor Analysis for student test performance Observed Variables 文章閱讀 造句能力 字彙能力 加法能力 計數能力 Correlation Matrix= 1 相關矩陣 0.722 1 0.714 0.685 1 0.203 0.246 0.170 1 潛伏變數 0.095 0.181 0.113 0.585 1 Sample Size=145 定義潛伏變數之間的關係 Latent Variables 語言 數學 Relationships: 相關係數為1,不具區別效度 文章閱讀=語言 定義指標變數與 造句能力=語言 輸出指令 潛伏變數之關係 字彙能力=語言 SE: 標準誤 加法能力=數學 TV: t檢定 計數能力=數學 SET the Covariance of 語言 and 數學 to 1 RS: 常態化殘差與Q圖 Path Diagram 42 MI: 修飾指標 LISREL OUTPUT SE TV RS MI
β1
e
y
x1 x2
β2
y = b1 x1 + b 2 x2 + e
6
在回归分析基础上,还发展了路径分 析,进一步把变量之间复杂关系,例如因 果交错关系。
e1
e2
x1
y1
y2
x2
路径分析(Path Analysis)
7
问题提出
但是,现实中变量之间的关系要复杂得多,各 自变量之间可能存在因果关系,因变量也可能是某 个或某几个自变量的原因,有时需要处理多个原因 和多个结果的关系。 特别是会遇到不可直接观测的变量,这种变量 称为潜在变量(Latent Variables) ,诸如社会经济地 位、智力等都不能准确、直接地加以测量。 社会经济地位
信度:观测变量与潜在变量之间相关程度(>0.7) 效度:可分为下列两种
收敛效度(convergent validity):对相同特性(construct, concept, or research variables)使用不同衡量方法(Likert scale, Stapel scale, or semantic differential),所得结果高度相关。 区别效度(discriminant validity):不同建构(construct, 即研究变数或称concept) 彼此之间确实不相同。
e1 e2 e3 e4
y1
y2 y3 f1
y4 y5 y6
17
e5 e6
f2
验证性因素分析 (Confirmatory Factor Analysis,CFA)
e1
y1
r1
e2
e3 e4 e5 e6
y2
y3 y4 y5 y6