结构方程模型的应用及分析策略侯杰泰成子娟(香港中文大学教育学院东北师范大学教育学院,130024)摘要:差不多所有心理、教育、社会等概念,均难以直接准确测量,结构方程(SEM,Structural Equation Modelling)提供一个处理测量误差的方法,采用多个指标去反映潜在变量,也令估计整个模型因子间关系,较传统回归方法更为准确合理。
本文主要用一系列有关学习动机的虚拟例子,指出每个问题的主要分析策略,以展示SEM在教育及心理学可以应用的研究范畴。
文内探讨的方法包括:验证性因素、高阶因子、路径及因果分析、多时段(multiwave)设计、单形模型(Simple Model)、及多组比较等。
关键词结构方程验证性因素分析路径及因果分析高阶因子多组比较结构方程(SEM,Structural Equation Modelling)、协方差结构模型(Covariance Structure Modelling、LISREL)等类似名词已渐流行,并成为一种十分重要的数据分析技巧;在大学高等学位研究课程,它是多变量分析(multivariate analysis)的重要课题;比较重要的社会、教育、心理期刊,也早已特开专栏介绍(如:候,1994;Connell & Tanaka,1987;Joreskog & Sorbom,1982);可见SEM在统计学中所建立的声望及崇高地位是无容置疑的。
本文主要用一系列有关学习动机的虚拟例子,来指出每个问题的主要分析策略,以展示结构方程模型在教育及心理学可以应用的研究范畴。
一、结构方程:优点及拟合概念1.数学模式很多社会、心理等变项,均不能准确地及直接地量度,这包括智力、社会阶层、学习动机等,我们只好退而求其次,用一些外项指标(observable indicators),去反映这些潜伏变项。
例如:我们以学生父母教育程度、父母职业及其收入(共六个变项),作为学生家庭社经地位(潜伏变项)的指标,我们又以学生中、英、数三科成绩(外显变项),作为学业成就(潜伏变项)的指标。
简单来说SEM可分测量(measurement)及潜伏变项(latent variable)两部分。
测量部分就是求出六个社经指标与社经地位(或三科成绩与学业成就)(即外显指标与潜伏变项之间)的关系:而潜伏变项部分则指社经地位与学业成就(即潜伏变项与潜伏变项间)的关系。
指标(外显变项)含有随机(或系统)性的量度上误差,但潜伏变项则不含这些部份。
SEM可用以下矩阵方程表示(Bollen,1989;Joreskog & Sorbom,1993):η=βη+Γξ+ζ(a)对于潜伏变项(如:社经地位与学业成就)的关系,即潜伏变项部份:η——内生(依变)(endogenous,dependent)潜伏变项(如:学业成就)ξ——外源(自变)(exogenous,independent)潜伏变项(如:社经地位)β——内生潜伏变项间的关系(如:学业成绩与其他内生潜伏变项的关系)г——外源变项对内生变项的影响(如:社经地位对学业成就)ζ——模式内未能解释部份(即模式内所包含的变项及变项间关系所未能解释部分)(b)对于指标与潜伏变项(例如:六个社经指标与社经地位)间的关系,即测量模式部分:X=Λxξ+δY=Λyη+εX,Y是外源(如:六项社经指标)及内生(如:中、英、数成绩)指标。
δ,ε是X,Y 测量上的误差。
Λx是X指标与ξ潜伏变项的关系(如:六项社经地位指标与潜伏社经地位的关系)。
Λy是Y指标与η潜伏变项的关系(如:中、英、数成绩与学业成就间关系)。
在一典型分析过程中,我们输入:各指标变项的协方差矩阵(covariance matrix)、总受试人数、指标与潜伏变项的从属关系(指标如何归属于各潜伏变项)。
程式(如:LISREL)会估计指标与潜伏、潜伏与潜伏、模式未能解释部份、指标测量上误差等指定参数,其数值亦反映各关系的强弱。
此外程式亦计算研究者所提出的模型,是否与样本数据吻合(即数据是否可用模式表示)。
2.SEM优点Bollen和Long(1993)指出SEM有数项优点(江&侯,1997;林&侯,1995;Marsh,Hau,Balla & Grayson,1998),包括:(1)可同时考虑及处理多个依变项(endogenous / dependent variable);(2)容许自变及依变(exogenous / endogenous)项含测量误差;(3)与因素分析类同,SEM容许潜伏变项(如:社经地位)由多个观察指标变项(如:父母职业、收入)构成,并可同时估计指标变项的信度及效度(reliability and validity);(4)SEM可采用比传统方法更有弹性的测量模型(measurement model),如某一指标变项/题目从属于两潜伏因子;在传统方法,项目多依附单一因子;(5)研究者可构划出潜伏变项间的关系,并估计整个模式是否与数据拟合。
3.拟合概念当我们测试某一模型时,其实我们在研究自己所提的模型(即哪些变项之间有关,哪些则没有),是否与数据拟合。
SEM所输入的是指标变项的样本协方差矩阵(S,sample covariancematrix)(注:虽然在一些SEM分析中,我们必须用协方差矩阵,但为方便了解,读者亦可假设下述所有协方差矩阵为相关矩阵correlation matrix),而依我们指定先验(a priori)模式,计算出一个最佳的衍生矩阵(E, reproduced/fitted covariance matrix); E与S接近,则表示我们建议的模型成立,若E与S差异大,则表示模型与数据不符;拟合优指数(CFI)是用于反映E与S差异的一个总指标。
用以表达数据与模型吻合程度的指数甚多(e.g,侯、成、钟,1995;Marsh,Balla,& Hau, 1996),为简便起见,在下文我们只用CFI,当指数愈接近1,吻合愈好;指数愈小,则表示吻合愈差。
例如:我们有A、B、C、D、E、F六潜伏变项,我们建议的模型是:A、B是有相关,而A、B引起C、D;C、D则导致E、F。
假设S是所有指标变项(构成A、B、C、D、E、F的所有指标)的协方差矩阵,而E则是LISREL依上述模型估计出的最佳衍生矩阵;若拟合优指数高则表示E与S差异甚小,反之,则E与S差异甚大。
二、常用结构模型之应用我们用一系列有关学习动机的虚拟例子,以说明结构方程模型的一些应用范围。
所有模型的拟合结果及路经系数,均只设计用于协助讨论,并非由真实数据所得。
在学习动机理论中,我们知道那些相信智力主要是后天决定的学生,他们更多倾向勤奋学习;相反,那些认为智力是遗传天生的,遇困难易于放弃(e.g., Dweck, Chiu & Hong, 1995; Hau & Salili, 1996),这种智力的内隐理论(implicit theory)影响著学生的动机行为。
1.验证性因素分析假设我们不单对智力内隐理论有兴趣,我们也希望了解学生对性格、道德、创造力、情绪智力的看法,这五种个人属性是否天生不变?还是后天努力而形成的?我们设计一份共25题的问卷,每一属性各5题,用9点量表([十分同意]至[十分不同意];例如:在智力属性,[聪明与否,主要是由遗传决定的])。
被试为500名初中三学生。
我们首先当然希望验证25项题目是否一如编写题目时的构念一样,分别从属五个因子。
与传统探索性因素分析(EFA)不同,在验证性因子分析(CFA),我们可以限制题目与各因子的从属关系,一般来说每题只从属一个因子;相反地,在EFA,各题对每一因子都有或大或小的负荷。
电脑程式如LISREL依据输入的相关矩阵(25×25)、被试人数及题目与因子的从属关系(模型M1:25题分别从属五因子),计算得拟合优指数CFI=.96;结果也显示就算我们容许题目同时从属其他非原定因子,CFI并无多大改善。
这些结果说明整份问卷的结构符合原本设计时的构思。
2.高阶因子分析一些心理学家可能认为人是有一深层的统一世界观(Dweck et al., 1995),那些相信智力是天生的人也认为道德、性格等也是天生不变的。
反之,认为努力更为重要者则会感到所有个人属性也易于由努力改变。
也就是说,人可能有一个对不同属性均相同统一的看法,反映着每人更深层的世界观。
为验证这假设是否合理,我们用同一个数据(25×25相关矩阵),比较三个模型:M1为五个因子各含五项题目,因子间容许相关;M2与M1相似,但因子间完全独立(不容许相关);M3与M1相似,但因子间相关由一个高阶因子取代,高阶因子凌驾于五个一阶因子之上。
结构模型其中一个优点是容许我们比较不同模型,以决定哪个理论更为合理。
假设M1与M2拟合优度相约,因M2是一个更为省俭的模式,可以用更少的参数以表达变量的关系,故应取M2,结论应为各因子间并无重大关系,也就是说各属性的内隐观并不一致。
不过如果M1比M2更吻合数据,但M3则与M1相约(相差不大),这表示因子间存有不可忽略的相关,但各因子间的关系有颇大的共通性,由单一个高阶因子表达并无不可。
由上述25×25相关矩阵作输入数据,M1的CFI=.96,M2的CFI=.50,M3的CFI=.93。
结果颇支持学生有一深层内隐观的看法,这令他们对不同个人属性有统一的观念。
3.路径及因果分析我们相信学生对各个人属性的内隐观直接影响他们日常的行为及选择。
对每一属性,我们选择了五个行为指标,请学生自己陈述他们的行为习惯,例如:在智力方面[我每次遇到困难时,都不理成败,当作是一学习及成长的机会。
]。
假设这行为方面问卷的结构、信度及效度已在另外一个独立研究,包括用SEM得以证立。
我们请1000名初中三学生回答这两份内隐观及行为取向问卷,共50题。
结构上共有10个因素(5个个人属性内隐观及5个对应的行为因子),问卷本身各题目正负方向并不统一,经电脑程式调整后,高分表示更相信后天努力的影响(增长观)及更积极进取的行为态度。
本次的研究有两个目的,包括(i)究竟是否存在一个学生深层的内隐世界观,影响学生整体行为取向?(ii)这影响的大小如何?对于(i)项,我们设计了两个模型。
M4内,25题内隐观及25题行为指标分别从属五个因子(共十因子),五个属性内隐观如上文再构成一个二阶的[深层世界观]因子;而同理,五个行为因子间关系也由一个[一般积极取向]的行为二阶因子表示。
我们主要希望求出M4的拟合优度及[世界观]因子至[积极取向]的路径系数。
此外我们也构划另一模型M5,M5与M4不同之处是M5不含高阶因子,我们假设每一内隐观因子直接影响其对应的行为因子(非透过高阶因子)。