AMOS输出解读惠顿研究惠顿数据文件在各种结构方程模型中被当作经典案例,包括AMOS 和LISREL。
本文以惠顿的社会疏离感追踪研究为例详细解释AMOS的输出结果。
AMOS同样能处理与时间有关的自相关回归。
惠顿研究涉及三个潜变量,每个潜变量由两个观测变量确定。
67疏离感由67无力感(在1967年无力感量表上的得分)和67无价值感(在1967年无价值感量表上的得分)确定。
71疏离感的处理方式相同,使用1971年对应的两个量表的得分。
第三个潜变量,SES(社会经济地位)是由教育(上学年数)和SEI (邓肯的社会经济指数)确定。
解读步骤1.导入数据。
AMOS在文件ex06-a.amw中提供惠顿数据文件。
使用File/Open,选择这个文件。
在图形模式中,文件显示如下。
虽然这里是预定义模式,图形模式允许你给变量添加椭圆,方形,箭头等元素建立新模型2.模型识别。
潜变量的方差和与它关联的回归系数取决于变量的测量单位,但刚开始谁知道呢。
比如说要估计误差的回归系数同时也估计误差的方差,就好像说“我买了10块钱的黄瓜,然后你就推测有几根黄瓜,每根黄瓜多少钱”,这是不可能实现的,因为没有足够的信息。
如何告诉你“我买了10块钱的黄瓜,有5根”,你便可以推出每根黄瓜2块钱。
对潜变量,必须给它们指定一个数值,要么是与潜变量有关的回归系数,要么是它的方差。
对误差项的处理也是一样。
一旦做完这些处理,其它系数在模型中就可以被估计。
在这里我们把与误差项关联的路径设为1,再从潜变量指向观测变量的路径中选一条把它设为1。
这样就给每个潜变量设置了测量尺度,如果没有这个测量尺度,模型是不确定的。
有了这些约束,模型就可以识别了。
注释:设置的数值可以是1,也可以是其它数,这些数对回归系数没有影响,但对误差有影响,在标准化的情况下,误差项的路径系数平方等于它的测量方差。
3.解释模型。
模型设置完毕后,在图形模式中点击工具栏中计算估计按钮。
输出如下。
蓝色字体用于注解,不是AMOS输出的一部分。
TitleExample 6, Model A: Exploratory analysis Stability of alienation, mediated by ses. Correlations, standard deviations and means from Wheaton et al. (1977).以上是标题,全是英文,自己翻译去吧。
Notes for Group (Group number 1)The model is recursive.Sample size = 932各组注释:它告诉你模型为递归模型,样本量为932。
Variable Summary (Group number 1)Your model contains the following variables (Group number 1)Observed, endogenous variablesanomia67powles67anomia71powles71educatioSEIUnobserved, endogenous variables71_alienation67_alienationUnobserved, exogenous variableseps1eps2eps3eps4sesdelta1zeta1zeta2delta2变量汇总:对模型中的变量作一些概括,内生观测变量:67无力感,67无价值感,71无力感,71无价值感,教育和SEI。
内生潜变量:67疏离感,71疏离感。
外生潜变量:各种误差和社会经济地位。
注释:观测变量与潜变量的区别:一个用方形表示,一个用椭圆表示。
内生和外生的区别:箭头指向自己的就是内生,发送箭头的就是外生。
注意区分测量模型和结构模型。
Variable counts (Group number 1)Number of variables in your model: 17Number of observed variables: 6Number of unobserved variables: 11Number of exogenous variables: 9Number of endogenous variables: 8变量计数:数数模型中的变量,变量总数为17,其中观测变量有6个,潜变量有11个;外生变量有9个,内生变量有8个。
Parameter summary (Group number 1)Weights Covariances Variances Means Intercepts Total Fixed 11 0 0 0 0 11 Labeled 0 0 0 0 0 0 Unlabeled 6 0 9 0 0 15 Total 17 0 9 0 0 26模型的参数概括:固定系数11个,就是模型识别中固定的11个1。
还有6个自由的系数,9个方差对应着前面外生潜变量。
Computation of degrees of freedom (Default model)Number of distinct sample moments: 21Number of distinct parameters to be estimated: 15Degrees of freedom (21 - 15): 6(内定模型)的自由度计算:21 "样本矩"是6个观测变量的6个样本方差加上15个协方差构成(也就是6中取2的组合数)。
15个参数是模型的6个回归系数和9个被估计的方差。
样本矩与估计参数的差为6个自由度。
(内定模型)迭代过程:极大似然估计是一个迭代过程。
这里给出迭代历史。
这个输出是可选的,你不必直接使用它。
Result (Default model)Minimum was achievedChi-square = 71.544Degrees of freedom = 6Probability level = .000卡方拟合指数:这是所有软件都使用的最普通的拟合检验。
AMOS 和LISREL 把它称为卡方统计量,其它软件称为卡方拟合优度和卡方拟合劣度。
卡方拟合指数检验选定的模型协方差矩阵与观察数据协方差矩阵相匹配的假设。
原假设是模型协方差阵等于样本协方差阵。
如果模型拟合的好,卡方值应该不显著。
在这种情况下,数据拟合不好的模型被拒绝。
卡方检验的问题是样本越大,越可能拒绝模型,越可能犯第一类错误。
卡方拟合指数对违反多变量正态假设也是非常敏感。
这由卡方拟合指数的计算公式可以看出:卡方统计量= (N-1) x FN 是样本量,F 是模型协方差阵和样本协方差阵的最小适配函数。
这个函数比较复杂,也不知道是哪个天才1搞出来的,它的计算公式中包含行列式,矩阵的迹,还要取对数,再经过一些加减运算把多维数据压缩为一个数值。
从卡方统计量的计算中可以看出,如果适配函数减少的速度没有样本量增加的速度快2,即使模型协方差阵与样本协方差阵拟合的很好,但样本量的增加也会导致拒绝原假设。
这种拒绝正确建议的行为就是犯了第一类错误。
如果不服从正态分布,卡方统计量会更多地拒绝真实模型。
不过好在ML估计比较稳健,所以即使违背了正态分布的假定,模型也能对付着用。
Maximum Likelihood EstimatesSEM使用最大似然法3估计模型,而不是通常的最小二乘法。
OLS 寻找数据点到回归线距离的最小平方和。
MLE寻找最大的对数似然,它反映1谢益辉注:这个函数叫差异函数,是一个叫Browne(1984)的“天才”搞出来的。
2谢益辉注:此言慢讲,没有依据。
3谢益辉注:除了ML,还有GLS、ULS、WLS、ADF等方法,其中*LS系列的都是最小二乘法。
从自变量观测值预测因变量观测值的可能性有多大4。
Regression Weights: (Group number 1 - Default model)Estimate S.E. C.R. P Label67_alienation <--- ses -.614 .056 -10.912 *** par_671_alienation <--- 67_alienation .705 .053 13.200 *** par_471_alienation <--- ses -.174 .054 -3.213 .001 par_5 powles71 <--- 71_alienation .849 .042 20.427 *** par_1anomia71 <--- 71_alienation 1.000powles67 <--- 67_alienation .888 .043 20.577 *** par_2anomia67 <--- 67_alienation 1.000educatio <--- ses 1.000SEI <--- ses 5.331 .431 12.370 *** par_3回归系数是模型中带箭头的路径系数。
为了识别模型,部分系数在模型识别中已固定为1 (例如,潜变量67疏离感到观测变量67无力感的路径)。
也给出路径系数的标准误。
"C.R." 是临界比,它是回归系数的估计值除以它的标准误(- 0.614 / 0.056 = - 10.912 )。
临界比与原假设有关,在这个案例中对67疏离感和社会经济地位的原假设是回归系数为0。
如果我们处理近似标准正态分布的随机变量,在0.05 的显著性水平上,临界比估计的绝对值大于 1.96 称之为显著。
这样67疏离感和社会经济地位的回归系数-10.912 的绝对值大于1.96,可以说这个回归系数在0.05 显著性水平上显著地不等于0 。
P值给出检验原假设总体中参数是0 的近似双尾概值。
它表示67疏离感和社会经济地位的回归系数显著地不等于0,p=0.001。
P值的计算假定参数估计是正态分布,它只是对大样本正确。
Variances: (Group number 1 - Default model)Estimate S.E. C.R. P Labelses 6.656 .641 10.379 *** par_7zeta1 5.301 .483 10.967 *** par_8zeta2 3.737 .388 9.623 *** par_9eps1 4.010 .358 11.186 *** par_10eps2 3.187 .284 11.242 *** par_114谢益辉注:这不是最大似然的本意,MLE的意思是,对未知参数取值,使得样本“发生”的概率最大。