当前位置:
文档之家› SPSS数据分析问题提出与实例导学 第11章 效度检验因素分析.ppt
SPSS数据分析问题提出与实例导学 第11章 效度检验因素分析.ppt
SPSS数据分析: 问题提出与实例导学
(第十一部分)
主讲:赵小军(安庆师范学院) 祁禄(广州大学)
第十一章 效度检验――因素分析
第一节 因素分析统计知识简介
一、R型因子分析与Q型因子分析
R型因子分析是针对变量所做的因子分析,其 基本思想是通过对变量的相关系数矩阵内部结构 的研究,找出能够控制所有变量的少数几个随机 变量去描述多个随机变量之间的相关关系。但这 少数几个随机变量是不能直接观测的,通常称为 因子。然后再根据相关性的大小把变量分组,使 同组内的变量之间的相关性较高,不同组变量之 间的相关性较低。Q型因子分析是针对样品所做 的因子分析。
具体来讲,探索性因素分析与验证性因素分析模型假设有一些区分: 【探索性因素分析的假设】
(1)所有的公共因素都相关(或都无关); (2)所有的公共因素直接影响所有的观测变量; (3)特殊因素之间相互独立; (4)所有观测变量只受一个特殊因素的影响; (5)公共因素和特殊因素相互独立 ; (6) 观测变量与潜在变量之间的关系不是事先假定的; (7)潜在变量的个数不是在分析前确定的; (8)模型通常是不可识别的。 【验证性因素分析的假设】
correlation matrix框: coefficients:相关系数矩阵 significance level:显著性水平 determinant:相关系数矩阵的行列式 inverse:相关系数矩阵的逆矩阵 reproduced:由k(k≤m)个主成分再生的原变量相关系数矩阵 anti-image:反映象相关矩阵 KMO and Bartlett’s test of sphericity :KMO检验和Bartlett检 验,它是对分析模型的适宜程度的检验。(必选)
(1)正交旋转:正交,指旋转过程中,因子之间 的轴线夹角为90度,即因子之间的相关设定为0。 有最大变异法,四方最大法,均等变异法。 (2)斜交旋转:先求得在正交因素模型下的因素 负荷矩阵B,然后对因素负荷矩阵A作斜交变换T*, 求得斜交负荷矩阵A*=BT*。这种方法因子与因子 之间具有一定的相关性。有最小斜交法,最大斜 交法和四方最小法。 至于采用何种转轴法,研究者可以根据文献探究 与理论基础分析结果作为依据,如果相关理论上 显示共同因素层面间是彼此独立,没有关系存在 的,则应采取正交转轴法;如果依理论研究所得, 因素层面间,彼此有相关并且非独立的,则应采 取斜交转轴法。在心理学与教育学中,更多的可 能应该选择斜交旋转。
因子分析运算的过程,与回归分析类似。为
了进行因子分析,必须假定每一测试的分数都符
合正态分布,对于一个给定的被试,每一测试分
数都是它在一组或因子上的分数再加上该因子测 试特有成分的线性组合。即Xij=bj1Fi1+bj2Fi 2 +……+bj mFi m+ij。其中Xij是第i个被试在第j 个子测试中的分数值,Fik是同一被试在第k个维 度上的“分数”。ij是Xij的一部分,它不能用普通 的维度来说明,可以认为是第j个测试中的特殊量。 该因子等式可写成更简单的形式:Xj=bj1F1+ bj2F2+……+bj mF m+j。这个等式的意思是 “第j个子测试的分数是在公共因子F1,F2,…,Fm 上的分数加一个特殊因子所贡献的j线性组合”。 bjk是第k个因子在第j个子测试分数中的负荷,又 称为因子分数系数。
6、[必选项] 打开extraction按纽 method 项 principal components:主成分分析法(默认选项) unweighted least square: 未加权最小二乘法 generalized least spuare: 一般化最小二乘法 maximum likehood: 极大似然法 principal axis factoring: 主轴因素法 Alpha factoring: Alpha: 因素抽取法 Image factoring: 映象因素抽取法 Analyze 用于指定分析项 Correlation matrix: 生成相关矩阵(默认选项) Covariance matrix: 生成协方差矩阵 Display 用于选择输出项 Unrotated factor solution: 输出未旋转的因子提取结果(默认选项) Scree plot: “碎石”图 Extract 项: Eigenvalues over: 提取大于输入值的特征值(默认值为“1”) Number of factors: 该项用于指定要提取的因子数目 Maximum interations for: 用于输入因子分析的最大迭代步数(默认值 为“25”)
由于是探索性因素分析,在因素分析时,根
据项目分析或题项与总分的判别,剔除题项后, 剩下的量表题项均纳入因素分析变量范围内,以 特征值等于1为判别基准时,研究者常会发觉计算 机所抽取的因素过多,或某些因素所包含的题项 不够恰当、因素命名不容易。在探索因素中,这 是可以理解的,因为受受试者填答、量表编制过 程的严谨性等变化因素的影响,常导致部分量表 的因素分析结果,不完全符合研究者当初编制的 层面因素,所以研究者可能会删除题项进行第二、 第三次的因素分析。
二、探索性因子分析与验证性因子分析
(一)探索性因子分析(EFA)就是指传统的因子分析。在 典型的EFA中,研究者通过共变关系的分解,找出共同因 子,然后进一步探讨这些共同因子与个别变量的关系,找 出观察变量与其相对应因子之间的强度,以说明因子与所 属的观察变量的关系,决定因子的内容,为因子取一个合 适的名字。
5、决定因素与命名
根据心理学专业知识,来对因素进行命 名。所以,心理学理念在因素命名中十分 重要。由此可见,质化手段和量化手段需 要在研究中同时具备。
第三节 探索性因素分析的SPSS过程
一、探索性因素分析SPSS学习的步骤
(一)理解探索性因素分析方法(注重统计意识); 理解探索性因素分析方法的以下方面:作用、前提条
三、SPSS步骤流程 (一)问题提出(学生预备知识) (二)数据分析 1、启 动 [必选项]启动SPSS,打开文件 2、打开菜单 [必选项]点击菜单Analyze
Data Reduction
Factor... 3、选择变量 [必选项]将左边方框中需要分析的变量移入variables框中
4、限制分析范围 [可选项]选择一个变量进入selection框,该变量用来限制分析 范围
由于传统的因子分析企图找出最少的因子来代表所 有的观察变量,因此研究者必须在因子数目与可解释变异 量两者间寻找平衡点。因为因子分析至多可抽取出相等于 观察变量总数的因子数目,这样,虽可解释全部100%的 变异,但失去因子分析找寻因子结构的目的,但如果研究 者企图以少数几个较明显的因子来代表所有的项目,势必 将损失部分可解释变异来作为代价。
(二)因子分析的条件
因子分析的进行必须满足以下几个条件:① 因子分析的变量都必须是连续变量,符合线性关 系的假设;②抽样过程必须随机,并具有一定规 模,专家建议样本数在100以下不宜进行因子分 析,样本数最好大于300。或样本数最少为变量 数的五倍,且大于100;③变量之间具有一定程 度的相关,对于一群相关太高或太低的变量,不 太适合进行因子分析。
(二)验证性因子分析(CFA)要求研究者 对于潜在变量的内容与性质,在测量之初 就必须有非常明确的说明或有具体的理论 基础,并已先期决定相对应的观察变量的 组成模式,进行因子分析的目的是为了检 验这一先期提出的因子结构的适合性。
三、因子分析基本思想、模型与条件
(一)因子与因子负荷
因子分析发展最初目的是在简化一群庞 杂的测量,找出可能存在于观察变量背后 的因子结构,使之更为明确,增加其可理 解性。因子分析的基本假设是那些不可观 测的“因子”隐含在许多现实可观察的事 物背后,虽然难以直接测量,但可以从复 杂的外在现象中计算、估计或抽取得到。
(三)因子数目
1、特征值 主要根据特征值的大小。特征值代表 某一因子可解释的总变异量,特征值越大,代表 该因子解释力越强。选取特征值大于1的因素。
2、碎石图 即陡坡检验。将每一个因子依其特征 值从达到小排序,当因子的特征值逐渐接近,没 有变化之时,代表特殊的因子已经无法抽取出来。
3、理论构思
(四)转轴方法
5、显示描述统计的结果和主成分分析的初始结果 [可选项] 点击descriptives statistics框: univariate descriptives:显示单变量的均值、标准差、合法观 测量数。
initial solution:输出原始变量的公因子方差、特征值、各因子 特征值占总方差的百分比以及累积百分比(默认项)
在因素抽取上,通常最初因素抽取后,对因素无法做 有效解释,转轴的目的就在于改变题项在各因素的负荷量 的大小,转轴时根据题项与因素结构关系的密切程度,调 整各因素负荷量的大小,转轴后,大部分题项在每个共同 因素中有一个差异较大的因素负荷量。
说明:※因素旋转的目的是寻找一个“最简结构”,即经 过使得:①在K个因素上所有原变量变异矢量的投影(又 称因素负荷)都尽可能都是正的;②取值为零的因素负荷 的数目尽可能地多。寻找一个“最简结构”的目的,为了 能够更加逻辑合理地辨识因素并且为它们命名。
(1)公共因素之间可以相关也可以无关; (2)观测变量可以只受某一个或几个公共因素 的影响而不必受所有 公共因素的影响;
(3)特殊因素之间可以有相关,还可以出现不存在误差因素的观测 变量;
(4)公共因素和特殊因素之间相互独立; (5)观测变量与潜变量之间的关系事先假定的; (6)潜在变量的个数在数据分析前确定的; (7)模型通常要求是可识别的。
8、scores 按钮(可选项)
save as variables: 将因子得分保存为新变量
methoห้องสมุดไป่ตู้: 用于选择因子得分方法
regression::因子得分的均值为0。方差等于估计因子的得 分和实际因子的得分之间的多元相关的平方
bartlett: 因子得分的均值为0,同时变量因子的平方和最小