当前位置:文档之家› 第8讲 因子分析与对应分析

第8讲 因子分析与对应分析


4、主成分表
列出了所有的主成分,且按照特征根从大到小次序排列。
说明:第一主成分特征根为5.280,方差贡献率为88.001%,前两个主成 分的累计贡献率为94.504%,根据提取因子的条件——特征值大于1, 本例只选出一个因子。
5、碎石图
按照特征根大小排列的主成分散点图。纵坐标为特征值,横坐标为因子数。
8、因子得分的协方差矩阵
反映各因子间的联系程度。
注:本例只提取了一个公共因子,故表格内容无实际意义。
例2 利用因子分析过程分析一年内各个城市的日照情况。 数据文件:“主要城市日照数.sav” 。
【Analyze】/【Data Reduction】/【Factor】 要求:选入分析变量
要求:输出因子分析适用条件的检验
(2)然后,根据相关性(或相似性)的大小把变量(或样品)分 组,使得同组内的变量(或样品)之间的相关性(或相似性)较 高,但不同组的变量相关性(或相似性)较低。
依据处理的对象不同,可以分为两类: R型因子分析,对变量做降维处理 Q型因子分析,对样本做降维处理
•R型因子分析
因子分析的几个概念: • 1、因子载荷
Plots:设置需要输出图形
(输出对应分析图) 双变量散点图
行点图 列点图
限制标签长度
输出各行变量分类对应于行得分的散点图 输出各列变量分类对应于列得分的散点图
(图形维度)
输出分析结果的所有维度 限制输出维度的数目
结果解读:
1、对应分析表
给出不同年龄阶段的人群分别投票给三位总统候选人的人数。
2、结果汇总表
第一节 因子分析——【Factor】过程
主成分分析的推广和发展,对观测量数目要求至少是变量的5倍以上, 且越多越好
一、因子分析简介
• 做什么? 因子分析是多元统计分析中处理降维的一种统计方法,它主要将 具有错综复杂关系的变量或者样品综合为数量较少的几个因子, 以再现原始变量与因子之间的相互关系。
• 基本思想: (1)首先,通过变量(或样品)的相关系数矩阵(或相似系数矩 阵)内部结构的研究,找出能控制所有变量(或样品)的少数几 个随机变量(常称为因子)去描述多个变量(或样品)之间的相 关(相似)关系;
提取一个主成分即可
6、因子负荷矩阵
用来反映各个变量的变异主要由哪些因子解释。
X1 0.977F1 1,L , X 6 0.927F1 6
7、因子得分系数矩阵
得出用各个变量的线性组合表达的主成分。
F1 0.185X1 0.182X 2 0.163X3 0.182X 4 0.178X5 0.176X6
(维度对点惯量的贡献量)
5、对应分析图
首先看同一变量的不同分组在某一侧维度上靠的远近程度,较近表示这些分组在该 维度上区别不大,比如第二维度;然后看不同变量的各分组间的位置,从图形中心 (0,0)出发,相同方位上大致相同的区域内的不同变量的分组彼此有联系。
说明:可看出45~64岁这个阶段的选民都倾向于克林顿,其他的 没有明显的倾向性。
说明:第一主因子主要由前5个 变量决定,第二主因子主要由 中间4个变量决定,第三主因子 主要由最后3个变量决定。
7、因子转换矩阵
旋转前的因子载荷矩阵乘以因子转换矩阵等于旋转后的因子载荷矩阵。
8、因子旋转后的因子载荷图
图中的坐标轴就是各个主因子。
9、因子得分系数矩阵
得到因子得分表达式。
F1 0.195X1 0.229X 2 0.252X 3 L 0.169X12 F 2 0.142X1 0.126X 2 0.048X 3 L 0.100X12 F3 0.081X1 0.015X 2 0.086X 3 L 0.516 X12
6、旋转后因子载荷矩阵
经过正交旋转后的因子载荷矩阵,给出旋转后的各变量的因子表达式。
X1 0.837F1 0.014F 2 0.463F3 X 2 0.882F1 0.013F 2 0.375F3 L X12 0.140F1 0.018F 2 0.913F3
KMO大于0.9时效果最佳,小于0.5时不适宜做因子分析。 Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果
结论是不拒绝该假设,则表示各个变量都是各自独立的。
3、变量共同度表
给出了提取公共因子前后各变量的共同度(衡量公共因子的相对重要性指标)
该变量95.4%的 信息已经被提取
说明:比如变量X1的共同度位0.954,即提取的公共因子对变量X1的 方差做出了95.4%的贡献。
第三节 最优尺度分析 ——【Optimal Scaling】过程初步认识
【Analyze】/【Dimension Reduction】/【Optimal Scaling】
分析变量中存在无序多分类变量时 (确定是在不同变量间分析还是在几组变量间分析)
(当数据中存在复选集变量时) (分析方法) 多元对应分析 分类变量主成分分析 非线性典型相关分析
第12章 因子分析与对应分析
主成分分析——【Factor】过程
对观测量数目没有严格要求
主成分分析是将多个指标化为少数相互无 关的综合指标的统计方法,通常数学上的处理 就是将原来的p个指标做线性组合,作为新的综 合指标,记第一个综合指标为F1。
选取这个线性组合的原则是令F1的方差最 大,称F1为第一主成分;然后选取第二主成分 F2,且F1与F2的协方差为0,类似构造其余的 主成分。
3、主成分表
说明:第一主成分特征根为6.854,方差贡献率为57.041%,前3个 主成分的累积贡献率为84.421%,根据提取因子的条件——特征值 大于1,本例选出3个因子。
4、碎石图
说明:前3个主成分的特征根都在1以上。
5、因子载荷矩阵
给出各变量的因子表达式。
X1 0.852F1 0.435F 2 0.015F3 X 2 0.854F1 0.419F 2 0.115F3 L X12 0.562F1 0.164F 2 0.715F3
要求:用均值代替缺失值
(选择缺失值处理方法)
因子载荷矩阵和结构矩阵按数值大小排序 不显示绝对值小于指定数的载荷系数
(选择系数的输出方式)
结果解读:
1、相关系数矩阵表
变量间相关性很高
2、 KMO检验和Bartlett球形检验结果表
接近0.9,适合 做因子分析
拒绝原假设,认为 各变量之间不独立
注: KMO检验用于检验变量间的偏相关系数是否过小,一般,
(收敛时的最大迭代次数)
公共因子的提取方法: (1)主成分分析法(默认); (2)不加权最小二乘法; (3)广义最小二乘法; (4)极大似然法; (5)主轴因子法; (6) 因子法; (7)影像因子法
Rotation:选择因子旋转的方法
方差最大化正交旋转 斜交旋转法
(因子旋转的方法)
四分旋转法 平均正交旋转法 斜交旋转法
当一些变量为有序分类或者连续性变量时使用,该方法使用主成分 提取方式,以尽量稍等主成分解释尽量多的原始信息。
输出主成分转换矩阵
(设置旋转解的输出)
输出二维或三维的因子载荷图
Factor Scores:因子得分
要求:输出因子得分系数矩阵
回归法 巴特列特法 安德森-鲁宾法
(在数据文件中建立一个新变量,用于保存各观测量的因子得分) (因子得分计算方法)
(输出因子得分系数矩阵及因子协方差矩阵)
Options对话框
(相关矩阵)
相关系数矩阵的逆矩阵 再生相关系数矩阵
反映像协方差阵和相关阵
Extraction:选择因子提取的方法
要求:输出碎石图
(选择公共因子的提取方法)
相关矩阵 协方差矩阵
(设定公共因子提取标准)
显示未经旋转变换的因子提取结果 显示碎石图,体现各因子重要程度
以特征根大于指定数值为提取标准
自定义提取因子的数量
要求:输出碎石图
要求:输出因子得分系数阵
要求:采用方差最大化正交旋转;输出因子载荷图
结果解读:
1、 KMO检验和Bartlett球形检验结果表
说明: KMO检验结果为0.798,大于0.5,比较适合作因子分析; Bartlett球形检验的Sig.值为0,各变量不独立。
2、变量共同度表
说明:变量“Jan”的共同度为0.915,即选取的公共因子提取了变量 “Jan”91.5%的信息。
Descriptives:选择需要输出的统计量
要求:输出相关系数矩阵;进行因子分析适用条件的检验
所有变量间的相关系数矩阵 显著性水平
相关系数矩阵的行列式值 KMO 检验和Bartlett球形检验
(统计量)
单变量描述统计量:各分析变量的均值、标准差及观测数 原始分析结果:原变量的公因子方差、与变量相同个数的因 子、各因子的特征根及其所占总方差的百分比和累计百分比
列出维数、奇异值(惯量的平方根)、惯量(又指特征根)、总的卡方检验及Sig.值
维数
奇异值
特征根 总的卡方检验
注:惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量 联系的程度。
说明:表中两个维度分别解释了总信息量的99.6%和0.4%,说明二维 图形完全可以表示两个变量间的信息,且观察时以第一维度为主。
Model:模式子对话框
(设置分析结果维数) (选择距离测量方式) 卡方距离 欧氏距离,主要用于连续变量
(变量的标准化方式)
对称法(默认)
(正则化方法)
Satistics:设置需要输出的统计量
输出对应分析表(列联表) 输出行点概述表 输出列点概述表 指定的前n个维度输出基于行列得分的原始表格
输出行轮廓表 输出列轮廓表 (输出行点和列点的标准差、以及各维度坐标间的相关系数)
例2 利用简单对应分析过程分析不同年龄段选民的倾向。 数据文件:voter.sav
相关主题