第七章 因子分析7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p =因子载荷阵为11121212221212(,,,)m m m p p pm a a a a a a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Ai X 与j F 的协方差为:1Cov(,)Cov(,)mi j ik k i j k X F a F F ε==+∑=1Cov(,)Cov(,)mikk j i j k aF F F ε=+∑=ij a若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了变量iX对公共因子jF的相对重要性。
变量共同度2211,2,,mi ijjh a i p===∑2221122()()()()()i i i im m iD X a D F a D F a D F Dε=++++22i ihσ=+说明变量iX的方差由两部分组成:第一部分为共同度2ih,它描述了全部公共因子对变量iX的总方差所作的贡献,反映了公共因子对变量iX的影响程度。
第二部分为特殊因子iε对变量iX的方差的贡献,通常称为个性方差。
而公共因子jF对X的贡献2211,2,,pj ijig a j m===∑表示同一公共因子jF对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。
7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。
但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。
这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。
这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。
最大方差旋转法是一种正交旋转的方法,其基本思路为:①A其中令***(),/ij p m ij ij ia d a h⨯===A AΓ211pj ijid dp==∑*A的第j列元素平方的相对方差可定义为2211()pj ij jiV d dp==-∑②12mV V V V=+++最大方差旋转法就是选择正交矩阵Γ,使得矩阵*A所有m个列元素平方的相对方差之和达到最大。
7.5 试分析因子分析模型与线性回归模型的区别与联系。
答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。
而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系, 用函数关系式表达出来。
因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。
即1122i i i im m iX a F a F a Fε=++++,(1,2,,i p=)该模型可用矩阵表示为:=+X AFε而回归分析模型中多元线性回归方程模型为:其中是常数项,是偏回归系数,是残差。
因子模型满足:(1)m p≤;(2)(,)0Cov=Fε,即公共因子与特殊因子是不相关的;(3)101()01F mD⎡⎤⎢⎥⎢⎥===⎢⎥⎢⎥⎣⎦D F I,即各个公共因子不相关且方差为1;(4)21222()pDεσσσ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Dε,即各个特殊因子不相关,方差不要求相等。
而回归分析模型满足(1)正态性:随机误差(即残差)e服从均值为 0,方差为σ2的正态分布;(2)等方差:对于所有的自变量x,残差e的条件方差为σ2,且σ为常数;(3)独立性:在给定自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设);(4)无自相关性:各随机误差项e互不相关。
两种模型的联系在于都是线性的。
因子分析的过程就是一种线性变换。
7.6 设某客观现象可用X=()’来描述,在因子分析时,从约相关阵出发计算出特征值为由于,所以找前两个特征值所对应的公共因子即可,又知对应的正则化特征向量分别为(0.707,-0.316,0.632)’及(0,0.899,0.4470)’,要求:(1)计算因子载荷矩阵A,并建立因子模型。
(2)计算共同度。
(3)计算第一公因子对X的“贡献”。
解:(1)根据题意,A==建立因子模型为(2)(3)因为是从约相关阵计算的特征值,所以公共因子对X的“贡献”为。
7.7 利用因子分析方法分析下列30个学生成绩的因子构成,并分析各个学生较适合学文科序号数学物理化学语文历史英语1 65 61 72 84 81 792 77 77 76 64 70 553 67 63 49 65 67 574 80 69 75 74 74 635 74 70 80 84 81 746 78 84 75 62 71 647 66 71 67 52 65 578 77 71 57 72 86 719 83 100 79 41 67 5010 86 94 97 51 63 5511 74 80 88 64 73 6612 67 84 53 58 66 5613 81 62 69 56 66 5214 71 64 94 52 61 5215 78 96 81 80 89 7616 69 56 67 75 94 8017 77 90 80 68 66 6018 84 67 75 60 70 6319 62 67 83 71 85 7720 74 65 75 72 90 7321 91 74 97 62 71 6622 72 87 72 79 83 7623 82 70 83 68 77 8524 63 70 60 91 85 8225 74 79 95 59 74 5926 66 61 77 62 73 6427 90 82 98 47 71 6028 77 90 85 68 73 7629 91 82 84 54 62 6030 78 84 100 51 60 60解:令数学成绩为X1,物理为X2,化学为X3,语文为X4,历史为X5,英语为X1,用spss 分析学生成绩的因子构成的步骤如下:1. 在SPSS窗口中选择Analyze→Data Reduction→Factor,调出因子分析主界面,并将六个变量移入Variables框中。
图7.1 因子分析主界面2. 点击Descriptives按钮,展开相应对话框,见图7.2。
选择Initial solution复选项。
这个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。
单击Continue按钮,返回主界面。
图7.2 Descriptives子对话框3. 点击Extraction按钮,设置因子提取的选项,见图7.3。
在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法”。
在Analyze栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。
在Display 栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。
在Extract栏中指定因子提取的数目,有两种设置方法:一种是在Eigenvalues over后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在Number of factors后的矩形框中输入要求提取的公因子的数目。
这里我们均选择系统默认选项,单击Continue按钮,返回主界面。
图7.3 Extraction子对话框4.点击Rotation按钮,设置因子旋转的方法。
这里选择Varimax(方差最大旋转),并选择Display栏中的Rotated solution复选框,在输出窗口中显示旋转后的因子载荷阵。
单击Continue按钮,返回主界面。
图7.4 Rotation子对话框5.点击Scores按钮,设置因子得分的选项。
选中Save as variables复选框,将因子得分作为新变量保存在数据文件中。
选中Display factor score coefficient matrix复选框,这样在结果输出窗口中会给出因子得分系数矩阵。
单击Continue按钮返回主界面。
图7.5 Scores子对话框6. 单击OK按钮,运行因子分析过程。
结果分析:表7.1 旋转前因子载荷阵表7.2 旋转后因子载荷阵成份矩阵a成份1 2x1 -.662 .503x2 -.530 .478x3 -.555 .605x4 .900 .233x5 .857 .357从表7.1中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,为了便于对因子进行命名,需要对因子载荷阵进行旋转,得表7.2。
经过旋转后的载荷系数已经明显地两极分化了。
第一个公共因子在后三个指标上有较大载荷,说明这三个指标有较强的相关性,可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。
根据表7.3易得:6432.05378.04332.03137.02085.01064.01XXXXXXF+++++=6169.05073.04014.03484.02400.01439.02XXXXXXF+++++=表7.3 因子得分系数矩阵将每个学生的六门成绩分别代入F1、F2,比较两者的大小,F1大的适合学文,F2大的适合学理。