当前位置：文档之家› 主成分分析和因子分析实验报告

主成分分析和因子分析实验报告

主成分分析实验报告一、实验数据2013年，在国内外形势错综复杂的情况下，我国经济实现了平稳较快发展。

全年国内生产总值568845亿元，比上年增长7.7%。

其中第三产业增加值262204亿元，增长8.3%，其在国内生产总值中的占比达到了46.1%，首次超过第二产业。

经济的快速发展也带来了就业的持续增加，年末全国就业人员76977万人，其中城镇就业人员38240万人，全年城镇新增就业1310万人。

随着我国城镇化进程的不断加快，加之农业用地量的不断衰减，工业不断的转型升级，使得劳动力就业压力的缓解需要更多的依靠服务业的发展。

（一）指标选择根据指标选择的可行性、针对性、科学性等原则，选择13个指标来衡量服务业的发展水平，指标体系如表1所示：表1 服务业发展水平指标体系（二）指标数据本次实验采用的数据是我国31个省（市、自治区）2012年的数据，原数据均来自《2013中国统计年鉴》以及2013年各省（市、自治区）统计年鉴，不能直接获得的指标数据是通过对相关原始数据的换算求得。

原始数据如表2所示：表2（续）二、实验步骤本次实验是在SPSS中实现主成分分析，具体步骤如下：（一）数据标准化，单击主菜单“Analyze”(分析)展开下拉菜单，在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述)，展开Descriptives对话框，将左面的矩形框中的变量X1、X2、 (X13)通过单击向右的箭头按钮，调入到右面的“Variables”(变量)框中。

选中Savestandardized values as variables(对变量进行标准化)复选框，点击OK按（二）单击主菜单“Analyze”(分析)展开下拉菜单，在下拉菜单中寻找“Data Reduction”弹出小菜单，在小菜单中寻找“Factor”(因子)，展开“Factor Analysis”(因子分析)主对话框。

（三）选择分析变量。

将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、…、ZX13，通过单击向右的箭头按钮，调入到右面的“Variables”(变量)框中。

（四）因子分析过程选项，主对话框选择项中共有5个功能按钮：1.单击【Descriptives】(描述统计量)按钮，展开“Descriptives”对话框，在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution（初始因子分析结果），在Correlation Matrix中选择coefficients(相关系数矩阵)、Significance levels(显著性P值)，KMO and Bartlett’s test of sphericity,点击Continue按钮。

2.在主对话框中，单击【Extraction】(因子提取)按钮，展开“Extraction”对话框，在Method中选择Principal components(主成分法)，其他均为系统默认，点击Continue按钮。

3.在主对话框中，单击【Scores】(因子得分)按钮，展开“Scores”对话框，选中Save as variables（将因子得分作为新变量保存在数据文件中）复选框，单击Continue按钮。

（五）在主对话框中，单击【OK】按钮执行运算。

三、实验结果(一)利用SPSS进行因子分析输出结果表3至表4所示。

表3中Total列为各因子对应的特征根，本实验中共提取4各公因子；% of Variance列为各因子的方差贡献率；Cumulative %列为各因子累积方差贡献率，由表中可以看出，前四个因子已经可以解释88.341%的方差。

（二）利用因子分析结果进行主成分分析1.将表4中因子载荷阵中的数据输入SPSS数据编辑窗口，分别命名为a1、a2、a3和a4。

2.为了计算第一个特征向量，点击菜单项中的Transform-Compute，调出Compute variable对话框，在对话框中输入等式：z1=a1/SQRT(6.312)点击OK按钮，即可在数据编辑窗口中得到以z1为变量名的第一特征向量。

然后以同样的方式，分别在对话框中输入等式：z2=a2/SQRT(2.851)z3=a3/SQRT(1.289)z4=a4/SQRT(1.032)得到以z2、z3、z4为变量名的第二、三、四特征向量。

这样，可得到如表6所示的特征向量矩阵。

根据表5可以得到主成分的表达式：Y1=0.220X1+0.043X2+0.308X3+0.318X4+0.388X5+0.337X6+0.369X7+0.275X8+0.365X9+0.052X10+0.075X11+0.361X12+0.074X13Y 2=0.453X 1+0.564X 2-0.193X 3-0.138X 4-0.034X 5-0.099X 6+0.001X 7-0.124X 8+0.062X 9-0.231X 10-0.121X 11+0.046X 12+0.566X 13Y 3=0.080X 1+0.038X 2+0.047X 3-0.234X 4-0.151X 5+0.218X 6-0.005X 7+0.361X 8-0.159X 9-0.367X 10+0.745X 11-0.140X 12+0.004X 13Y 4=0.187X 1-0.042X 2-0.025X 3-0.376X 4-0.045X 5-0.153X 6+0.276X 7-0.116X 8+0.073X 9+0.756X 10+0.340X 11-0.032X 12+0.112X 13再以特征根为权，对4个主成分进行加权综合，得出各地区的综合得分，具体数据见表6。

综合得分的计算公式是Y=∑=411i iλλY 1+∑=412i iλλY 2+∑=413i iλλY 3+∑=414i iλλY 4根据上式可以计算出各地区的综合得分，并可据此排序。

从表6可以看出，上海市的综合评价排在第一，原始数据也反映出其存在明显的规模优势，另外从第一个主成分看，上海市也排在第一位，同样存在效益优势；而排在最后三位的分别是西藏、甘肃、青海。

因子分析实验报告本次实验采用的是2012年反映我国31个省（直辖市、自治区）服务业发展水平的14个指标（数据见主成分分析报告表2）。

14个指标分别为：服务业增加值（X1）、服务业就业人数（X2）、服务业产值比重（X3）、服务业就业比重（X4）、人均服务产品占有量（X5）、服务密度（X6）、服务综合生产率（X7）、服务业贡献率（X8）、人均GDP（X9）、服务业增长速度（X10）、工业化水平（X11）、城市化水平（X12）、服务业全社会固定资产投资（X13）.这些指标之间有很强的相关性，如果利用所有14个指标对31个省（直辖市、自治区）进行服务业发展水平分析，难免会出现信息的重叠，而利用因子分析可以解决这个问题。

一、实验步骤本次实验是在SPSS中实现主成分分析，具体步骤如下：（一）定义变量及标签。

（二）输入数据，建立数据文件。

（三）数据标准化，单击主菜单“Analyze”(分析)展开下拉菜单，在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述)，展开Descriptives对话框，将左面的矩形框中的变量X1、X2、 (X13)通过单击向右的箭头按钮，调入到右面的“Variables”(变量)框中。

选中Save standardized values as variables(对变量进行标准化)复选框，点击OK按钮。

（四）单击主菜单“Analyze”(分析)展开下拉菜单，在下拉菜单中寻找“Data Reduction”弹出小菜单，在小菜单中寻找“Factor”(因子)，展开“Factor Analysis”(因子分析)主对话框。

（五）选择分析变量。

将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、…、ZX13，通过单击向右的箭头按钮，调入到右面的“Variables”(变量)框中。

（六）因子分析过程选项，主对话框选择项中共有5个功能按钮：1.单击【Descriptives】(描述统计量)按钮，展开“Descriptives”对话框，在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution（初始因子分析结果），在Correlation Matrix中选择coefficients(相关系数矩阵)、Significance levels(显著性P值)，点击Continue按钮。

3.在主对话框中，单击【Rotation】（旋转）按钮，展开“Rotation”对话框，在Method（旋转方法）栏中选择Varimax(最大方差旋转项)；在Display栏中选择要求的输出项，这里选择Rotated solution（输出旋转后的结果）；在Maximum Iterations for Convergence(参数框中指定旋转收敛的最大迭代次数)，这里选择系统默认值为25，点击Continue按钮。

4.在主对话框中，单击【Scores】(因子得分)按钮，展开“Scores”对话框，选中Save as variables（将因子得分作为新变量保存在数据文件中）复选框，在Method(方法)框中，选择计算因子得分的方法，这里选用Regression(回归法)；选中Display factor score coefficient matrix(输出因子得分系数矩阵)复选框，单击Continue按钮。

5．在主对话框中单击【Options】输出的选择按钮，展开Options对话框，在Missing Value(缺失值)栏中，选择Exclude cases Listwise(有缺失值的观测量一律剔除)，在Coefficent display format(选择因子载荷系数的输出方式)中选择Sorted by size(按绝对值大小排列)，单击Continue按钮。

（七）在主对话框中，单击【OK】按钮执行运算。

二、实验结果（一）实验结果输出输出结果如表1至表7所示：表1 KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy. .821 Bartlett's Test of Sphericity Approx. Chi-Square 581.552df 78Sig. .000（二）实验结果解释1.表1中的KMO值为0.821，说明适合进行因子分析。

e商务文档

主成分分析和因子分析实验报告

相关文档推荐：