主成分分析实验报告一、实验数据2013年,在国内外形势错综复杂的情况下,我国经济实现了平稳较快发展。
全年国内生产总值568845亿元,比上年增长7.7%。
其中第三产业增加值262204亿元,增长8.3%,其在国内生产总值中的占比达到了46.1%,首次超过第二产业。
经济的快速发展也带来了就业的持续增加,年末全国就业人员76977万人,其中城镇就业人员38240万人,全年城镇新增就业1310万人。
随着我国城镇化进程的不断加快,加之农业用地量的不断衰减,工业不断的转型升级,使得劳动力就业压力的缓解需要更多的依靠服务业的发展。
(一)指标选择根据指标选择的可行性、针对性、科学性等原则,选择13个指标来衡量服务业的发展水平,指标体系如表1所示:表1 服务业发展水平指标体系(二)指标数据本次实验采用的数据是我国31个省(市、自治区)2012年的数据,原数据均来自《2013中国统计年鉴》以及2013年各省(市、自治区)统计年鉴,不能直接获得的指标数据是通过对相关原始数据的换算求得。
原始数据如表2所示:表2(续)二、实验步骤本次实验是在SPSS中实现主成分分析,具体步骤如下:(一)数据标准化,单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述),展开Descriptives对话框,将左面的矩形框中的变量X1、X2、 (X13)通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。
选中Savestandardized values as variables(对变量进行标准化)复选框,点击OK按(二)单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Data Reduction”弹出小菜单,在小菜单中寻找“Factor”(因子),展开“Factor Analysis”(因子分析)主对话框。
(三)选择分析变量。
将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、…、ZX13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。
(四)因子分析过程选项,主对话框选择项中共有5个功能按钮:1.单击【Descriptives】(描述统计量)按钮,展开“Descriptives”对话框,在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution(初始因子分析结果),在Correlation Matrix中选择coefficients(相关系数矩阵)、Significance levels(显著性P值),KMO and Bartlett’s test of sphericity,点击Continue按钮。
2.在主对话框中,单击【Extraction】(因子提取)按钮,展开“Extraction”对话框,在Method中选择Principal components(主成分法),其他均为系统默认,点击Continue按钮。
3.在主对话框中,单击【Scores】(因子得分)按钮,展开“Scores”对话框,选中Save as variables(将因子得分作为新变量保存在数据文件中)复选框,单击Continue按钮。
(五)在主对话框中,单击【OK】按钮执行运算。
三、实验结果(一)利用SPSS进行因子分析输出结果表3至表4所示。
表3中Total列为各因子对应的特征根,本实验中共提取4各公因子;% of Variance列为各因子的方差贡献率;Cumulative %列为各因子累积方差贡献率,由表中可以看出,前四个因子已经可以解释88.341%的方差。
(二)利用因子分析结果进行主成分分析1.将表4中因子载荷阵中的数据输入SPSS数据编辑窗口,分别命名为a1、a2、a3和a4。
2.为了计算第一个特征向量,点击菜单项中的Transform-Compute,调出Compute variable对话框,在对话框中输入等式:z1=a1/SQRT(6.312)点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。
然后以同样的方式,分别在对话框中输入等式:z2=a2/SQRT(2.851)z3=a3/SQRT(1.289)z4=a4/SQRT(1.032)得到以z2、z3、z4为变量名的第二、三、四特征向量。
这样,可得到如表6所示的特征向量矩阵。
根据表5可以得到主成分的表达式:Y1=0.220X1+0.043X2+0.308X3+0.318X4+0.388X5+0.337X6+0.369X7+0.275X8+0.365X9+0.052X10+0.075X11+0.361X12+0.074X13Y 2=0.453X 1+0.564X 2-0.193X 3-0.138X 4-0.034X 5-0.099X 6+0.001X 7-0.124X 8+0.062X 9-0.231X 10-0.121X 11+0.046X 12+0.566X 13Y 3=0.080X 1+0.038X 2+0.047X 3-0.234X 4-0.151X 5+0.218X 6-0.005X 7+0.361X 8-0.159X 9-0.367X 10+0.745X 11-0.140X 12+0.004X 13Y 4=0.187X 1-0.042X 2-0.025X 3-0.376X 4-0.045X 5-0.153X 6+0.276X 7-0.116X 8+0.073X 9+0.756X 10+0.340X 11-0.032X 12+0.112X 13再以特征根为权,对4个主成分进行加权综合,得出各地区的综合得分,具体数据见表6。
综合得分的计算公式是Y=∑=411i iλλY 1+∑=412i iλλY 2+∑=413i iλλY 3+∑=414i iλλY 4根据上式可以计算出各地区的综合得分,并可据此排序。
从表6可以看出,上海市的综合评价排在第一,原始数据也反映出其存在明显的规模优势,另外从第一个主成分看,上海市也排在第一位,同样存在效益优势;而排在最后三位的分别是西藏、甘肃、青海。
因子分析实验报告本次实验采用的是2012年反映我国31个省(直辖市、自治区)服务业发展水平的14个指标(数据见主成分分析报告表2)。
14个指标分别为:服务业增加值(X1)、服务业就业人数(X2)、服务业产值比重(X3)、服务业就业比重(X4)、人均服务产品占有量(X5)、服务密度(X6)、服务综合生产率(X7)、服务业贡献率(X8)、人均GDP(X9)、服务业增长速度(X10)、工业化水平(X11)、城市化水平(X12)、服务业全社会固定资产投资(X13).这些指标之间有很强的相关性,如果利用所有14个指标对31个省(直辖市、自治区)进行服务业发展水平分析,难免会出现信息的重叠,而利用因子分析可以解决这个问题。
一、实验步骤本次实验是在SPSS中实现主成分分析,具体步骤如下:(一)定义变量及标签。
(二)输入数据,建立数据文件。
(三)数据标准化,单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Descriptive Statistics”,在小菜单中寻找“Descriptives”(描述),展开Descriptives对话框,将左面的矩形框中的变量X1、X2、 (X13)通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。
选中Save standardized values as variables(对变量进行标准化)复选框,点击OK按钮。
(四)单击主菜单“Analyze”(分析)展开下拉菜单,在下拉菜单中寻找“Data Reduction”弹出小菜单,在小菜单中寻找“Factor”(因子),展开“Factor Analysis”(因子分析)主对话框。
(五)选择分析变量。
将左面的矩形框中参与分析的标准化后的变量ZX1、ZX2、…、ZX13,通过单击向右的箭头按钮,调入到右面的“Variables”(变量)框中。
(六)因子分析过程选项,主对话框选择项中共有5个功能按钮:1.单击【Descriptives】(描述统计量)按钮,展开“Descriptives”对话框,在Statistics中选中Univariate descriptive(单变量描述统计量)和Initial solution(初始因子分析结果),在Correlation Matrix中选择coefficients(相关系数矩阵)、Significance levels(显著性P值),点击Continue按钮。
2.在主对话框中,单击【Extraction】(因子提取)按钮,展开“Extraction”对话框,在Method中选择Principal components(主成分法),其他均为系统默认,点击Continue按钮。
3.在主对话框中,单击【Rotation】(旋转)按钮,展开“Rotation”对话框,在Method(旋转方法)栏中选择Varimax(最大方差旋转项);在Display栏中选择要求的输出项,这里选择Rotated solution(输出旋转后的结果);在Maximum Iterations for Convergence(参数框中指定旋转收敛的最大迭代次数),这里选择系统默认值为25,点击Continue按钮。
4.在主对话框中,单击【Scores】(因子得分)按钮,展开“Scores”对话框,选中Save as variables(将因子得分作为新变量保存在数据文件中)复选框,在Method(方法)框中,选择计算因子得分的方法,这里选用Regression(回归法);选中Display factor score coefficient matrix(输出因子得分系数矩阵)复选框,单击Continue按钮。
5.在主对话框中单击【Options】输出的选择按钮,展开Options对话框,在Missing Value(缺失值)栏中,选择Exclude cases Listwise(有缺失值的观测量一律剔除),在Coefficent display format(选择因子载荷系数的输出方式)中选择Sorted by size(按绝对值大小排列),单击Continue按钮。
(七)在主对话框中,单击【OK】按钮执行运算。
二、实验结果(一)实验结果输出输出结果如表1至表7所示:表1 KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy. .821 Bartlett's Test of Sphericity Approx. Chi-Square 581.552df 78Sig. .000(二)实验结果解释1.表1中的KMO值为0.821,说明适合进行因子分析。