当前位置:文档之家› 因子分析论文

因子分析论文

关键词:因子提取正交旋转因子分析因子得分1.问题提出随着我国的经济的发展,人民的生活水平逐渐提高。

从而家庭耐用品的拥有量也有所提高。

但各省市的拥有量也存在差异。

为了准确的把握各省市的情况及其差异。

本文采用多变量统计因子分析的方法,对其进行定量分析。

以期对各省市的耐用品拥有量的情况有个客观的把握,及反映各省市的经济发展情况。

2.耐用品拥有量指标的选择。

为了更好的反映各省市的耐用品拥有量的情况,且根据当今社会家庭拥有耐用品的档次的不同,可将其分为低,中,高档。

从而本文使用2005年统计年鉴的数据。

选取了具有代表的三类九个指标:(一):低档消费耐用品:普通电话拥有量(部);(二):中档消费耐用品:电冰箱拥有量(台),彩电拥有量(台),电视机拥有量(台),空调拥有量(台),移动电话拥有量(部);(三):高档奢侈消费耐用品:家用电脑拥有量(台),家用汽车拥有量(辆),摄像机拥有量(台),照相机拥有量(台);3.各省市耐用品情况分析:1.本文所采取的定量分析方法:本文的研究主要采取因子分析方法。

因子分析是近些年来颇为流行的多元变量统计方法。

它是用较少个数的公共因子的线性函数和特定因子之和来表达原有观测的每个变量,从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂的变量归纳为少数几个综合因子的一种多变量统计分析方法。

当这几个公共因子的累计方差和达到85%以上时,就说明这几个公共因子反映了研究问题的大部分信息,而又不相关,信息不重叠。

因子分析的数学模型用矩阵的形式表示为:X=AF+E其中F为公共因子,E为特殊因子。

本文在对数据标准化以后,采取主成分法提取公共因子,并采用方差最大化正旋转。

2.考察原有变量是否适合进行因子分析。

表(一)是原有变量的相关系数距阵。

可看到大部分的相关系数都较高,各变量呈较强的线性关系。

且表(二)巴特利特球度检验和KMO检验可以看出,k值大于0.7且接近0.8是很适合进行因子分析的。

所以原有变量适合进行因子分析。

原有变量的相关系数矩阵Correlation Matrix 表(一)空调器.375 .833 .839 .481 .577 1.000 .606 .742 .749普通电话.389 .583 .572 .486 .403 .606 1.000 .346 .432移动电话.622 .758 .872 .613 .699 .742 .346 1.000 .590电冰箱.279 .768 .761 .544 .695 .749 .432 .590 1.000巴特利特球度检验和KMO检验KMO and Bartlett's Test 表(二)Kaiser-Meyer-Olkin Measure ofSampling Adequacy..797Bartlett's Test of Sphericity Approx.Chi-Square283.481 df 36 Sig. .0001.提取因子在这根据原有变量的相关系数距阵,采用主成分分析法,提取因子并指定提取3个因子。

其分析结果如下表(三)。

因子分析的初始结Communalities 表(三)Initial Extraction家用汽车 1.000 .839彩色电视机1.000 .875家用电脑 1.000 .946摄像机 1.000 .885照相机 1.000 .898空调器 1.000 .889普通电话 1.000 .987移动电话 1.000 .812电冰箱 1.000 .800Extraction Method: Principal Component Analysis.表三可以看出所有变量的共同度都大于0.8是比较高的,即各变量的信息都大部分被反应。

说明本次因子提取的总体效果是理想的。

4.因子分析和因子解释通过以上因子提取过程,选入3个公因子,其方差累计贡献率达88.127%,即反应原有信息的 88.127%见表(四)。

且经旋转后分配到各因子的方差贡献率是比较合适的。

我们将这3个因子作为评价全国32个省(市,自治区)百人拥有耐用品数分析的综合变量。

因子解释原有变量总方差的情况Total Variance Explained 表(四)Compone ntInitial EigenvaluesExtraction Sums of SquaredLoadingsRotation Sums of SquaredLoadingsTotal% ofVarianceCumulative%Total% ofVarianceCumulative%Total% ofVarianceCumulative%1 6.075 67.497 67.4976.07567.497 67.4973.66940.76140.7612 1.14612.738 80.2351.14612.738 80.2353.04533.830 74.5913.710 7.892 88.127 .710 7.892 88.1271.21813.536 88.1274 .524 5.819 93.9465 .193 2.145 96.0916 .175 1.948 98.0407 .095 1.054 99.0948 .052 .576 99.6709 .030 .330 100.000Extraction Method: Principal Component Analysis.公因子和原有变量之间的关联程度是由因子载荷值表示的。

因子载荷值越高,表明该因子包含该指标的信息越多。

表(五)表示初始的因子载荷矩阵。

初始因子载荷矩阵Component Matrix(a) 表(五)Extraction Method: Principal Component Analysis.a 3 components extracted.可知,9个变量在第一个因子的载荷值都很高。

即说明他们与第一个因子的相关程度高,而第二,三个因子与原有变量的相关性均很差,对原有变量的解释不显著。

无法进行因子解释。

于是采用方差最大法对因子载荷矩阵实施正交旋转,表(七)即经旋转5次后的因子载荷矩阵。

表(六)即为旋转矩阵旋转矩阵Component Transformation Matrix 表(六)Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.旋转后的因子载荷矩阵Rotated Component Matrix(a) 表(七)Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.a Rotation converged in 5 iterations.根据表(七)可以写出本案例的因子分析模型:电冰箱拥有量=0.856f1+0.233f2+0.114f3彩色电视机拥有量=0.853f1+0.221f2+0.314f3空调器拥有量=0.850f1+0.202f2+0.354f3家用电脑拥有量=0.729f1+0.601f2+0.234f3移动电话拥有量=0.717f1+0.547f2-0.02f3家用汽车拥有量=0.104f1+0.889f2+0.193f3摄像机拥有量=0.311f1+0.864f2+0.205f3照相机拥有量=0.493f1+0.807f2+0.060f3普通电话拥有量=0.301f1+0.229f2+0.918f3通过以上分析模型可知,电冰箱,彩色电视机,空调器,移动电话在第一因子有较高的载荷。

第一因子主要解释这几个变量,可解释为家庭中档消费耐用品。

而家用电脑,家用汽车,摄像机,照相机在第二因子的载荷较高,第二因子主要解释这些变量,可解释为家庭高档消费耐用品。

而第三个因子主要解释变量普通电话。

可解释为家庭低档消费耐用品。

5.因子得分:进行因子分析之后,由回归法计算因子得分,结果如表(九),且从表(八)因子得分协方差矩阵可以看出因子间已无相关关系,说明因子提取是成功的。

Component Score Covariance Matrix 表(八)Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser NormalizationComponent Score Coefficient Matrix表(九)Component1 2 3家用汽车-.290 .475 .093彩色电视.316 -.180 .075机家用电脑.151 .097 -.033摄像机-.166 .392 .041照相机.008 .319 -.198空调器.307 -.196 .129普通电话-.215 -.077 1.028移动电话.242 .099 -.320Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.Component Scores.从而得到因子得分函数:F1=-0.290家用汽车+0.316彩色电视机+0.151家用电脑-0.166摄像机+0.008照相机+0.307空调机-0.215普通电话+0.242移动电话+0.384电冰箱F2=0.475家用汽车-0.180彩色电视机+0.097家用电脑+0.392摄像机+0.319照相机-0.196空调机-0.077普通电话+0.099移动电话-0.149电冰箱F3=0.930家用汽车+0.075彩色电视机-0.033家用电脑+0.041摄像机-0.198照相机+0.129空调机+1.028普通电话-0.320移动电话-0.181电冰箱2.各省市自治区的综合评价:利用得分变量进行对比研究。

分别绘制第一,第二因子和第二,第三因子变量散点图如下图。

观察图可见,北京,上海,广东,浙江在第一,第二,第三因子的得分都比较高。

表明这四地方的生活水平远远的高于其他的省份。

可把他们划为第一集团。

而江苏,福建,天津,山东,重庆在第二,三因子的得分也明显高于平均水平,但略低于第一集团的省份,可把他划为第二集团。

中南部的一些省份如广西,湖北等还有华北,东北的一些省份的三因子得分大部分在0左右,说明其生活水平处在平均水平。

可把其划为第三集团。

而西北各省份及中部的江西,安徽和南部的贵州,云南等地的三因子得分明显的低于0。

相关主题