当前位置:文档之家› SPSS因子、聚类案例分析报告

SPSS因子、聚类案例分析报告

喀什大学实验报告《多元统计分析SPSS实验报告实验课程:基于SPSS的数据分析实验地点:现代商贸实训中心实验室名称:经济统计实验室学院: XXX学院年级专业班:XXX班学生姓名:XXX 学号:20131808015完成时间:2016 年X月X日开课时间:2016 至2017 学年第1 学期实验项目:中国上市银行竞争力分析(一)实验目的本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其2012年度财务报告的数据,从盈利能力、安全能力和发展能力三方面共选取了8个重要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进行了分析评价。

最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比较,提出了提升我国上市商业银行竞争力的一些建议。

(二)实验资料通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。

具体数据如下所示:(三)实验步骤1、选择菜单2、选择参与因子分析的变量到(变量V)框中3、选择因子分析的样本4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、图5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:6在所示的窗口中点击(旋转T)按钮选择因子旋转方法形等Vi93 23% U12K15.&*%8 3JK.i4 ir%riOMTSO' 開W05%3 6?%121]tpSJKr?-113TM « 07%WU%124SS 26 £5%谄01%«心羽也帕J叽越雀IB23%42% U W%ig> 13 DQ%31%. T6(H%馬* K.Dfi%fld% 昭卿驚主成分分析法1 42% 0 6S% 44 越鴨1韵飓«的恤站20%髄#A#*/#*7、在所示窗口中点击(得分S)按钮选择计算因子得分的方法8、在所示窗口中点击(选项)按钮(四)实验结果及分析分析结果如下表所示。

通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为0的t假设。

相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合做因子分析。

同时,KM(级Bartlett 检验是否适合做因子分析。

以上是KMC级Bartlett 检验结果,由表可知:KMO值为0.518,说明该数据适合做因子分析。

上表中的巴特利特球体检验的X统计值的显著性概率是O. 000,小于1%,因此拒绝原假设,说明数据具有相关性,适宜做因子分析。

a.取样适切性量数(MSA)反映像矩阵在其对角线上的数字若大于0.05 (出口合同为0.406 )则适合因子分析,小于0.05则不适合因子分析。

从表中得知,适合做因子分析。

提取方法:主成分分析法。

变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称为公因子方差,从上表中可以得到变量共同度大部分都接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为因子空间转化的性质较好,保留原来信息量多,因此,h「是X i方差的重要组成部分。

检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的贡献率,如下表所示综合因子F,,F2, F3的特征值大于1,且对原始数据的累积贡献率达到了84.485 %,其中F1的贡献率最强,达到了34.998 %, F2的贡献率达到了33.383 %,F3的贡献率也达到了16.104 %。

这三个因子的贡献率都远远大于其它因子的贡献率,因此,F1, F2,F3是决定商业银行竞争力强弱的关键因子。

组杵号从碎石图中得到,第1个因子的特征值高于其他项,对解释原有变量的贡献最大;第5个因子之后的特征值都小,对解释原有变量的贡献较小;因此我们可以取3个或4个因子较为合适。

a提取方法:主成分分析法。

aa.提取了3个成分。

表中给出旋转前的因子载荷阵,从中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,3个因子的实际含义比较模糊。

为了避免初始因子综合性太强,难以找出因子的实际意义的问题,需要通过旋转坐标轴,使负载尽可能向正负0或1的方向靠近,从而降低因子的综合性,使其真实意义凸现出来。

下面使用的因子旋转方法为方差最大正交旋转法,目的是使旋转后的因子载荷矩阵的结构简化,便于对各个公共因子进行合理的解释,同时保证每一个公共因子反映的信息量尽量最大。

a提取方法:主成分分析法。

旋转方法:凯撒正态化最大方差法。

成分得分系数矩阵成分1资产利润率-.165 不良贷款率-.009 资产负债率.359 资本充足率-.368 每股收益增长率.203 贷款增长率-.138存款增长率-.016 总资产增长率.167 2 3-.029 .544-.138 -.516.012-.034 .046 .072-.051 .370.378 .137.371 .003.304 .083a.旋转在4次迭代后已收敛表中给出旋转后的因子载荷阵,从表中可以看出,经过旋转后的载荷系数已经明显的两极分化了。

第一个公共因子在指标X2每股收益增长率、X3资产负债率、X4资本充足率上有较大载荷,说明这3个指标有较强的关联性,可以归为一类,因此可以把第一个因子命名为“流动因子”;第二个公共因子在指标X6贷款增长率、X7存款增长率、X8总资产增长率上有较大载荷,同样可以归为一类,第二个因子可以命名为“发展因子”;同理,X1资产利润率、X5不良贷款率归到第3类,将其命名为“安全和盈利因子”。

腕鶴话的空间叩的组件囹在三维空间组件图中,各因子更接近于组价几,接近组件几对应的是‘旋转后的成分矩阵’的成分几。

旋转方法:凯撒正态化最大方差法。

组件得分。

表中给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准化值就可以计算出每个观测值的各因子的得分。

旋转后的因子得分表达式可以写成F1=-0.165x1+0.203x2+0.359x3-0.368x4-0.009x5-0.138x6-0.016x7+0.167x8F2=-0.029x1-0.051x2+0.012x3+0.046x4-0.138x5+0.378x6+0.371x7+0.304x8F3=0.544x1+0.370x2-0.034x3+0.072x4-0.516x5+0.137x6+0.003x7+0.083x8 五、结论本文通过采用多元统计分析中的因子分析法对国有商业银行的经营绩效加以评价,从盈利能力、安全能力和发展能力三方面来具体分析我国上市商业银行竞争力,对上市银行及非上市银行具有一定的指导作用。

实验项目:商厦评分(一)实验目的:本实验目的利用SPSS层次聚类对商厦评分进行分类分析,以了解了解各商厦之间的相互关系。

(二)实验资料:(三)实验步骤: 表一表一可知,当聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D, E 两个商厦为一类;当聚成两类时,A, B俩个商厦为一类,C, D, E三个商厦为一类,SPSS的层次聚类能够产生任意类数的分类结果。

图一,可知,D 商厦与E 商厦的距离最近,首先合并成一类,其次,合并的 是A ,B 俩个商厦它们的距离比D 商厦与E 商厦大,最后是合并C 商厦。

最后聚 城一体。

图二:图二,可知,当聚成4类时,D, E 两个商厦为一类;其他各商厦自成一类, 聚成3类时,A , B 俩个商厦为一类,C 商厦自成一类,D, E 两个商厦为一类; 当聚成两类时,A, B 俩个商厦为一类,C, D, E 三个商厦为一类。

0同團左I :!・A CRv 1/ARTIBTA ■ 1蚀用冲均勰搂(靖间J 的谱熱開表二,可知,3个初始类中心点的数据,分别为(94,90)(66,64)(84,82)可见第一类最优,第三类次之,第二类最差。

表三aa.由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛。

任何中心的最大绝对坐标变动为.000。

当前迭代为2。

初始中心之间的最小距离为12.806。

表三,可知,第一次迭代后,3个类中心点分别偏移了1.803,4.013.0.000 第2类中心点的偏移最大,在第3类和第二次迭代时中心点偏移均小于判定标准(0.02 ),聚类分析结束。

表四表四,可知,最终类中心点的情况,分别为(92.5,89)(69.5,66)(84,82)仍然可见第一类为最优,第三类第二,第二类效果最差。

表五ANOV A| 聚类误差 F 显著性由于已选择聚类以使不同聚类中个案之间的差异最大化,因此F检验只应该用于描述目的。

实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设的检验。

由表五,展现了各指标在不同的均值比较情况,各数据项的含义依次为组间均方、组间自由度、组内均方、组内自由度、F统计量的观察值以及对应的概率P-值。

仍然看出第二类的差异最大。

(三)实验结论:因此,在总数为五,有效数值为五的情况下的聚类分析可得,E商厦属最优类;C,D商厦属良好类;A,B商厦属合格类。

相关主题