1、主成分法:用主成分法寻找公共因子的方法如下:假定从相关阵出发求解主成分,设有p 个变量,则可找出p 个主成分。
将所得的p 个主成分按由大到小的顺序排列,记为1Y ,2Y ,…,P Y , 则主成分与原始变量之间存在如下关系:11111221221122221122....................p p p p pp p pp p Y X X X Y X X X Y X X Xγγγγγγγγγ=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 式中,ij γ为随机向量X 的相关矩阵的特征值所对应的特征向量的分量,因为特征向量之间彼此正交,从X 到Y 得转换关系是可逆的,很容易得出由Y 到X 得转换关系为:11112121212122221122....................p p p p pp p pp p X Y Y Y X Y Y Y X Y Y Yγγγγγγγγγ=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 对上面每一等式只保留钱m 个主成分而把后面的部分用i ε代替,则上式变为:1111212112121222221122....................m m m m p p p mp m p X Y Y Y X Y Y Y X Y Y Y γγγεγγγεγγγε=++++⎧⎪=++++⎪⎨⎪⎪=++++⎩上式在形式上已经与因子模型相一致,且i Y (i=1,2,…,m )之间相互独立,且i Y 与i ε之间相互独立,为了把i Y 转化成合适的公因子,现在要做的工作只是把主成分i Y 变为方差为1的变量。
为完成此变换,必须将i Y 除以其标准差,由主成分分析的知识知其标准差即为特征根的平方根i λ/i i i F Y λ=,1122m m λγλγλγ,则式子变为:1111122112211222221122....................m m m m p p p pm m p X a F a F a F X a F a F a F X a F a F a F εεε=++++⎧⎪=++++⎪⎨⎪⎪=++++⎩这与因子模型完全一致,这样,就得到了载荷A 矩阵和 初始公因子(未旋转)。
一般设A ∧为样本相关矩阵R 的特征根,12,,...,p γγγ为对应的标准正交化特征向量。
设m<p,则因子载荷矩阵A 的一个解为:A ∧=(1122,,...,m m λγλγλγ)共同度的估计为:222212...i i i im h a a a ∧∧∧∧=+++下面用主成分法分析以下数据:步骤:第一步,把Excel 中的数据导入到SPSS 中:File →Open →Data ; 第二步,数据标准化:Analyze →Descriptive Statistics →Descriptives 如图:第三步,检验数据:如图:得到结果如下:KMO 和Bartlett 的检验取样足够度的Kaiser-Meyer-Olkin 度量。
.754 Bartlett 的球形度检验近似卡方df 36Sig. .000Sig小于,所以该数据可用;第四步,用主成分法分析数据:Analyze→Dimension Reduction→Factor 如图:得到结果如下图:相关矩阵Zscore: 100固定资产原值实现值(%)Zscore:100元固定资产原值实现利税(%)Zscore:100元资金实现利税(%)Zscore:100元工业总产值实现利税(%)Zscore:100元销售收入实现利税(%)Zscore(每吨标准煤实现工业产值(元))Zscore(每千瓦时电力实现工业产值(元))Zscore:全员劳动生产率(元/人.年)Zscore:100元流动资金实现产值(元)相关Zscore: 100固定资产原值实现值(%).869 .770 .211 .920 .899 .795 .896Zscore: 100元固定资产原值实现利税(%).869 .978 .387 .472 .886 .804 .814 .849Zscore: 100元资金实现利税(%).770 .978 .523 .531 .797 .736 .740 .811Zscore: 100元工业总产值实现利税(%).387 .523 .323 .115 .125 .051Zscore: 100元销售收入实现利税(%).211 .472 .531 .323 .175 .260 .371 .317Zscore(每吨标准煤实现工业产值(元)).920 .886 .797 .115 .175 .877 .815 .768Zscore(每千瓦时电力实现工业产值(元)).899 .804 .736 .260 .877 .757 .818Zscore: 全员劳动生产率(元/人.年).795 .814 .740 .125 .371 .815 .757 .715Zscore: 100元流动资金实现产值(元).896 .849 .811 .051 .317 .768 .818 .715Communalities其中Communalities给出了该次分析从每个原始变量中提取的信息,表格下面注示表明,该次分析是用Factor analysis模块默认的信息提取方法即主成分分析完成的。
可以看到除100元工业总产值实现利税,100元销售收入实现利税和全员劳动生产率以外,主成分几乎包括了各个原始变量至少80%的信息。
解释的总方差成份初始特征值提取平方和载入合计方差的% 累积% 合计方差的% 累积%123 .6974 .3185 .1906 .1167 .029 .3248 .024 .2709 .002 .027提取方法:主成份分析。
由输出结果看到,前面2个主成分y1,y2的方差和占全部方差的比例为%.我们就选取1y 为第一主成分,2y为第二主成分,且这两个主成分之方差和占全部方差的%,即基本上保留了原来指标的信息,这样由原来的9个指标转化为2个新指标,起到了降维的作用。
Component Matrix aComponent1 2100固定资产原值实现值(%).931100元固定资产原值实现利税(%).976 .163100元资金实现利税(%).931 .322100元工业总产值实现利税(%).232 .863100元销售收入实现利税(%).433 .596每吨标准煤实现工业产值(元).923每千瓦时电力实现工业产值(元).897全员劳动生产率(元/人.年).871100元流动资金实现产值(元).899Extraction Method: Principal Component Analysis.a. 2 components extracted.成份得分系数矩阵成份12Zscore: 100固定资产原值实现值(%).213Zscore: 100元固定资产原值实现利税(%) .114 .156Zscore: 100元资金实现利税(%).072 .256Zscore: 100元工业总产值实现利税(%).567Zscore: 100元销售收入实现利税(%).406Zscore(每吨标准煤实现工业产值(元)).186Zscore(每千瓦时电力实现工业产值(元)) .198Zscore: 全员劳动生产率(元/人.年).148 .005Zscore: 100元流动资金实现产值(元).172提取方法 :主成分分析法。
旋转法 :具有 Kaiser 标准化的正交旋转法。
构成得分。
由上表得到两个主成分,12,y y 的线性组合为:11234567890.2130.1140.0720.1550.0650.1860.1980.1480.172y x x x x x x x x x *********=++--++++21234567890.1530.1560.2560.5670.4060.080.1280.050.051y x x x x x x x x x *********=-++++--+-成份得分协方差矩阵 成份 12 1 .0002.000成份得分协方差矩阵 成份 12 1 .0002.000提取方法 :主成分分析法。
旋转法 :具有 Kaiser 标准化的正交旋转法。
构成得分。
2、主轴因子法:假定m 个公因子只能解释原始变量的部分方差,利用公因子方差(或共同度)来代替相关矩阵对角线上的元素1,并以新得到的这个矩阵为出发点,对其分别求解特征根与特征向量并得到因子解。
在因子模型中,不难得到如下关于X 的相关矩阵R 的关系式:12,,...,m γγγ***式中,A 为因子载荷矩阵;ε∑为一对角阵,其对角元素为相应特殊因子的方差。
则称R R AA ε*'=-∑=为调整相关矩阵,显然R *的主对角元素不再是1,而是共同度2i h 。
分别求解R *的特征值与标准正交特征向量,进而求出因子载荷矩阵A 。
此时,R *有m 个正的特征值。
设12...m λλλ***≥≥≥为R *的特征根,12,,...,m γγγ***为对应的标准正交化特征向量。
m<p ,则因子载荷矩阵A 的一个主轴因子解为:A ∧=(1122,,...,m m λγλγλγ******)用轴因子法分析上述数据:Analyze →Dimension Reduction →Factor 如图:只需在这步把Methoct选择为Principal axis factoring(主轴因子法),其他的方法与主成分法一致。
得到的结果如下图:相关矩阵Zscore: 100固定资产原值实现值(%)Zscore:100元固定资产原值实现利税(%)Zscore:100元资金实现利税(%)Zscore:100元工业总产值实现利税(%)Zscore:100元销售收入实现利税(%)Zscore(每吨标准煤实现工业产值(元))Zscore(每千瓦时电力实现工业产值(元))Zscore:全员劳动生产率(元/人.年)Zscore:100元流动资金实现产值(元)相关Zscore: 100固定资产原值实现值(%).869 .770 .211 .920 .899 .795 .896Zscore: 100元固定资产原值实现利税(%).869 .978 .387 .472 .886 .804 .814 .849Zscore: 100元资金实现利税(%).770 .978 .523 .531 .797 .736 .740 .811Zscore: 100元工业总产值实现利税(%).387 .523 .323 .115 .125 .051Zscore: 100元销售收入实现利税(%).211 .472 .531 .323 .175 .260 .371 .317Zscore(每吨标准煤实现工业产值(元)).920 .886 .797 .115 .175 .877 .815 .768Zscore(每千瓦时电力实现工业产值(元)).899 .804 .736 .260 .877 .757 .818Zscore: 全员劳动生产率(元/人.年).795 .814 .740 .125 .371 .815 .757 .715Zscore: 100元流动资金实现产值(元).896 .849 .811 .051 .317 .768 .818 .715其中Communalities给出了该次分析从每个原始变量中提取的信息,表格下面注示表明,该次分析是用Factor analysis模块默认的信息提取方法即主成分分析完成的。