当前位置:文档之家› 数据分析SAS报告

数据分析SAS报告

90-08年人民消费能力分析一、问题提出改革开放以来中国经济飞速发展,GDP连续超过德国、日本,现以成为世界上第二大经济体,人民生活水平不断提高,但受金融危机的影响,近几年来物价持续上涨,本月CPI创历史新高,人民的消费能力是否随着GDP的增加而增加呢?本文以中国经济年鉴中的“人民消费支出构成”的数据为依据利用统计软件SAS 进行了相关分析。

数据如下食品衣着居住家庭设备用品及服务交通通讯文教娱乐用品及服务医疗保健其他商品及服务1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.7400 1995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.7600 2000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.1400 2005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.1300 2007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.3000 2008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900二、问题分析1、通过对消费种类进行主成分分析判断人民的消费情况。

2、对主成分标准化后在分析各年的消费能力排名。

三、解决问题3.1 SAS程序:data examp4_4;input id x1-x8;cards;1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.74001995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.76002000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.14002005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.13002007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.30002008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900;run;proc corr cov nosimple data=examp4_4;var x1-x8;run;proc princomp data=examp4_4 out=bb;var x1-x8;run;data score1; /*以下程序是对各年按第一主成分得分进行排名并打印结果*/set bb;keep id prin1;proc sort data=score1;by descending prin1;run;proc print data=score1;run;3.2程序结果:SAS 系统 2011年06月14日星期二下午09时09分56秒 1 CORR PROCEDURE8 变量: x1 x2 x3 x4 x5 x6 x7 x8协方差矩阵,自由度 = 5x1 x2 x3 x4 x5 x6 x7 x8x1 52.12778667 5.14183333 -5.43130667 2.34796667 -27.62341333 -11.27958667 -11.80248667 -3.46987333x2 5.14183333 0.67025667 -0.00552333 0.28069333 -2.68378667 -1.67572333 -1.16476333 -0.56306667x3 -5.43130667 -0.00552333 3.60317667 0.02857333 2.46057333 -1.51458333 1.10495667 -0.25200667x4 2.34796667 0.28069333 0.02857333 0.14566667 -1.21211333 -0.81766667 -0.54318667 -0.23039333x5 -27.62341333 -2.68378667 2.46057333 -1.21211333 15.22562667 5.86791333 6.34247333 1.61420667x6 -11.27958667 -1.67572333 -1.51458333 -0.81766667 5.86791333 5.25949667 2.60837667 1.55695333x7 -11.80248667 -1.16476333 1.10495667 -0.54318667 6.34247333 2.60837667 2.71649667 0.73517333x8 -3.46987333 -0.56306667 -0.25200667 -0.23039333 1.61420667 1.55695333 0.73517333 0.61110667Pearson 相关系数, N = 6当 H0: Rho=0 时,Prob > |r|x1 x2 x3 x4 x5 x6 x7 x8x1 1.00000 0.86989 -0.39630 0.85207 -0.98052 -0.68122 -0.99182 -0.614780.0243 0.4367 0.0312 0.0006 0.1362 0.0001 0.1940x2 0.86989 1.00000 -0.00355 0.89832 -0.84012 -0.89250 -0.86320 -0.879790.0243 0.9947 0.0150 0.0363 0.0167 0.0268 0.0208x3 -0.39630 -0.00355 1.00000 0.03944 0.33220 -0.34792 0.35318 -0.169830.4367 0.9947 0.9409 0.5200 0.4992 0.4923 0.7477x4 0.85207 0.89832 0.03944 1.00000 -0.81391 -0.93417 -0.86350 -0.772200.0312 0.0150 0.9409 0.0487 0.0064 0.0267 0.0719x5 -0.98052 -0.84012 0.33220 -0.81391 1.00000 0.65573 0.98620 0.529190.0006 0.0363 0.5200 0.0487 0.1574 0.0003 0.2803x6 -0.68122 -0.89250 -0.34792 -0.93417 0.65573 1.00000 0.69007 0.868450.1362 0.0167 0.4992 0.0064 0.1574 0.1292 0.0248x7 -0.99182 -0.86320 0.35318 -0.86350 0.98620 0.69007 1.00000 0.570590.0001 0.0268 0.4923 0.0267 0.0003 0.1292 0.2370x8 -0.61478 -0.87979 -0.16983 -0.77220 0.52919 0.86845 0.57059 1.000000.1940 0.0208 0.7477 0.0719 0.2803 0.0248 0.2370SAS 系统 2011年06月14日星期二下午09时09分56秒 2 The PRINCOMP ProcedureObservations 6Variables 8Simple Statisticsx1 x2 x3 x4 x5 x6 x7 x8Mean 49.79666667 6.328333333 16.25833333 4.796666667 6.536666667 8.998333333 5.258333333 2.026666667StD 7.21995753 0.818692046 1.89820354 0.381663028 3.902002904 2.293359254 1.648179804 0.781733117Correlation Matrixx1 x2 x3 x4 x5 x6 x7 x8x1 1.0000 0.8699 -.3963 0.8521 -.9805 -.6812 -.9918 -.6148x2 0.8699 1.0000 -.0036 0.8983 -.8401 -.8925 -.8632 -.8798x3 -.3963 -.0036 1.0000 0.0394 0.3322 -.3479 0.3532 -.1698x4 0.8521 0.8983 0.0394 1.0000 -.8139 -.9342 -.8635 -.7722x5 -.9805 -.8401 0.3322 -.8139 1.0000 0.6557 0.9862 0.5292x6 -.6812 -.8925 -.3479 -.9342 0.6557 1.0000 0.6901 0.8685x7 -.9918 -.8632 0.3532 -.8635 0.9862 0.6901 1.0000 0.5706x8 -.6148 -.8798 -.1698 -.7722 0.5292 0.8685 0.5706 1.0000Eigenvalues of the Correlation MatrixEigenvalue Difference Proportion Cumulative1 5.89746633 4.28709253 0.7372 0.73722 1.61037380 1.25296800 0.2013 0.93853 0.35740580 0.23990054 0.0447 0.98324 0.11750526 0.10025645 0.0147 0.99785 0.01724881 0.01724881 0.0022 1.00006 0.00000000 0.00000000 0.0000 1.00007 0.00000000 0.00000000 0.0000 1.00008 0.00000000 0.0000 1.0000EigenvectorsPrin1 Prin2 Prin3 Prin4 Prin5 Prin6 Prin7 Prin8x1 -.388779 -.255521 0.065754 -.053972 -.301799 0.827792 0.000000 0.000000x2 -.399550 0.099491 -.188366 -.430585 0.686086 0.080082 -.009088 0.363823x3 0.044856 0.746089 0.474521 -.307596 -.085587 0.162417 0.260725 -.140969x4 -.392797 0.115755 0.175040 0.698509 0.113186 -.075845 0.471865 0.269326x5 0.376954 0.252020 -.327681 0.389201 0.453421 0.471547 -.050611 -.324084x6 0.362360 -.365307 -.083990 -.262653 0.077957 0.075391 0.804639 0.000000x7 0.387184 0.242582 -.233722 0.041098 -.286309 0.173586 -.063738 0.786613x8 0.331056 -.314568 0.731663 0.083664 0.352742 0.134323 -.234979 0.226790SAS 系统 2011年06月14日星期二下午09时09分56秒 3Obs id Prin11 2005 1.946992 2007 1.571053 2008 1.319374 2000 1.303735 1995 -2.388246 1990 -3.752893.3结果分析利用SAS得到样本的协方差矩阵为S=[52.12779 5.141833 -5.43131 2.347967 -27.6234 -11.2796 -11.8025 -3.46987 5.141833 0.670257 -0.00552 0.280693 -2.68379 -1.67572 -1.16476 -0.56307 -5.43131 -0.00552 3.603177 0.028573 2.460573 -1.51458 1.104957 -0.252012.347967 0.280693 0.028573 0.145667 -1.21211 -0.81767 -0.54319 -0.23039 -27.6234 -2.68379 2.460573 -1.21211 15.22563 5.867913 6.342473 1.614207 -11.2796 -1.67572 -1.51458 -0.81767 5.867913 5.259497 2.608377 1.556953 -11.8025 -1.16476 1.104957 -0.54319 6.342473 2.608377 2.716497 0.735173 -3.46987 -0.56307 -0.25201 -0.23039 1.614207 1.556953 0.735173 0.611107 ]由此看出,各个指标的样本方差差异很大,因此从样本相关系数矩阵出发做主成分分析,得到下面的相关系数矩阵R=[1 0.86989 -0.3963 0.85207 -0.98052 -0.68122 -0.99182 -0.61478 0.86989 1 -0.00355 0.89832 -0.84012 -0.8925 -0.8632 -0.87979 -0.3963 -0.00355 1 0.03944 0.3322 -0.34792 0.35318 -0.16983 0.85207 0.89832 0.03944 1 -0.81391 -0.93417 -0.8635 -0.7722 -0.98052 -0.84012 0.3322 -0.81391 1 0.65573 0.9862 0.52919 -0.68122 -0.8925 -0.34792 -0.93417 0.65573 1 0.69007 0.86845 -0.99182 -0.8632 0.35318 -0.8635 0.9862 0.69007 1 0.57059 -0.61478 -0.87979 -0.16983 -0.7722 0.52919 0.86845 0.57059 1 ]要集中在衣食住行上面,下面我们只取这两个样本做进一步分析,利用SAS得到对应于λ̂1∗和λ̂2∗的正交单位化特征向量ê1∗和ê2∗,如下表*********1123456780.388780.399550.0448560.39280.3769540.362360.3871840.331056y x x x x x x x x =--+-++++*********2123456780.255520.0994910.7460890.1157550.252020.365310.2425820.31457y x x x x x x x x =-++++-+- *1y 和*2y 中关于各项消费水平的指标系数有正有负,说明了消费种类的差异性较大。

相关主题