第五章主成分分析
clear
set more off
cd
"C:\Users\zhou\OneDrive\Lectures_ebook\multivariate_statistics\labora tory\03principal"
use data
*定义变量的标签
label var area "省份"
label var x1 "GDP(亿元)"
label var x2 "居民消费水平(元)"
label var x3 "固定资产投资(亿元)"
label var x4 "职工平均工资(元)"
label var x5 "货物周转量(亿吨公里)"
label var x6 "居民消费价格指数(上年100)"
label var x7 "商品零售价格指数(上年100)"
label var x8 "工业总产值(亿元)"
describe
sum
corr
//findit factortest
//ssc install factortest
//check the data
factortest x1-x8
pca x1-x8, correlation /*主成分估计*/
pca x1-x8, covariance component(3) /*主成分估计*/
//test
estat kmo /*KMO检验,越高越好*/
estat smc /*SMC检验,值越高越好*/
screeplot /* 碎石图(特征值等于1处的水平线标示保留主成分的分界点)*/ loadingplot , yline(0) xline(0)/*载荷图 */
loadingplot , combined factors(3) yline(0) xline(0)/*载荷图 */
predict f1 f2 f3 /*预测变量得分*/
scoreplot,mlabel(area) yline(0) xline(0) /*得分图*/
scoreplot,xtitle("经济社会总量") ytitle("人民生活水平") mlabel(area) yline(0) xline(0) /*得分图*/
scatter f2 f3,xtitle("人民生活水平") ytitle("物价水平") mlabel(area) yline(0) xline(0) /*得分图*/
scoreplot, factors(3) mlabel(area) /*得分图*/
scoreplot,combined factors(3) mlabel(area) yline(0) xline(0) /*得分图*/
//ranking by score
describe f1-f3
sort f1 //sorting
gen rank_nature=_n //ranking
browse area f1 rank_nature // show dat
gsort -f1 //generalized sorting
gen rank_nature1=_n //ranking
browse area f1 rank_nature rank_nature1 // show dat
cor x1-x8
matrix CM=r(C) //define covariance matrix
pcamat CM, comp(3) n(1000) names(a1 a2 a3 a4 a5 a6 a7 a8)
//rotate /*旋转*/。