当前位置:文档之家› 实验报告七-SAS典型相关分析

实验报告七-SAS典型相关分析

实验报告实验项目名称典型相关分析所属课程名称统计分析及SAS实现实验类型验证性实验实验日期2016-12-11班级数学与应用数学学号姓名成绩【实验方案设计】一.理解典型相关分析的概念及步骤;二.掌握典型相关分析的方法;三.用INSIGHT、“分析家”计算统计量和编程实现实际问题中的典型相关分析;【实验过程】(实验步骤、记录、数据、分析)【练习7-1】对某高中一年级男生38人进行体力测试及运动能力测试,如表所示,试对两组指标作典型相关分析。

34 47 55 113 40 71.4 19 64 7.6 410 29 7 33135 49 74 120 53 54.5 22 59 6.9 500 33 21 34236 44 52 110 37 54.9 14 57 7.5 400 29 2 42137 52 66 130 47 45.9 14 45 6.8 505 28 11 35538 48 68 100 45 53.6 23 70 7.2 522 28 9 352其中,体力测试指标为:X1-------反复横向跳(次),X2-------纵跳(cm),X 3------背力(kg),X4------捏力(kg),X5-----台阶测试(指数),X6------定向体前屈(cm),X7-------俯卧上提后仰(cm)。

运动能力测试的指标为y1-50m跑(s),y2-跳远(cm),y3-投球(m),y4引体向上(次),y5-耐力跑(s)。

【解答】利用INSIGHT模块进行典型相关分析:结果:表7.1 Univariate StatisticsVariable N Mean Std Dev Minimum Maximumy1 38 7.1316 0.3354 6.6000 8.0000y2 38 441.8421 43.2138 362.0000 522.0000y3 38 27.8158 2.7495 21.0000 33.0000y4 38 7.5263 3.8326 2.0000 21.0000由表7.1得知一些基本统计量,各变量下的均值、标准差、最大值、最小值。

由表7.2相关系数阵、表7.3典型相关系数得知,第一典型相关系数为0.848708,修正值为0.797684,标准误差为0.045982,典型相关系数的平方为0.720305;第二典型相关系数为0.702963,修正值为0.582556,标准误差为0.083160,典型相关系数的平方为0.494157;第三典型相关系数为0.646784,标准误差为0.095626,典型相关系数的平方为0.418329;第四典型相关系数为0.354212,修正值为0.177885,标准误差为0.143773,典型相关系数的平方为0.125466;第五典型相关系数为0.268706,标准误差为0.152529,典型相关系数的平方为0.072203。

表由表7.4特征根可以得到特征根、相邻两特征根之差、特征根所占方差信息量的比例、累计方差信息量的比例,其中前三对典型变量所能解释的变异占总变异的95.07%,其他两个典型相关变量的作用很小,一共只解释了总变异的4.93%,因此不予考虑。

表7.5:应用似然比法检验典型相关系数与零的差别,由表7.5检验典型相关系数与零的差别得到p值依次为<0.0001、0.0089、0.0878,因此,对于前两组典型相关变量,拒绝小于此对典型变量典型相关系数的所有典型相关系数为0的原假设,因此,前两组变量的相关性的研究可转化为研究前两对典型相关变量的相关性。

由表7.6典型相关结构,从相关系数判断,体力测试指标除x4(0.2712)、x 5(0.2156)、x7(0.1052)外各变量与第一典型相关变量间的相关性比较高,运动能力测试的指标与第一典型相关变量间的相关性都比较高;x5与第二典型相关变量间的相关性比较高,说明第一对典型相关变量对台阶测试(x5)的解释作用不大。

从体力测试指标组的变量与运动能力测试的指标组的典型变量之间,运动能力测试的指标组的变量与体力测试指标组的典型变量之间的相关系数可见,各组变量与前两对典型变量之间均有较强的相关性。

表由表7.7、表7.8标准化变量的典型变量的系数可知,来自运动能力测试的指标的第一典型变量CY1为:****15432407943.0032325.0333193.0147529.0534016.01y y y y y CY --++-=CY1在y 4*上的系数近似为0,在y 1*、y 4*、y 5*上的系数为负值,在y 3*上的系数较大,因此CY1主要代表了投球等指标。

来自体力测试指标的第一典型变量CX1为:*7*6*5*4*3*2*1014738.0113355.0267853.0067975.0659461.0165109.0449775.01x x x x x x x CX ++++++=CX1在x 3*上的系数最大,在x 1*上的系数较大,在其余变量上的系数均较小,因此,CX1主要代表了反复横向跳、背力等指标。

由表7.9、表7.10典型冗余分析(Canonical Redundancy Analysis )表明,两对典型变量仍不能全面预测配对的那组变量。

来自运动能力测试的指标被对方两个典型变量(CX1、CX2)解释的累积方差比例为39.29%,来自体力测试指标被对方两个典型变量(CY1、CY2)解释的累计方差比例为37.36%。

【练习7-2】用典型相关分析研究我国农业投入与产出的关系(见表)。

农业产出水平选取如下三个指标作为“产出组”指标:农业总产出(亿元),用农林牧渔业总产值表示,记为y 1;农业劳动生产率(元/人),用人均农业牧渔业总产值表示,记为y 2。

农业总产出增长速度(%),用农林牧渔业总产值的增长速度表示,记为y 3。

农业投入水平选取如下7个指标作为”投入组”指标:农业劳动投入(人)用从业人数表示,记为X 1:农业物质消耗(亿元),用农业牧渔业中间消耗价值表示,记为X 2:农民受教育程度(年),用农民家庭的平均文化程度表示,记为X 3:农业机械化程度(万kw),用农业机械总动力表示,记为X4;农业电力文化程度(亿kw.h),用农村电量表示,记为X5:农业土地投入(khm2),用有效灌溉面积表示,记为X6:化肥用量(10kt)用农牧渔业化肥施用量来表示,记为X7。

【解答】利用“分析家”实现典型相关分析:结果:The CANCORR ProcedureCanonical Correlation Analysis表7.11 典型相关系数Canonical CorrelationAdjustedCanonicalCorrelationApproximateStandardErrorSquaredCanonicalCorrelation1 0.998993 . 0.000474 0.9979872 0.994616 . 0.002531 0.9892613 0.615312 0.514167 0.146463 0.378609由表7.11得知本题提取了3个典型相关系数,第一个典型相关系数CanR1=0.998993,为第一对典型相关变量之间的相关性。

第二典型相关系数为0.994616,第三典型相关系数为0.615312。

表7.12 特征根及典型相关系数的检验由表7.12可以得到特征根、相邻两特征根之差、特征根所占方差信息量的比例、累计方差信息量的比例,其中前两对典型变量所能解释的变异占总变异的99.9%,其他两个典型相关变量的作用很小,一共只解释了总变异的0.1%,因此不予考虑。

应用似然比法检验典型相关系数与零的差别,由表7.12检验典型相关系数与零的差别得到p值依次为<0.0001、<0.0001、0.3175,因此,对于前两组典型相关变量,拒绝小于此对典型变量典型相关系数的所有典型相关系数为0的原假设,因此,前两组变量的相关性的研究可转化为研究前两对典型相关变量的相关性。

由表7.13对典型相关系数均为0的F检验,本题中Wilk’Lambda检验结果与表7.12一致,因此表明至少有一个典型相关系数在α<0.0001的显著性水平下非0。

表7.14 Raw Canonical Coefficients for the VAR Variables表由表7.14、表7.15可知,表中数据为原始表达的典型变量的系数,没有使用相同的单位进行测量,造成出现数据十分小的结果,因此对原始变量进行标准化处理。

7.16 Standardized Canonical Coefficients表7.17 Standardized Canonical Coefficients由表7.16第一典型变量V1为:*7*6*****0647.00988.03469.02287.01558.00449.02087.0154321xx x x x x x V +++++-=V1在x 3*上的系数最大,在其余变量上的系数均较小,因此,V1主要代表了农业机械化程度等指标。

来自“产出组”指标的第一典型变量W1为:***3210137.04621.24256.31y y y W --= W1在y 1*上的系数较大,因此W1主要代表了农业总产出等指标。

表7.18 Correlations Between the VAR Variables表7.19 Correlations Between the WITH Variables由表7.18、7.19典型相关结构,在原始变量与本组典型变量的相关关系中,“投入组”指标的第一典型变量V1与农业劳动投入、农业物质消耗、农民受教育程度、农业机械化程度、农业电力文化程度、农业土地投入、化肥用量的相关系数都较大,说明这个典型变量主要反映整个投入指标;“产出组”指标的第一典型变量W1与农业总产出、农业劳动生产率的相关系数都较大(0.9716、0.9446),说明这个典型变量主要反映农业劳动产出。

表7.20 Correlations Between the VAR Variables and the Canonical Variables表7.21 Correlations Between the WITH Variables and the Canonical由表7.20、表7.21典型相关结构知,在原始变量与两组配对组的典型变量的相关关系结果,化肥用量与“投入组”指标的第一典型变量V1的相关系数最大,说明用农牧渔业化肥施用量大则“投入”高;农业总产出与“产出组”指标的第一典型变量W1的相关系数最大(0.9706),说明农业总产出越高,产出量越大。

相关主题