当前位置:文档之家› 高级试验设计和生物统计

高级试验设计和生物统计

一、名词解释1、主成分分析:主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。

它是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。

2、复相关系数:一个要素或变量同时与几个要素或变量之间的相关关系,它是度量复相关程度的指标,它可利用单相关系数和偏相关系数求得。

复相关系数越大,表明要素或变量之间的线性相关程度越密切。

3、组合设计:是利用正交表安排多因素试验、分析试验结果的一种设计方法。

它从多因素试验的全部水平中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。

3、通径系数:表示各条通径对于改变Y反应量相对重要性的统计数。

4、λ:任意两个处理在同一区组中同时出现的次数或两个处理在同一区组中相遇的次数。

二、问答题1、.裂区设计,随机区组设计。

采用大田试验时,应该采用多因素试验结果的统计分析中的裂区试验的统计分析。

具体按下列步骤进行:①结果整理②分别计算主区部分和副区部分的平方和和自由度③列出方差分析表,进行F检验④多重比较(包括1.主区因素各水平间的比较2.副区因素各水平间的比较3.处理间的比较---包括同一因素下不同水平间的比较和全部处理间的相互比较)⑤试验结论采用盆栽试验时,应该采用多因素试验结果的统计分析中的多因素随机区组试验的统计分析。

具体按下列步骤进行:①结果整理②自由度和平方和的分解③列出方差分析表,进行F检验④多重比较(包括因素间的比较和水平间的比较,以及不同水平组合间的比较和简单效应的检验四个步骤)⑤试验结论2、主成分分析的步骤:(1)计算相关系数矩阵(2)计算特征值与特征向量(3)计算主成分贡献率及累计贡献率(4)计算主成分载荷主成分分析与因子分析的联系:多变量大样本分析中,变量间存在共线性,增加了分析的复杂性。

若分别分析各个指标,分析有可能是孤立的,而不是综合的;盲目地减少指标又有可能损失很多信息,得出错误结论。

欲采用较少指标,反映原资料大部分信息,可采用主成分分析和因子分析。

三、试验设计题因素水平编码表如下:编码值 A B C D γ 2 2 2 21 1 1 1 10 0 0 0 0-1 -1 -1 -1 -1 No. A B C D1 1 1 1 12 1 1 1 -13 1 1 -1 14 1 1 -1 -15 1 -1 1 16 1 -1 1 -17 1 -1 -1 18 1 -1 -1 -19 -1 1 1 110 -1 1 1 -111 -1 1 -1 112 -1 1 -1 -113 -1 -1 1 114 -1 -1 1 -115 -1 -1 -1 116 -1 -1 -1 -117 -2 0 0 018 2 0 0 019 0 -2 0 020 0 2 0 021 0 0 -2 022 0 0 2 023 0 0 0 -224 0 0 0 225 0 0 0 026 0 0 0 027 0 0 0 028 0 0 0 029 0 0 0 030 0 0 0 031 0 0 0 032 0 0 0 033 0 0 0 034 0 0 0 035 0 0 0 036 0 0 0 0四、统计题1、用excel分析得到XY散点图和趋势线得出拟合回归方程Y=468.2857+33.0071*X1-1.2411*X1*X1可以由上式得出极值为x=13.3时,y=6932、用DPS列表得A1 B1 376 434A1 B2 386 458A1 B3 355 413A2 B1 455 356A2 B2 476 366A2 B3 433 333A3 B1 480 465A3 B2 496 474A3 B3 446 425计算出方差分析表随机模型变异来源平方和自由度均方 F 值F0.05 F0.01A因素间14844.11 2 7422.056 174.751** 3.592 6.112 B因素间5390.111 2 2695.056 63.455** 3.592 6.112 AxB 169.8889 4 42.4722 0.017 2.945误差22481.5 9 2497.944总变异42885.61 17由方差分析表可以看出,A,B因素种间、AB互作效应均未达到显著水平,不明显。

处理均值5%显著水平1%极显著水平8 485 a A7 472.5 a A9 435.5 a A2 422 a A5 421 a A4 405.5 a A1 405 a A3 384 a A6 383 a A各个处理间差异不明显。

3、方差来源平方和df 均方F值F0.05 F0.01回归 6.2608 20 0.313 2.59355** 1.878375023 2.444809874 剩余7.911 15 0.5274误差 2.3024 9 0.2558总和14.1718 35计算回归方程得Y1=11.511-0.139X1+0.0767X2-0.0583X3+0.123X4+0.0192X5-0.177X1^2+0.086X2^2+0.0977X 3^2-0.0635X4^2-0.0335X5^2+0.106X1X2+0.0275X1X3+0.191X1X4-0.100X1X5+0.140X2X3-0 .0738X2X4+0.168X2X5-0.268X3X4-0.181X3X5+0.04X4X5实验设计的结构矩阵是一个正交矩阵,它消除了偏回归系数间的相关性,对其进行F检验,其中X5、X5^2、X4X5、X1X3不显著,从原回归方程中剔除,以增强稳定性,提高预测效果,进行第二次方差分析得:Y2=11.488-0.139X1+0.0767X2-0.0583X3+0.123X4-0.177X1*X1+0.0865X2*X2+0.0977X3*X3 -0.0635X4*X4+0.106X1*X2+0.191X1*X4-0.1X1*X5+0.140X2*X3-0.0738X2*X4+0.168X2*X5-0.268X3*X4-0.181X3*X5式中Y为甜瓜的含糖量值,方程Y2达到10%的显著水平(F值为0.9178),相关系数r为0.66034、1)计算X,S,R,CVs 3.163 4.168 6.025 4.842 3.5483.1073.4373.285 4.005 5.041max 14.3 20.13 20.13 20.13 20.13 22.5 22.418.47 22.57 22.57n 3.93 4.13 3.63 3.93 3.63 4.43 4.3 4.13 4.7 4.6R 10.37 16 16.5 16.2 16.5 18.07 18.114.34 17.87 17.97CV 30.4 37.3 46.5 48.1 41.1 32.2 35.6 33.7 35.3 36.52)做多元回归分析方差分析表方差来源平方和df 均方F值F0.05 F0.01回归1241.044 11 112.8222 19.0972** 2.058734093 2.769817剩余218.5883 37 5.9078总的1459.633 48 30.409通过对数据做线性回归,得到回归方程:yˆ=-2.6052-0.7441X1+0.6265X2+0.3172X3-0.2671X4-0.2878X5+0.4986X6+0.1536X7+0.1077 X8+0.6961X9+0.2909X10+0.3641X113)进行逐步回归,建立最优方程变量回归系数标准系数偏相关标准误t值p-值t0.05 t0.01b0 -2.6052 6.9185 -0.3766 0.7087 2.0261924 2.7154087 b1 -0.7441 -0.4269 -0.3275 0.3578 -2.0795 0.0448 2.0261924 2.7154087 b2 0.6265 0.4735 0.4520 0.2061 3.0401 0.0044 2.0261924 2.7154087 b3 0.3172 0.3466 0.2733 0.1861 1.7044 0.0969 2.0261924 2.7154087 b4 -0.2671 -0.2345 -0.2465 0.1750 -1.5264 0.1357 2.0261924 2.7154087 b5 -0.2878 -0.1852 -0.2556 0.1814 -1.5864 0.1214 2.0261924 2.7154087 b6 0.4986 0.2809 0.3172 0.2484 2.0070 0.0523 2.0261924 2.7154087 b7 0.1536 0.0958 0.0991 0.2571 0.5976 0.5539 2.0261924 2.7154087 b8 0.1077 0.0641 0.0880 0.2032 0.5299 0.5994 2.0261924 2.7154087 b9 0.6961 0.5056 0.6079 0.1516 4.5933 0.0001 2.0261924 2.7154087 b10 0.2909 0.2659 0.1814 0.2629 1.1065 0.2759 2.0261924 2.7154087 b11 0.3641 0.3813 0.4116 0.1344 2.7096 0.0102 2.0261924 2.7154087由t检验可以剔除次要变量,筛选得到最优方程偏相关t检验值p-值r(y,X2)= 0.4223 3.0899 0.0034r(y,X7)= 0.558 4.4607 0.0001r(y,X9)= 0.7052 6.5975 0.0001r(y,X11)= 0.7594 7.7431 0.0001最优方程是yˆ=-7.6285+0.3697X 2+0.6236X 7+0.7793X 9+0.5840X114)作通径分析通径系数因子直接→X2 →X7 →X9X2 0.2794 -0.1633 -0.2522X7 0.3887 -0.1174 0.2886X9 0.566 -0.1245 0.1982X11 0.6116 -0.1035 -0.0303 0.0244决定系数=0.78179剩余通径系数=0.46713通过作通径分析可知,因素X11对Y值的直接作用最大;交互作用主要以负作用为主,X2→X9对Y值负作用最大;X7→X9对Y值正作用最大。

试验结论:49个小麦品种的生育期(y)与不同时段的平均温度(xi)的关系中,X11对小麦品种的生育期(y)直接作用最大,各因素交互作用主要以负作用为主,不同时段的平均温度X2→X9对小麦品种的生育期(y)负作用最大;不同时段的平均温度X7→X9对小麦品种的生育期(y)正作用最大。

相关主题