当前位置:文档之家› 浙大(参考)生统实验报告3

浙大(参考)生统实验报告3

本科实验报告课程名称:生物统计学及试验设计陈心源姓名:农业与生物技术学院学院:园艺系:专业:园艺3120100418学号:指导教师:朱军/徐海明2014年6月3日实验报告课程名称: 生物统计学及试验设计 指导老师: 徐海明 成绩:__________________ 实验名称: 协方差分析和混合线性模型分析 一、实验目的和要求(必填) 二、实验内容和原理(必填) 三、实验材料与试剂(必填) 四、实验器材与仪器(必填) 五、操作方法和实验步骤(必填) 六、实验数据记录和处理 七、实验结果与分析(必填) 八、讨论、心得一、 实验目的和要求学习协方差分析与二因素析因分析的方法。

了解SAS 、QTModel 、QTLNetwork 等软件的数据分析功能,以及SAS 和QTModel 软件的分析效益。

比较回归分析、相关分析、方差分析、MCIM 定位分析的优劣。

二、 实验内容和原理2.1二因素协方差分析方法 2.2 QTModel 分析方法 2.3 QTL 定位分析方法2.4 回归分析、相关分析、方差分析方法三、 主要仪器设备计算机(使用SAS 软件、QTModel 软件、QTLNetwork 软件)四、 操作方法与实验步骤4.1二因素协方差分析以2个品种2个水分水平的鲜花产量为依变量,重复6次:(1)以小区面积为x 变量,进行二因素协方差分析,分析品种、水分对鲜花产量的影响,对显著的效应进行适当的比较;(2)比较协方差分析与二因素析因分析结果之间的差异。

4.2水稻品种区域试验分析水稻五个品种在二年和三试点三个区组的品种区域试验数据(删除了二个异常值)储存在数据文件(RiceTrial-2.txt)中。

(1)采用SAS 软件的Proc GLM ,Proc Mixed 和Proc V arCom 分析该数据,并对品种的表现作适宜的推断;(2)采用QTModel 软件分析该数据,对品种的表现作适宜的推断; (3)比较SAS 软件和QTModel 软件的分析效益。

专业: 园艺 姓名: 陈心源学号: 3120100418 日期: 2014.6.3 地点:装 订 线4.3 QTL定位分析采用QTLNetwork软件分析控制仿真群体表现型值的QTL定位数据(DHSim.map和DHSim.txt)。

(1)估算QTL的位置和遗传效应,对群体的QTL位置和遗传效应作统计推断;(2)把QTL定位结果和实验一的分析结果都与仿真的参数真值作比较,比较所采用的四种分析方法(回归分析、相关分析、方差分析、MCIM的定位分析)用于推断群体基因定位的可靠性及统计方法的优缺点。

五、实验数据记录和处理(一)二因素协方差分析Data Flower;Input A $ B $ Y X @@;Datalines;数据;PROC GLM;Class A B ;MODEL Y = X A|B;LsMeans A B/STDERR PDIFF Adjust=Tukey ETYPE=3;LSMeans A*B/STDERR PDIFF Adjust=Tukey ETYPE=3;RUN;PROC GLM;Class A B ;MODEL Y = A|B;LsMeans A B/STDERR PDIFF Adjust=Tukey ETYPE=3;LSMeans A*B/STDERR PDIFF Adjust=Tukey ETYPE=3;RUN;1、二因素协方差分析运行结果由上述结果可得,模型极显著。

由变量显著性分析可知,主因素X(小区面积)、A(品种)和B(水分)对Y(鲜花产量)具有显著性影响,而A(品种)和B(水分)的互作对Y(鲜花产量)的影响不显著,所以可以对单独的因素进行分析。

由以上结果分析可知:对于品种因素单一分析,LP品种产量均比WB品种产量高;对于水分因素单一分析,Low水平产量均比High水平产量高。

2、二因素析因分析运行结果由结果可知,模型的Pr>F值=0.2266>0.05且R-Square=0.191113,故模型不显著。

并且,无论是主因素A、B还是两者的互做效应,对Y(鲜花产量)都没有显著性的影响。

由以上结果可知:因为Pr>F值=0.1399,对于A(品种)因素单一分析,无法得到LP品种产量均比WB品种产量高,即LP与WB均不存在显著性差异。

因为Pr>F值=0.1399,对于B(水分)因素单一分析,无法得到Low水平产量均比High水平产量高,即High与Low不存在显著性差异。

由结果分析知:各因素不同水平组合之间的比较产量差异均不显著。

(二)水稻品种区域试验分析1、SAS程序:data Rice;input Gen Year Loc Block Yield;datalines;;proc GLM;Class Gen Year Loc Block;MODEL Yield = Gen Year Loc Year*Loc Gen*Year Gen*Loc Gen*Loc*YearBlock(Year*Loc);Random Year Loc Year*Loc Gen*Year Gen*Loc Gen*Loc*YearBlock(Year*Loc)/test;Means Gen/Tukey;RUN;proc Mixed;Class Gen Year Loc Block;MODEL Yield = Gen;Random Year Loc Year*Loc Gen*Year Gen*Loc Gen*Loc*YearBlock(Year*Loc)/SOLUTION;LSMEANS Gen/ADJUST=Tukey;RUN;proc varcomp method=REML;Class Gen Year Loc Block;MODEL Yield = Gen Year Loc Year*Loc Gen*Year Gen*Loc Gen*Loc*YearBlock(Year*Loc)/fixed=1;RUN;(1)Proc GLM模块分析:模型的Pr>F值<0.0001且 R-Square=0.955918,故模型显著。

yield与Gen、Year、Loc、Year*Loc、Gen*Year Gen*Loc、Gen*Loc*Year、Block(Year*Loc)存在显著的线性关系,且各因素主效应、互做效应均显著。

由上图可知,各效应中只有主效应year (年份效应)、Block (区组效应)和互作效应gen*year*loc (品种*年份*地点)三互作显著,对Y (产量)有显著性影响,其余各效应均不显著。

由上述结果知,Alpha=0.05时,只有4 -1、4-2、5-1、5-2、3-2五组中,两个品种间差异显著,其余各品种间差异不显著。

(2)Proc Mixed模块分析:Mixed分析结果表中列出了模型中变量的协方差参数估计,但没有给出相应的标准误和对应的P value,故无法直接判断各因素的显著性情况。

由上表知,固定效应Gen的第三类估计方法得到的P value=0.3552>0.05,表明品种效应对产量的影响并不显著。

对于固定效应品种(Gen),在其他条件相同时,Gen5的产量最高。

由上表知,Pr>|t|均大于0.05,故虽然不同品种的产量不同,但是各品种间无显著性差异。

(3)Proc VarComp模块分析:VarComp列出了模型中变量的方差参数估计,但未给出显著性检验,故无法直接判断各因素的显著性情况。

2、QTModelQTModel程序:input Gen Year Loc Block Yield ;infile "C:/Documents and Settings/Administrator/ RiceTrial-2.txt" ;proc mixed \ MINQUE1 AUP GLS ;class Gen Year Loc Block ;model Yield = Gen Year Loc Year*Loc Gen*Year Gen*Loc Gen*Loc*Year Block(Year*Loc) / anova estimate;random Year Loc Year*Loc Gen*Year Gen*Loc Gen*Loc*Year Block(Year*Loc)/predictjacknife=1;means gen;运行结果:上表可知,Henderson方法III方差分析得到,Gen、Year、Loc、Year*Loc、Gen*Year、Gen*Loc、Gen*Year*Loc、Block(Year*Loc)的P value均小于0.05,因此,Gen、Year、Loc、Year*Loc、Gen*Year、Gen*Loc、Gen*Year*Loc、Block(Year*Loc)对水稻产量的影响是显著的。

由上表可知各品种均值均与零存在显著性差异。

由上表可知,各品种间差异均不显著。

(三)QTL定位分析:分析结果:以上基因1-3(MK3-MK4)、2-4(MK15-MK16)、3-6(MK28-MK29)三个QTL中,2-4的AE效应不显著,即与零没有显著差异,其余各效应显著。

也就是说2-4QTL对于不同的环境基因表达没有显著性差异。

以上各基因互作中,QTL1-3(MK3-4)和QTL2-4(MK15-MK16)的AA效应不显著,即QTL 1-3(MK3-4)和QTL 1-8(MK8-MK9)的AAE不显著,即与零没有显著差异,其余各效应均显著。

六、实验结果与分析(一)二因素协方差分析协方差分析和二因素析因分析的比较:引入协变量后,Y与X、A、B存在极显著的线性相关,主因素A(品种)、B(水分)对Y(鲜花产量)均存在显著性差异,而其互做效应对Y的影响不显著,LP与WB、High与Low均存在显著性差异。

(二)水稻品种区域试验分析比较SAS软件和QTModel软件的分析效益:SAS软件与QTModel软件数据处理分析结果大致相同,但在结果分析过程中可以发现,SAS未能给出混合模型各随机因素的方差估计值的方差和P value,故较难做进一步判断。

1、回归分析和相关分析:a. 自变量是固定效应,无法分析随机效应自变量;b. 自变量非相互独立,回归系数是偏回归系数;c. 只有残差是相互独立的随机变量;d. 分析海量数据时效果较差。

2、方差分析:a. 可把总变异分解为不同的变异分量;b. 不能分析复杂的统计模型,如系数为非整数,因素间非独立、因素间相互混淆等;c. 不能有效地分析非平衡的数据;d. 可以估算随机效应的方差,但不能估算随机效应值;e. 参数分析的统计功效不高;f. 分析海量数据时效果较差。

相关主题