试验统计方法复习题1.何谓实验因素和实验水平?何谓简单效应、主要效应和交互效应?举例说明之。
实验因素: 被变动并设有待比较的一组处理的因子或试验研究的对象。
实验水平: 实验因素的量的不同级别或质的不同状态。
简单效应: 同一因素内俩种水平间实验指标的相差。
主要效应:一个因素内各简单效应的平均数。
交互效应:俩个因素简单效应间的平均差异。
2.什么是实验方案,如何制定一个正确的实验方案?试结合所学专业举例说明之。
试验指标:用于衡量试验效果的指示性状。
制定实验方案的要点○1.目的明确。
○2. 选择适当的因素及其水平。
○3设置对照水平或处理,简称对照(check,符号CK)。
○4应用唯一差异原则。
3.什么是实验误差?实验误差与实验的准确度、精确度以及实验处理间的比较的可靠性有什么关系?○1.试验误差的概念:试验结果与处理真值之间的差异.○2随机误差影响了数据的精确性,精确性是指观测值间的符合程度,随机误差是偶然性的,整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度便愈大。
系统误差是可以通过试验条件及试验过程的仔细操作而控制的。
实际上一些主要的系统性偏差较易控制,而有些细微偏差则较难控制。
4.试分析田间实验误差的主要来源,如何控制田间实验的系统误差?如何降低田间实验的随机误差?误差来源:(1)试验材料固有的差异(2)试验时农事操作和管理技术的不一致所引起的差异(3)进行试验时外界条件的差异控制误差的途径:(1)选择同质一致的试验材料(2) 改进操作和管理技术,使之标准化(3) 控制引起差异的外界主要因素选择条件均匀一致的试验环境;试验中采用适当的试验设计和科学的管理技术;应用相应的科学统计分析方法。
尽量减少实验中的随机波动因素、环节和时间可以有效的降低随机误差。
5.田间实验设计的基本原则是什么?完全随机设计、完全随机区组设计、拉丁设计各有何特点?各在什么情况下使用?(1)基本原则是:○1.重复○2随机排列○3局部控制(2)完全随机设计的特点是设计分析简便,但是应用该设计的条件是要求试验的环境因素相当均匀,所以一般用于实验室培养试验及网、温室的盆钵试验。
完全随机区组设计○1.特点: 根据“局部控制”的原则,将试验地(或试验环境)按肥力变异梯度(或条件变异梯度)划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列。
○2应用条件:对试验地的地形要求不严,必要时,不同区组亦可分散设置在不同地段上。
拉丁方设计的○1.特点:将处理从纵横二个方向排列为区组(或重复),使每个处理在每一列和每一行中出现的次数相等,精确度高,但缺乏伸缩性。
○2 拉丁方设计的通常应用范围只限于4—8个处理。
当在采用4个处理的拉丁方设计时,为保证鉴别差异的灵敏度,可采用复拉丁方设计,即用2个(4×4)拉丁方。
6.总体、样本、参数、统计数、随机样本的概念和关系?总体:具有共同性质的个体所组成的集团.样本:从总体中抽取若干个个体的集合称为样本。
参数:由总体中全部个体观察值计算得总体特征值.统计数:测定样本中的各个体而得的样本特征数,如平均数等,称为统计数随机样本:从总体中随机抽取的样本称为随机样本关系:试验研究的目的是为了获得总体的信息或特征;试验研究的方法则是抽样研究;利用样本的结果(统计数)推断或估计总体特征 (参数).7.算术平均数的意义和特征?平均数:是数据的代表值,表示资料中观察值的中心位置(集中趋势),并且可作为资料的代 表而与另一组资料相比较,借以明确二者之间相差的情况。
算术平均数的重要特性:(1)离均差之和为零 (2)离均差平方的总和最小8.变异数的意义、种类及计算方法?变异数的意义:一表示资料数据间的变异程度或离散程度或离均程度; 二可以衡量平均值的代表性.变异数的种类: ①极差 R=最大观察值—最小观察值②方差 s 2= 1)(1--∑n y ni y③标准差 s=1)(--∑n y y ④变异系数CV=y s 00100⨯ 9.统计概率、正态离差的含义?统计概率:统计学上通过大量实验而估计的概率。
正态离差:变数y 离其平均数u 以σ为单位转换,u=σμ-y 称为正态离差。
10.正态分布曲线的特性?(只要第5点)正态曲线与横轴之间的总面积等于1,因此在曲线下横轴的任何定值,例如从y=y1到y=y2之间的面积,等于介于这两个定值间面积占总面积的成数,或者说等于y 落于这个区间内的概率。
11.小概率事件不可能性原理的含义及应用。
○1小概率原理----若事件A 发生的概率较小,如小于0.05或0.01,则认为事件A 在一次试 验中不太可能发生,这称为小概率事件实际不可能性原理,○2应用:如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件, 然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)12.抽样分布的含义,单个样本平均数抽样分布含义及其参数?俩个样本平均数差数的抽样分布的含义和参数? (1)抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率 分布 (2)由平均数构成的新总体的分布,称为平均数的抽样分布 参数: ○1) 该抽样分布的平均数与母总体的平均数相等。
○2 该抽样分布的方差与母总体方差间存在如下关系:(3)含义:如果从一个总体随机地抽取一个样本容量为n1的样本,同时随机独立地从另一 个总体抽取一个样本容量为n2的样本,那么可以得到分别属于两个总体的样本, 这两个独立随机抽取的样本平均数间差数的抽样分布参数:○1该抽样分布的平均数与母总体的平均数之差相等。
○2该抽样分布的方差与母总体方差间的关系为:12.什么是统计假设?统计假设有哪几种?各有什么含义?假设测验时直接测验的统计假设是哪一种?为什么?统计假设:对样本所属的总体(特征值或参数)提出假设(包括无效假设和备择假设两个)。
无效假设:记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总 体参数相等,即相对而言都不具有自己的独特效应.备择假设:记作HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个 总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设. 无效假设,因为无效假设总体已知,可以研究抽样分布,可以进一步算出抽样在无效假设中 出现的概率。
13.什么是统计假设测验,它的原理与方法。
统计假设测验的含义:首先对样本所属的总体提出统计假设(无效假设 ,备择假设 )然后计算 样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小 则否定该假设,从而接受另一个相反的备择假设.原理:小概率事件实际上不可能发生原理方法:(一)提出统计假设:对所研究的总体首先提出统计假设(二)计算概率: 在假定无效假设为正确的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率 μμ=y ⎪⎭⎪⎬⎫==n n y y σσσσ 222121μμμ-=-y y 2221212222121n n y y y y σσσσσ+=+=-(三) 推断: 根据“小概率事件实际上不可能发生”原理接受或否定无效假设14.区间估计、置信区间、置信限、置信度的概念,区间估计与假设测验的关系。
区间估计:在一定的概率保证之下,由样本的统计数估计出总体参数可能位于的区间. 置信区间:在一定的概率保证之下,由样本的统计数估计出的总体参数可能位于的区间. 置信限 :置信区间的上、下限。
置信度:保证总体参数位于置信区间的概率以P=(1-α)表示。
区间估计与统计假设测验的关系为:如果无效假设位于置信区间内,就接受无效假设,称为差异不显著;如果无效假设位于置信区间外,就否定无效假设,接受备择假设,称为差异显著;15.什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系?用来测验假设的小概率标准5%或1%等,称为显著水平。
当由随机误差造成的概率小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设。
若实际计算的 就否定 接受称差异显著.如果在0.05显著水平上否定H0接受HA,称差异显著.如果在0.01显著水平上否定H0接受HA,称差异极显著.若实际计算的 就接受 称差不异显著如果样本平均数位于否定区域则否定无效假设,称差异显著;如果样本平均数位于接受区域则接受无效假设,称差不异显著.16:什么叫统计推断/它包括哪些内容?为什么统计推断的结论有可能发生错误?有哪俩内错误?如何克服?统计推断:利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数). 它有两条路:一是统计假设测验,二是参数的区间估计.由于实验材料的差异、随机差异、和外界条件等均可导致统计推断发生错误。
有随机误差和系统误差俩内,随机误差不可能避免,但可以减少,主要是控制实验过程,试验误差的控制途径可以选择同质一致的试验材料,改进操作和管理技术使之标准化,控制引起差异的外界主要因素,选择条件均匀一致的试验环境;试验中采用适当的试验设计和科学的管理技术;应用相应的科学统计分析方法。
17.方差分析的含义及基本步骤,如何进行自由度和平方和的分解?(1)方差分析:是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。
是关于k(k ≥3)个样本平均数的假设测验方法. 方差分析的步骤:○1.平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.○2.F 测验:利用f 分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的.○3.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著. αα≤≥p u u ,00:μμ=H 0:μμ≠A H αα-=<1,p u u 00:μμ=H(2)把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.总平方和=组内(误差)平方和+组间(处理间)平方和总自由度DFT =组间自由度DFt +组内自由度DFe18. F 测验的俩个前提条件,如何进行F 测验和多重比较?数据的线性模型与方差分析有何关系? F 测验需具备条件:(1)变数y 遵循正态分布N( μ , σ2), (2) s12 和 s22 彼此独立 。
F 测验的方法:○1.提出统计假设 ○2.规定显著水平 ○3.计算概率○4推断;如果 就否定无效假设,接受 备择假设,如果接受无效假设多重比较的基本思路:利用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值标准, 则它们的总体均值 μi 与μj 就差异显著; 反之就差异不显著.(3)方差分析的理论依据: 线性可加模型, 即总体每一个变量可以按其变异的原因分解成若干个线性组成部分。