生物统计与田间试验第一章绪论—科学试验及其误差控制1.科学研究的基本方法:选题、文献、假说、假说的检验、试验的规划与设计。
2.唯一差异性原则:除需要比较的因素以外,其余的因素必须保持在同一水平。
3.试验方案:指根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。
4.处理因素必须是:①可控的;②在数量上或质量上具有不同等级或水平。
5.水平(level):因素内的不同状态或者数量等级称为水平。
6.处理(treatment) :试验中的具体比较项目叫做处理。
在单因素试中,每一个水平就是一个处理;在多因素试验中,每一个水平组合是一个处理。
7.试验因素、水平、处理是三个密切联系的概念:①凡一个因素就有若干个水平,因素与水平是联系在一起的。
②水平组合是针对多因素试验而言的;一个水平组合是每个因素各出一个水平构成,为一个处理。
③一个多因素试验的所有不同的水平组合数是各因素水平数之积。
8.试验指标:衡量试验处理效果的标准,简称指标。
包括试验单元、抽样单元、测量单元。
9.试验效应(experimental effect) :试验因素对试验指标所起的增加或减少的作用。
简单效应(simple effect):在同一因素内两种水平间试验指标的相差。
主要效应(main effect);简称主效:一个因素内各简单效应的平均数称平均效应;交互作用效应(interaction effect),简称互作:两个因素简单效应间的平均差异。
9.一级互作(first order interaction) :两个因素间的互作,A×B、B×C ……。
易于理解,实际意义明确;二级互作(second order interaction) :三个因素间的互作。
10.应有对照水平或处理,简称对照(check,CK)。
11.观察值(observation):将每次所取样品测定的结果称为一个观察值,记为y i。
12.误差(error):观察值与真值之间的差异。
13.偶然性误差(spontaneous error)或随机误差(random error):这是由于许多无法控制的内在和外在的偶然因素所造成。
随机误差影响试验的精确性。
14.系统误差(systematic error)也叫片面误差(lopsided error):是由于试验材料、管理指施相差较大,仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的差异所引起。
系统误差影响试验的准确性。
15.准确性(accuracy)也叫准确度:指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度,系统误差影响了数据的准确性。
16.精确性(precision)也叫精确度:指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度,偶然误差影响了数据的精确性。
17.统计(statistics):指对某一现象的有关的数据的收集、整理、计算和分析等。
第二章田间试验的设计与实施1.田间试验的基本要求:(1) 试验目的要明确;(2)试验条件要有代表性; (3)试验结果要可靠;(4)试验结果要能够重演;(5)体现唯一差异原则。
2.田间试验设计(field experiment design) :广义是指整个试验研究课题的设计,包括确定试验处理的方案,小区技术,以及相应的资料搜集、整理和统计分析的方法等;狭义专指小区技术,特别是重复区和试验小区的排列方法。
3.田间试验设计的原则:重复(replication) :试验中同一处理种植的小区数即为重复次数。
随机 (random):是指一个区组中每一处理都有同等的机会设置在任何一个试验小区上,避免任何主观成见。
局部控制(local control):局部控制就是将整个试验环境分成若干个相对最为一致的小环境,再在小环境内设置成套处理,即在田间分范围分地段地控制土壤差异等非处理因素,使之对各试验处理小区的影响达到最大程度的一致。
重复的作用:估计试验误差、降低试验误差。
4.小区(plot):在田间试验中,每安排一个处理的小块地段。
5.生长竞争:当相邻小区种植不同品种或相邻小区施用不同肥料时,由于株高、分蘖力或生长期的不同,通常将有一行或更多行受到影响。
6.边际效应:小区两边或两端的植株,因占较大空间而表现的差异,小区面积应考虑边际效应大小,边际效应大的相应需增大小区面积。
7.区组( block ) :将全部处理小区分配于具有相对同质的一块土地上,这称为一个区组(block) 。
完全区组:一般试验须设置3~4次重复,分别安排在3~4个区组上,这时重复与区组相等,每一区组或重复包含有全套处理,称为完全区组。
不完全区组:少数情况下,一个重复安排在几个区组上,每个区组只安排部分处理,称为不完全区组。
8.对比法设计(contrast design):这种设计的排列特点是每一供试品种均直接排列于对照区旁边,使每一小区可与其邻旁的对照区直接比较。
9.间比法设计(interval contrast design):排列的第一个小区和末尾的小区一定是对照(CK)区,每二对照区之间排列相同数目的处理小区。
10.随机排列的试验设计:①完全随机设计 (Completely random design):适用于单因素、多因素试验。
②随机区组设计 (Randomized blocks design):每一重复为一个区组,区组数=重复数;不同区组的随机排列是独立进行的。
③拉丁方设计 (Latin square design):每行(列)都含有全部不同元素,且行、列数都相等的方格图。
标准(拉丁)方:第一行和第一列为顺序排列的拉丁方。
④裂区设计 (Split-plot design):试验因素分级;先按主处理水平数划分小区;然后分别在每一主区中按副处理的水平数划分小区;每一区组内的各主处理和每一主区中的各副处理的随机排列都是独立进行的。
⑤再裂区设计 (Split-split plot design):将第三个因素的各个处理(称为副副处理),随机排列于再裂区内的设计。
⑥条区设计 (Strip blocks design):适用于双因素试验的方法。
11.总体:指根据研究目的确定的符合指定条件的全部研究对象。
12.样本:指从总体中抽出的代表总体的部分个体。
随机样本:用随机方法从总体中抽出的样本。
样本容量:样本中包含的个体数,常用 n 表示。
大样本:n≥30;小样本:n<30 13.抽样方法:①随机抽样:简单随机抽样、分层抽样、整群抽样②顺序抽样第三章次数分布、平均数、变异数——试验数据的整理1.总体( population):具有共同性质的个体所组成的集团。
有限总体----总体所包含的个体数目有无穷多个;无限总体----由有限个个体构成的总体。
2.观察值( observation):每一个体的某一性状、特性的测定数值。
3.变数( variable):观察值集合起来,称为总体的变数。
变数又称为随机变数(random variable)。
4.样本( sample):从总体中抽取若干个个体的集合称为样本(sample)。
5.统计数( statistic):测定样本中的各个体而得的样本特征数,如平均数等,称为统计数(statistic)。
6.随机样本( random sample):从总体中随机抽取的样本称为随机样本(random sample)7.样本容量 ( sample size):样本中包含的个体数称为样本容量或样本含量(sample size)。
8.数量性状(quantitative trait)的度量有计数和量测两种方式,其所得变数不同。
不连续性或间断性变数( discontinuous or discrete variable ):指用计数方法获得的数据。
连续性变数( continuous variable ):指称量、度量或测量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。
9.质量性状( qualitative trait ):指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。
10.连续性变数资料的整理:①数据排序(sort)② 求极差(range)③确定组数和组距( class interval )④选定组限( class limit )和组中点值( 组值,class value )⑤把原始资料的各个观察值按分组数列的各组组限归组。
11. 五种类型平均数(average):算术平均数、中数、众数、几何平均数、调和平均数。
算术平均数的重要性质:离均差之和为零、离均差平方和最小。
DF 等于观察值的个数(n )14.15.16.理论总体(群体)的平均数和标准差:第四章 理论分布与抽样分布1. 小概率原理(小概率事件实际不可能性原理):如在假定条件下能准确算出事件A 出现的概率α很小,则在相同条件的无数次重复试验中,事件A 将按预定的概率发生,而在一次试验中则几乎不可能发生。
)()=∑-=y y y i n ∑=)(i i p μμ∑-=])([22μμσi i p2.所谓二项总体( binary population ):就是非此即彼的两类事件构成的总体。
3.二项分布( binomial distribution ):如果从二项总体进行n 次重复抽样,设出现“此”的次数为y ,那么y 的取值可能为0、1、2、…、n ,共有n +1种可能取值,这n +1种取值各有其概率,因而由变量y 及其概率就构成了一个分布,这个分布叫做二项式概率分布。
变量y 也称为服从二项分布的随机变量,记作y ~B (n ,p )。
4.二项式分布的参数 总体平均数 μ=np总体方差 σ2=npq =np(1-p)二项总体标准差 σ= 5.泊松分布:令np=m 形状由m 的大小决定 (1)m 小,偏斜状(2)m 增大,逐渐对称、趋于正态分布(3)在实际中,如m > 10,则可用正态分布以求概率 6.正态分布令 可将 标准化为:上式称为标准化正态分布方程,它是参数μ=0,σ2=1时的正态分布(图4.7)。
记作N (0,1)。
正态分布的一些常用区间及其对应的概率值如下:例题:已知:μ=30,σ=5 ,y ~N(30,52)求: P(y<26), P(y<40), P(26<y<40 ), P(y>40)=?解: P(y<26)= P(u<-0.8)=0.2119P(y<40)= P(u<2)=0.977P(26<y<40)= P(y<40)-P(y<26)=0.9773-0.2119=0.7654 P(y>40)=1- P(y≤40)=1-0.9773=0.02277.抽样分布( sampling distribution ):是统计推断的基础。