当前位置:文档之家› 生物统计与田间试验总复习

生物统计与田间试验总复习


N(0,1)。
正态分布的一些常用区间及其对应的概率值如下:
区间 μ±1 面积或概率=0.6827
μ±2
=0.9545
μ±3 μ±1.960 μ±2.576
=0.9973 =0.9500 =0.9900
例题:
已知:μ=30,σ=5 ,y~N(30,52)
求: P(y<26), P(y<40), P(26<y<40 ), P(y>40)=?
4. 二项式分布的参数 总体平均数 μ=np
C
y n

n! y!(n
y)!
总体方差 σ2=npq=np(1-p) 二项总体标准差 σ= npq np(1 p)
5.泊松分布:令 np=m 形状由 m 的大小决定 (1)m 小,偏斜状
P(y) my em y!
m
2 m
m
解: P(y<26)= P( x 30 26 30 ) P(u<-0.8)=0.2119
5
5
P(y<40)=P( x 30 40 30 ) P(u<2)=0.977
5
5
P(26<y<40)= P(y<40)-P(y<26)=0.9773-0.2119=0.7654 P(y>40)=1- P(y≤40)=1-0.9773=0.0227 7.抽样分布( sampling distribution ):是统计推断的基础。研究总体和样本之间的关系 的两个方向:第一个方向:总体→样本,一般→特殊;第二个方向:样本→总体,特殊→ 一般。 8. 无限总体:可抽得无限多个随机样本。有限总体:总体容量为 N,样本容量为 n ,所 有可能样本个数 m=Nn 平均数 9.正态总体的抽样分布规律:
第三章 次数分布、平均数、变异数——试验数据的整理
1.总体( population):具有共同性质的个体所组成的集团。有限总体----总体所包含的个 体数目有无穷多个;无限总体----由有限个个体构成的总体。 2.观察值( observation):每一个体的某一性状、特性的测定数值。 3.变数( variable):观察值集合起来,称为总体的变数。变数又称为随机变数(random variable)。 4.样本( sample):从总体中抽取若干个个体的集合称为样本(sample)。 5.统计数( statistic):测定样本中的各个体而得的样本特征数,如平均数等,称为统计 数(statistic)。 6.随机样本( random sample):从总体中随机抽取的样本称为随机样本(random sample) 7.样本容量 ( sample size):样本中包含的个体数称为样本容量或样本含量(sample size)。
第四章 理论分布与抽样分布 1. 小概率原理(小概率事件实际不可能性原理):如在假定条件下能准确算出事件 A 出现的 概率 α 很小,则在相同条件的无数次重复试验中,事件 A 将按预定的概率发生,而在一次 试验中则几乎不可能发生。
2.所谓二项总体( binary population ):就是非此即彼的两类事件构成的总体。
8. 数量性状(quantitative trait)的度量有计数和量测两种方式,其所得变数不同。不
连续性或间断性变数( discontinuous or discrete variable ):指用计数方法获得的数
据。 连续性变数( continuous variable ):指称量、度量或测量方法所得到的数据,其
(2)m 增大,逐渐对称、趋于正态分布
(3)在实际中,如 m> 10,则可用正态分布以求概率
6.正态分布
令u

(
y

)
可将f
N(
y)

1 2
e
1 2
y
2
标准化为:(u)
1
e 1 u 2 2
2
上式称为标准化正态分布方程,它是参数 μ=0,σ2=1 时的正态分布(图 4.7)。记作
第二章 田间试验的设计与实施 1.田间试验的基本要求:(1) 试验目的要明确;(2)试验条件要有代表性; (3)试验结果要 可靠;(4)试验结果要能够重演;(5)体现唯一差异原则。
2. 田间试验设计(field experiment design) :广义是指整个试验研究课题的设计,包 括确定试验处理的方案,小区技术,以及相应的资料搜集、整理和统计分析的方法等;狭 义专指小区技术,特别是重复区和试验小区的排列方法。 3.田间试验设计的原则:重复(replication) :试验中同一处理种植的小区数即为重复次 数。随机 (random):是指一个区组中每一处理都有同等的机会设置在任何一个试验小区上, 避免任何主观成见。局部控制(local control): 局部控制就是将整个试验环境分成若干 个相对最为一致的小环境,再在小环境内设置成套处理,即在田间分范围分地段地控制土 壤差异等非处理因素,使之对各试验处理小区的影响达到最大程度的一致。。 重复的作用:估 计试验误差、降低试验误差。 4.小区(plot):在田间试验中,每安排一个处理的小块地段。 5.生长竞争:当相邻小区种植不同品种或相邻小区施用不同肥料时,由于株高、分蘖力或 生长期的不同,通常将有一行或更多行受到影响。 6.边际效应:小区两边或两端的植株,因占较大空间而表现的差异,小区面积应考虑边际 效应大小,边际效应大的相应需增大小区面积。 7.区组( block ) :将全部处理小区分配于具有相对同质的一块 土地上,这称为一个区组 (block) 。完全区组:一般试验须设置 3~4 次重复,分别安排在 3~4 个区组上,这时重 复与区组相等,每一区组或重复包含有全套处理,称为完全区组。不完全区组:少数情况 下,一个重复安排在几个区组上,每个区组只安排部分处理,称为不完全区组。 8.对比法设计(contrast design):这种设计的排列特点是每一供试品种均直接排列于对照 区旁边,使每一小区可与其邻旁的对照区直接比较。 9.间比法设计(interval contrast design):排列的第一个小区和末尾的小区一定是对照 (CK)区,每二对照区之间排列相同数目的处理小区。 10.随机排列的试验设计:①完全随机设计 (Completely random design):适用于单因素、 多因素试验。②随机区组设计 (Randomized blocks design):每一重复为一个区组,区组 数=重复数;不同区组的随机排列是独立进行的。③拉丁方设计 (Latin square design): 每行(列)都含有全部不同元素,且行、列数都相等的方格图。标准(拉丁)方:第一行 和第一列为顺序排列的拉丁方。④裂区设计 (Split-plot design): 试验因素分级;先按 主处理水平数划分小区;然后分别在每一主区中按副处理的水平数划分小区;每一区组内的 各主处理和每一主区中的各副处理的随机排列都是独立进行的。⑤再裂区设计 (Splitsplit plot design):将第三个因素的各个处理(称为副副处理),随机排列于再裂区内的 设计。⑥条区设计 (Strip blocks design):适用于双因素试验的方法。 11.总体:指根据研究目的确定的符合指定条件的全部研究对象。 12.样本:指从总体中抽出的代表总体的部分个体。随机样本:用随机方法从总体中抽出的 样本。样本容量:样本中包含的个体数,常用 n 表示。大样本:n≥30;小样本:n<30 13.抽样方法:①随机抽样:简单随机抽样、分层抽样、整群抽样②顺序抽样
各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。
9.质量性状( qualitative trait ):指能观察而不能量测的状即属性性状,如花药、子粒、
颖壳等器官的颜色、芒的有无、绒毛的有无等。
10.连续性变数资料的整理:①数据排序(sort)② 求极差(range)③确定组数和组距(
几何平均数:G n
12.样本平方和:SS
y1 y2 y3 L
( yi y)2
yn
( y1 y2 y3
样本均方:s 2
L ny(nyi)1/yn)2
1 n 1
( yi
i1
SS n 1

y)
( yi

y)
0
总体平方和:SS ( yi )2
总体方差: 2 ( yi )2 SS
3.二项分布( binomial distribution ):如果从二项总体进行 n 次重复抽样,设出现“此”
的次数为 y,那么 y 的取值可能为 0、1、2、…、n,共有 n+1 种可能取值,这 n+1 种取值
各有其概率,因而由变量 y 及其概率就构成了一个分布,这个分布叫做二项式概率分布。
变量 y 也称为服从二项分布的随机变量,记作 y~B(n,p)。
class interval )④选定组限( class limit )和组中点值( 组值,class value )⑤ 把
原始资料的各个观察值按分组数列的各组组限归组。
11. 五种类型平均数(average):算术平均数、中数、众数、几何平均数、调和平均数。算
术平均数的重要性质:离均差之和为零、离均差平方和最小。 n
生物统计与田间试验
第一章 绪论—科学试验及其误差控制 1.科学研究的基本方法:选题、文献、假说、假说的检验、试验的规划与设计。 2.唯一差异性原则:除需要比较的因素以外,其余的因素必须保持在同一水平。 3.试验方案:指根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。 4.处理因素必须是:①可控的;②在数量上或质量上具有不同等级或水平。 5.水平(level):因素内的不同状态或者数量等级称为水平。 6.处理(treatment) :试验中的具体比较项目叫做处理。 在单因素试中,每一个水平就是 一个处理;在多因素试验中,每一个水平组合是一个处理。 7.试验因素、水平、处理是三个密切联系的概念:①凡一个因素就有若干个水平,因素与 水平是联系在一起的。②水平组合是针对多因素试验而言的;一个水平组合是每个因素各 出一个水平构成,为一个处理。③一个多因素试验的所有不同的水平组合数是各因素水平 数之积。 8.试验指标:衡量试验处理效果的标准,简称指标。包括试验单元、抽样单元、测量单元。 9.试验效应(experimental effect) :试验因素对试验指标所起的增加或减少的作用。简 单效应(simple effect): 在同一因素内两种水平间试验指标的相差。 主要效应(main effect);简称主效: 一个因素内各简单效应的平均数称平均效应;交互作用效应 (interaction effect),简称互作:两个因素简单效应间的平均差异。 9.一级互作(first order interaction) : 两个因素间的互作, A×B、B×C ……。易 于理解,实际意义明确;二级互作(second order interaction) :三个因素间的互作。 10.应有对照水平或处理,简称对照(check,CK)。 11.观察值(observation):将每次所取样品测定的结果称为一个观察值,记为 yi。 12.误差(error):观察值与真值之间的差异。 13.偶然性误差(spontaneous error)或随机误差(random error):这是由于许多无法控制 的内在和外在的偶然因素所造成。随机误差影响试验的精确性。 14.系统误差(systematic error)也叫片面误差(lopsided error):是由于试验材料、管理 指施相差较大,仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的差异所 引起。系统误差影响试验的准确性。 15.准确性(accuracy)也叫准确度:指在调查或试验中某一试验指标或性状的观测值与其真 值接近的程度,系统误差影响了数据的准确性。 16.精确性(precision)也叫精确度:指调查或试验中同一试验指标或性状的重复观测值彼 此接近的程度,偶然误差影响了数据的精确性。 17.统计(statistics):指对某一现象的有关的数据的收集、整理、计算和分析等。
相关主题