生物统计学复习资料第一章1.生物统计学的基本作用:1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
2)判断试验结果的可靠性3)提供由样本推断总体的方法4)提供试验设计的一些重要原则3.总体:具有相同性质的个体所组成的集合4.个体:组成整体的基本单元5.样本:从总体中抽出的若干个体所构成的集合6.变量:相同性质的事物间表现差异性的某项特征。
按其性质分为连续变量和非连续变量。
变量可以是定量的,也可以是定性的。
7.连续变量:表示在变量范围内可抽出某一范围的所有值8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
10.参数:对总体特征的度量11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。
12.效应:试验因素相对独立的作用13.误差:是试验中不可控因素所引起的观测值偏离真值的差异14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。
15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。
16.错误:是指在试验过程中,人为因素所引起的差错。
17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章1.次数分布:在不同区间内变量出现的次数所构成的分布。
2.资料根据生物的形状特性,可分为数量性状和质量性状3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。
4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在5.质量性状资料的方法:统计次数法,评分法统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数给分法:给予每类性状以相对数量的方法。
6.试验资料搜集方法:调查和试验7.资料调查方法:普查和抽样调查抽样调查:根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
8.随机抽样满足条件: 1)总体中每个个体被抽中的机会均相等; 2)总体中任意一个个体是否被抽中是相互独立的9.统计表要求: 1)标题:简明扼要,准确地说明表的内容,有时须注明时间、地点2)标目:分横纵两项,横列在表的左侧,纵列表上端,须注明计算单位3)数字:一律用阿拉伯数字,以小数点对齐,无数字用“ / ”表示4)线条:多用三线条。
上下两条边路略粗10.统计图绘制的要求:1)标题简明扼要,列于图的下方2)横纵坐标两轴有刻度,注明单位3)横轴从左至右,纵轴由下而上,数值由小至大,图形长宽约为 5.4 或 6.5 4)图中要不同颜色或线条代表不同的事物时,应有图例说明11.计数资料基本采用单项式分组法进行整理12.计量资料的整理一般采用组距式分组法13.次数分布图分类:条形图、饼图、直方图、多边形图、散点图14.变量的基本特征:1)集中性:变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。
特征数是平均值2)离散性:变量有着离中分散变异的性质。
特征数是变异数,常用的指标是极差、方差、标准差和变异系数15.平均数的种类:算术平均数、中位数、纵数、几何平均数17.标准差的作用 ;1)表示变量分布的离散度2)利用标准差的大小,可以概括的估计出变量的次数分布及各类观测值在总体中所占有的比例3)估计平均数的标准误4)进行平均数的区间估计和变异系数的计算18. 组距:根据极差分成若干组,每组的距离相等,称为组距。
组距=极差 / 组数19.自由度:样本内独立且能自由变动的离均差的个数。
20.变异系数:样本的标准差除以平均数的百分比21.平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。
平均数的特征:①离均差之和为零;②离均差平方和为最小。
21.标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个 a,标准差不变;如果给各观测值乘以或除以一个常数 a,所得的标准差就扩大或缩小 a 倍;③在正态分布中, X+-S 内的观测值个数占总个数的 68.26%,X-+2s 内的观测值个数占总个数的 95.49%,x-+3s 内的观测值个数占总个数的99.73%。
标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。
22.比较总体和样本的平均数、标准差:总体平均数μ=∑x/N, 式中分母为总体观察个数 N;样本平均数 x=∑ x/n ,公式中n 是样本容量;样本平均数是总体平均数的无偏估计值。
总体和样本标准差都等于离均差的平方和除以样本容量;而总体标准差σ=, 分母上是总体观测值个数N;而样本标准差是s=2(x x)n1,分母上是样本自由度n-1.样本标准差s 是总体标准差σ的无偏估计值。
第三章:1.事件:一种事物常存在几种可能出的情况,每种情况都一次事件。
2.随机事件:在一定条件下,可能出,也可能不出的事件。
3.随机象:在原本条件不的条件下,重复行察,其果未必相同的象。
随机象三个特征:1)可以在相同条件下多次重复且相互独立;2)定条件下每次果不只一个;3)每次不能料出那种果,但可以大概知。
4.常的理分布:离散型随机量的二分布、泊松分布、型随机量的正分布5.事件的相互关系:1)和事件:事件 A 和事件 B 至少有一件生而构成的新事件2)事件:事件 A 和事件 B 同生而构成的新事件3)互斥事件:事件 A 和事件 B 不能同生4)立事件:事件 A 和事件 B 必有一个生,但二者不能同生5)独立事件:事件 A 的生或事件 B 的生毫无关系6)完全事件:如果多个事件A1、A2⋯两两互斥,切每次果必然生其一6.加法定理是互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 的概率之和7.乘法定理是独立事件的概率的乘8.大数定理:本容量越大,本数与体参数之差越小9. 二分布、泊松分布与正分布的关系:如果 n 相当大或 p 与 q 基本接近,二分布接近于正分布;当λ 大,泊松分布也接近正分布。
10. 正分布的特征:121)当 x=u 是, f(x) 有最大2)当 x-u 的相等, f ( x)也相等,正分布是以u 中心向左右两称分布3) (X-u)/σ的越大, f ( x)也越小,但 f (x)永不会等于0,所以正分布以x 近4)正分布的曲完全由参数 u 和σ决定, u 确定正分布曲在 x 上的中心位置,减小,曲左移,增大曲右移。
σ确定正分布曲的展开程度,越小,曲展开程度越小,曲越陡高,反之亦然5)正分布曲在 x=u+σ 各有一个拐点,曲通拐点是改弯曲的方向6)正态分布的概率密度曲线与渐近线X 轴所围成的全部面积必然等于111.无偏估计值:如果参数所有样本的某一统计数的平均数等于总体的相应参数( 1)样本平均数是总体平均数的无偏估计值(2)样本方差是总体方差的无偏估计值(3)样本标准差不是总体的标准差的无偏估计值12.中心极限定理:如果被抽样总体不是正态总体,但具有平均数 u 和σ 2,当样本容量n 不断增大,样本平均数的分布也越来越接近正态分布,且具有平均数u 2/n和方差σ13.t分布的特征:1)t分布曲线是左右对称,围绕平均数u=0 向两侧递降2)t分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线3)和正态分布相比,t分布的顶部偏低,尾部偏高,自由度大于等于30 时,其曲线就比较接近正态分布曲线,当自由度趋向于无穷大时和正态分布曲线重合14.重置抽样(放回式抽样):指从总体中抽取一个个体,记下其特征数后再放回总体的抽样方法。
15.非重置抽样(不放回式抽样):指从总体中抽取一个个体,记下其特征数后不再放回的抽样方法。
16.抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。
17.无偏估计:指在统计数上如果所有可能样本的统计数的平均数等于总体相应的参数,则称这个统计数为总体相应参数的无偏估计量。
18.频率与概率之间的转化:事件 A 在 n 次重复试验中发生了m次,则比值 m/n 称为事件 A 发生的频率,记为W(A);事件 A 在 n 次重复试验中发生了 m次,当试验次数 n 不断增加时,事件A 发生的频率 W(A)就越来越接近某一确定值 p,则 p 即为事件 A 发生的概率。
二者的关系是:当试验次数 n 充分大时,频率转化为概率。
19.正态分布、标准正态分布、正态分布曲线的特点正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。
U=0,σ2=1 的正态分布为标准正态分布。
正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平1x=μ时,f(x)取最大值2;②、正态分布是以μ均数μ为峰值的曲线,当x u为中心向左右两侧对称的分布③、的绝对值越大,f(x)值就越小,但f(x)永远不会等于 0,所以正态分布以x 轴为渐近线, x 的取值区间为( - ∞, +∞);④、正态分布曲线完全由参数μ和来决定⑤、正态分布曲线在x=μ±处各有一个拐点;⑥、正态分布曲线与x 轴所围成的面积必定等于1。
正态分布具有两个参数μ和,μ决定正态分布曲线在x 轴上的中心位置,μ减小曲线左移,增大则曲线右移;决定正态分布曲线的展开程度,越小曲线展开程度越小,曲线越陡,越大曲线展开程度越大,曲线越矮宽。
第四章1.统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。
2.参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。
参数估计包括点估计和区间估计。
3.统计推断包括假设检验和参数估计两个方面任务:分析误差产生的原因,确定差异的性质,排除误差干扰,从而对总体的特征做出正确的判断。
4.假设检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设推断。