2010级3班整理生物统计学基础知识整理生物统计学整理第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。
本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。
2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。
3个体:构成总体的每个成员称为个体。
4样本:总体的一部分称为样本5样本含量:样本内包含的个体数目称为样本含量6抽样:从总体中获得样本的过程。
7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法10属性的方法:对离散型数据进行分析的方法11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差12概率论:研究偶然现象本身规律性的科学13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性的科学14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。
15基本事件:试验的每一最基本结果用小写拉丁字母表示2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样?1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。
2)样本:总体的一部分称为样本3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的研究,推断其总体。
生物统计学中往往总体数目是无限个,为方便研究总体特征需要抽样。
4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机抽样。
随机抽样的方法很多,例如抽签,拈阄等。
最好方法是使用随机数字表进行抽样。
5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。
第二步,在选定的那一页上,在点一次,决定从那个字开始。
决定开始以后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,u=-1 到 u=1面积=0.6827u=-2 到 u=2面积=0.9543u=-3 到 u=3面积=0.9973u=-1.960 到 u=1.960面积=0.9500u=-2.576 到 u=2.576面积=0.99009)正态分布的偏斜度ϒ1=0,峭度ϒ2=0第三部分:小知识点1.在一个有限总体中要随机抽样应采用放回式抽样方法。
2.在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。
3.已知 F 分布的上侧临界值 F0.05(1,60)=4.00,则左尾概率为 0.05,自由度为(60,1)的 F 分布的临界值为0.254.衡量优良估计量的标准有无偏性、有效性和相容性。
5.已知随机变量 x 服从N (8,4),P(x < 4.71)=0.05。
6.变量之间的相关关系主要有两大类:(因果关系),(平行关系)7.8.算术平均数:是所有观察值的和除以观察的个数9.中位数:将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为中位数,以 Md表示10.众数:在一个样本的所有观察值中,发生频率最大的一个值称为样本的众数,以 Mo 表示11.几何平均数:资料中有 n 个观测值,其乘积开 n 次方所得的数值,以 G 表示。
12.极差(全距):样本数据资料中最大观测值与最小观测值的差值13.t分布:是小样本分布,小样本分布一般是指 n<30。
t 分布适用于当总体标准差未知时用样本标准差代替总体标准差,由样本平均数推断总体平均数以及2 个小样本之间差异的显著性检验等14.卡方值是度量实际观测值与理论值偏南程度的一个统计量卡方值越小,表明观测值与理论值越接近卡方值越大,表明观测值与理论值相差越大卡方值为 0,表明 H0 严格成立,且它不会有下侧否定区,只能进行右尾检验15.16.选择例题1)、下列数值属于参数的是:AA、总体平均数B、自变量C、依变量D、样本平均数2)、下面一组数据中属于计量资料的是DA、产品合格数B、抽样的样品数C、病人的治愈数D、产品的合格率3)、在一组数据中,如果一个变数 10 的离均差是 2,那么该组数据的平均数是CA、12B、10C、8D、24)、变异系数是衡量样本资料A程度的一个统计量。
A、变异B、同一C、集中D、分布5)、方差分析适合于,A数据资料的均数假设检验。
A、两组以上B、两组C、一组D、任何6)、在 t检验时,如果 t = t0、01,此差异是:BA、显著水平B、极显著水平C、无显著差异D、没法判断7)、生物统计中 t 检验常用来检验AA、两均数差异比较B、两个数差异比较C、两总体差异比较D、多组数据差异比较8)、平均数是反映数据资料B性的代表值。
A、变异性B、集中性C、差异性D、独立性9)、在假设检验中,是以C为前提。
A、肯定假设B、备择假设C、原假设D、有效假设10)、抽取样本的基本首要原则是BA、统一性原则B、随机性原则C、完全性原则D、重复性原则11)、统计学研究的事件属于D事件。
A、不可能事件B、必然事件C、小概率事件D、随机事件12)、下列属于大样本的是AA、40B、30C、20D、1013)、一组数据有 9 个样本,其样本标准差是 0.96,该组数据的标本标准误(差)是DA、0.11B、8.64C、2.88D、0.3214)、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是B。
A、正比关系B、反比关系C、加减关系D、没有关系15)、在方差分析中,已知总自由度是 15,组间自由度是 3,组内自由度是BA、18B、12C、10D、516)、已知数据资料有 10 对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是AA、9、1和8B、1、8 和 9C、8、1 和 9D、9、8 和 117)、观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为DA、偶然误差B、系统误差C、疏失误差D、统计误差18)、下列那种措施是减少统计误差的主要方法。
BA、提高准确度B、提高精确度C、减少样本容量D、增加样本容量19)、相关系数显著性检验常用的方法是CA、t-检验和 u-检验B、t-检验和 X2-检验C、t-检验和F检验D、F 检验和 X2-检验20)、判断整体中计数资料多种情况差异是否显著的统计方法是BA、t-检验B、F-检验C、X2-检验D、u-检验21、在 t检验时,如果 t = t0、01,此差异是:BA、显著水平B、极显著水平C、无显著差异D、没法判断22、已知数据资料有 10 对数据,并呈现线性回归关系,它的总自由度、回归自由度和残差自由度分别是AA、9、1和8B、1、8 和 9C、8、1 和 9D、9、8 和 123、观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为DA、偶然误差B、系统误差C、疏失误差D、统计误差24、在均数假设检验中,当样本的个数大于 30 时,通常选择B检验。
A、t-检验B、u-检验C、F-检验D、都可以25、生物统计中 t 检验常用来检验AA、两均数差异比较B、两个数差异比较C、两总体差异比较D、多组数据差异比较26、百分数检验中,只有 np 和 nq 都大于D时,可用 u 或 t 检验。
A、30B、20C、10D、527、下面一组数据中属于计量资料的是DA、产品合格数B、抽样的样品数C、病人的治愈数D、产品的合格率28、平均数是反映数据资料B性的代表值。
A、变异性B、集中性C、差异性D、独立性29、一组数据有 9 个样本,其样本标准差是 0.96,该组数据的标本标准误(差)是DA、0.11B、8.64C、2.88D、0.3230、变异系数是衡量样本资料A程度的一个统计量。
A、变异B、同一C、集中D、分布31、在假设检验中,计算的检验统计量与事件发生的概率之间存在的关系是B。
A、正比关系B、反比关系C、加减关系D、没有关系32、下列那种措施是减少统计误差的主要方法。
BA、提高准确度B、提高精确度C、减少样本容量D、增加样本容量33、在方差分析中,已知总自由度是 15,组间自由度是 3,组内自由度是BA、18B、12C、10D、534、多重比较是对各个处理间的差异显著性检验的一种方法,它是对各处理的D间进行多重比较。
A、统计数B、变数C、F 值D、平均数35、在 X2检验中,当自由度为A时,需要对在 X2检验的连续性进行矫正。
A、1B、2C、3D、436、已回归方程的决定系是 0.81,那么此回归方程的相关系数是B。
BA、0.6561B、0.9C、0.59D、0.8137、下列数值属于参数的是:AA、总体平均数B、自变量C、依变量D、样本平均数38、相关系数显著性检验常用的方法是CA、t-检验和 u-检验B、t-检验和 X2-检验C、t-检验和F检验D、F 检验和 X2-检验39、抽取样本的基本首要原则是BA、统一性原则B、随机性原则C、完全性原则D、重复性原则40、一组成组数据资料,每组具有 10 个观察值。
该配对资料的自由度是DA、20B、19C、18D、941.x~N(1,9),x1,x2,…,x9是 X 的样本,则有()A.x-13~N(0,1)B.x-11~N(0,1)C.x-19~N(0,1)D.以上答案均不正确42.假定我国和美国的居民年龄的方差相同。
现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄的标准误()A.两者相等B.前者比后者大C.前者比后者小D.不能确定大小43.设容量为 16 人的简单随机样本,平均完成工作需时 13 分钟。
已知总体标准差为 3 分钟。
若想对完成工作所需时间总体构造一个 90%置信区间,则()A.应用标准正态概率表查出 u 值B.应用 t 分布表查出 t 值C.应用卡方分布表查出卡方值D.应用 F 分布表查出 F 值44. 1-α是()A.置信限B.置信区间C.置信距D.置信水平45.如检验 k (k=3)个样本方差 s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为()。
A.方差的齐性检验B. t 检验C. F 检验D. u 检验21 /22。