当前位置:文档之家› 生物统计学课件-01

生物统计学课件-01


第四节 生物统计的常见术语
第四节 生物统计的常见术语
1、总体与样本 Population and sample
1) 总体 根据研究目的确定的研究对象的全体称为总体。构成总体 的每个成员称为个体(individual)。含有有限个个体的总体称 为有限总体(finite population)。包含有无限多个个体的总体 叫无限总体(infinite population)。 2) 样本 总体的一部分称为样本。 样本中所包含的个体数目叫样本容量或大小(sample size)。 样本容量常记为n。通常n≤30的样本叫小样本,n>30的样 本叫大样本。 3)抽样sampling 从总体中获得样本的过程。可分为放回式抽样(sampling with replacement)和非放回式抽样(without replacement)。随 机抽样(random sampling)是确定样本代表性的有效方法。
S
2 ( x x ) i
n 1
总体标准差:

2 ( x ) i
N
4)变异系数:是样本变量的相对变异量, 是不带单位的纯数。 用变异系数可以比较不同样本相对变异程度的大小。
s CV 100% x
第四节 生物统计的常见术语
5、数据类型与频数(率)分布
1)连续型数据和离散型数据 与某种标准做比较所得到的数据称为连续型数据 (continuous data),又称度量数据(measurement data); 例如, 长度、时间、重量等。对连续型数据进行分析的方法,通常 称为变量的方法(method of variable)。 由记录不同类别个体的数目所得到的数据,称为离散型 数据(discrete data),又称为计数数据(count data);例如种子 数、株数、人头等。对离散型数据进行分析的方法,通常称 为属性的方法(method of attribute)。
K.Plarson的学生Gosset (1876-1937)在1908年以“student”笔名 发表了“t分布和t检验法”创立了小样本检验代替大样本检 验的理论和方法。 Fisher于1923年发展了显著性检验及估计理论,提出了F分 布和F检验,创立了正交试验设计和方差分析。 1901年英国著名统计学家Pearson创办了《生物统计学杂志》 (Biometrika),标志着生物数学发展的起点。
第一节 生物统计的地位意义
五、生物统计学的特点 Characteristics 1、 根据有限数量的样本观察数据来推断和估计事物的总体, 是生物统计的基本特点。 2、 用样本来推断总体,要求样本具有一定的含量和代表性。 3、推断有很大的可靠性,但有一定的错误率(如假阳性)。
4、实验设计应该先于生物统计分析的思考!
第三节 生物统计的主要内容
统计研究设计
统计表和统计图
统计描述
统计分析
定量资料集中趋势的度量 算术均数、几何均数、调和均数、中位数、分位数和众数 定量资料离散趋势的度量
标准差、标准误差、变异系数、极差和四分位数间距
随机变量及其概率分布 离散型:二项分布、波松分布 连续型:正态分布、t分布、χ2分布、F分布
第二节 生物统计学发展简史
统计学用于生物学的研究,开始于19世纪末,1870年,英 国遗传学家,Galton (1822-1911)提出了相关与回归的概念,被 公认为生物统计学的创始人。
Galton和他的继承人K.Plarson (1857-1936)于1895年成立了伦 2 敦大学生物统计实验室,提出了 检验方法。
2) 方差 2 ( x x ) i 样本方差: S 2
n 1
总体方差:
2
2 ( x ) i
N
第四节 生物统计的常见术语
4、方差、标准差和变异系数variance, standard deviation and variation coefficient
3)标准差 样本标准差:
第二节 生物统计学发展简史
第二节 生物统计学发展简史
最早建立生物统计思想的是A.Quetelet(1796-1874),把
统计学应用于解决生物学、医学和社会学中的问题,第一 个认识到大量变异数据中蕴涵规律性(近代统计学的重要 思想) 最早应用生物统计学的是C.Darwin(1809-1882),进 化论的本质是生物统计 遗传学奠基人G.Mendel的豌豆杂交实验结果也证实了生 物统计的规律
第一节 生物统计的地位意义
生物统计分析软件包的普及将生物统计学从统计
学家的书本里解放出来,成为生物学研究者的常 用工具。但它也带来了一个严重的弊端——对生 物统计方法的误用与滥用。如果把整个统计分析 过程变成一个黑箱, 那就有可能垃圾进,垃圾出 (garbage in, garbage out)。
生活中的统计学
国家统计局相关官员表示,我国居民消费增 长较慢,居民消费支出在GDP中的比重较低。据 悉,2008年中国居民消费率(居民消费占GDP的比 重)为35.3%,美国为70.1%,印度为54.7%。(09 年12月3日新华网) “前三季度中国国内生产总值(GDP)同比增长 7.7%,其中第三季度增长8.9%”、“中国城市 化率已达45.68%”、“97%外出农民 第三节 第四节 第五节 生物统计的地位意义 生物统计学发展简史 生物统计的主要内容 生物统计的常用术语 生物统计学教学要求
第一节 生物统计的地位意义
第一节
生物统计的地位意义
一、概念 生物统计学:把概率论和数理统计的科学原理和方法应用 于生物科学研究中的数量资料的搜集、整理和分析的科学, 是一门应用数学,是现代生物学研究中不可缺少的工具。
Experimental execution(实验实施)
Statistical analysis(数据分析) Interpretation(描述)
第三节 生物统计的主要内容
第三节 生物统计的主要内容
统计研究设计
统计描述
统计分析
调查设计 指调查研究工作全过程的计划。 试验设计 是指试验研究工作进行前应用数理统计原理,制定试 验方案,选择试验材料,对实验因素作合理、有效的安排 ,最大限度地减少 试验误差,使之达到高效,快速、准 确、可靠和经济的目的。 两者的区别 前者:是被动地进行观察,希望干扰因素的影响尽可 能减少; 后者:研究者能较主动地安排试验因素,控制实验条 件,尽可能排除或抵消非试验因素的干扰和影响。
4、方差、标准差和变异系数variance, standard deviation and variation coefficient
1)极差,又称范围range:它是样本变量中最大值和最小值之差, 一般用R表示。
R max{x1, x2 , xn } min{x1, x2 , xn}
第一节 生物统计的地位意义
三、生物统计的作用 1、为科学地整理、描述数据提供方法 2、判断试验结果的可靠性
由于存在试验误差,从试验所得的数据资料必须借助于统 计分析方法才能获得可靠的结论。
3、提供由样本推断总体的方法。 4、提供试验设计的原则和方法
第一节 生物统计的地位意义
四、生物统计的意义 21 世纪是生命科学的世纪,无疑也为生物统计学 的发展与应用拓展了广阔的空间。
第三节 生物统计的主要内容
统计研究设计
统计描述
统计分析
a.假设检验 b.统计推断 estimative statistics c.研究变量之间的关系 无自变量与因变量之分:直线相关分析、典型相关分析 研究多变量内部的从属关系:主成分分析、因子分析等。 多变量之间亲疏关系:聚类分析 有自变量与因变量之分:直线回归分析、曲线回归分析、 多项式回归分析、Logistic概率模型回归分析等 d.判别分析 根据一些明确分类的总体所提供的信息,对未知个体的归 属进行分类的判别分析。
第一节 生物统计的地位意义
二、生物统计的地位
生物数学(Biomathematics):以数学方法研究和解决生物学 问题,并对生物学有关的数学方法进行理论研究,介于生物 学和数学之间的边缘学科。从研究使用的数学方法划分,生 物数学可分为生物统计学、生物信息学、生物系统论、生物 控制论和生物方程等分支。
第四节 生物统计的常见术语
2、特征数 总 体 表示总体和样本的数量特 征的量称为特征数。 1) 参数Parameter :由总体计 抽样 算得来的特征数,常用希腊字 母表示。用μ表示总体平均数, 样 本 用σ表示总体标准差。 2) 统计量statistics :由样本计 算得来的特征数, 常用拉丁字 计算统计量 描述 母表示统计量。用 x 表示样本 平均数,用S表示样本标准差。 3) 总体参数由相应的统计量来 统计量 估计,例如用 x 估计μ,用S 估计σ等。
第二节 生物统计学发展简史
Neyman (1894-1981)和S.Pearson进行了统计理论的研究工作, 提出统计假设检验系统,标志着统计学真正形成。 There are five components to an experiment: Hypothesis(假设) Experimental design(实验设计)
央视网消息,CTR市场研究公司通过随机抽样,电话调查了 2290个收看家庭,结果显示,96.1%的用户收看了今年春晚, 其中81.6%认为今年春晚办得好。 而15日的《广州日报》报道,在某门户网站对今年春晚的满意 度调查上,截至今日零时记者截稿前,认为“好”的只占 15.2%,不到两成,46.5%的人认为不好。 春晚的满意度每年都有两个版本,央视永远志得意满,神 采飞扬,民间许多人并不买账,骂声不绝。《京华时报》 15日报道,央视市场研究公司公布历年的调查结果,近5年 来,央视春晚的叫好率逐年走低。其中,2006年叫好率为 85.5%,2007年为83.6%,2008年为81.1%,2009年为81.1%。
6、中位数和众数median and mode 中位数:在累积频数图中1/2总频数位置上的数值。 众数:离散型数据的众数是频数图中频数最高的组 值;连续型数据的众数是频数图中频数最高的中值。
相关主题