生物统计学复习1
• 准确性:也叫准确度,指在调查或试验中某一试 验指标或性状的观测值与其真值接近的程度。
• 精确性:也叫精确度,指调查或试验中同一试验 指标或性状的重复观测值彼此接近的程度。
第二章 试验资料整理与特征数的计算
一、资料的整理(定性描述)
1. 数量性状资料 Quantitative data 2. 质量性状资料 Qualitative data
平均数(average):是统计学中最常用的统计量,用 来表明资料中各观测值相对集中较多的中心位置,即 反映资料的集中趋势。 平均数的种类主要有: 1. 算术平均数(arithmetic mean) 2. 中位数(median)
3. 众数(mode)
4. 几何平均数(geometric mean)
• 变量:指相同性质的事物间表现差异性或差异特 征的数据 ,表示在一个界限内变动着的性状数值 • 常数:表示能代表事物特征和性质的数值,通常 由变量计算而来,在一定过程中是不变的。
• 参数:描述总体特征的数量 • 统计数:描述样本特征的数量
• 效应:通过施加试验处理,引起试验差异的作用 • 互作:又叫连应,是指两个或两个以上处理因素 间相互作用产生的效应。 实验误差:实验过程中由于无法控制的因素引起的 实际观察值与客观真实值之间的差异
组中值与组限、组距的关系如下: 组中值=(组下限+组上限)/2
表号
标题
• 绘制统计分布图
条形图(bar chart)
直方图(histogram) 折线图(broken-line chart),又称多边形图 饼图(pie chart) 散点图 (scatter chart)
二、资料的特征数的计算(定量描述)
变量的分布具有基本特征: ①集中趋势(central tendency):变量值集中位置 。 ②离散趋势(tendency of dispersion): 变量值围 绕集中位置的分布情况。 特征数可以反映变量分布的性质。
• • • •
(一)集中趋势:平均水平指标 (特征数:平均数——算术平均数) (二)离散趋势:变异水平指标 (特征数:变异数——标准差)
全距是资料中最大值与最小值之差,又称为极差 (range),用R 表示,即 R=Max(x)-Min(x) 每组最大值与最小值之差称为组距,记为 i 组距(i)=全距/组数 组限: 每个组变量的起止界限,即各组的最大值与 最小值。其中,最小值称为下限, 最大值称为上限。
组中值: 每一组的中点值,是该组的代表值。
基本原则
生 物 统 计 学
的 基 本 内 容
试验设计
方案制定 常用试验设拉丁方设计 正交设计
资料的搜集和整理
数据特征数的计算
统计分析
统计推断 方差分析 回归和相关分析
第一章 概论
• 总体:具有相同性质或属性的个体所组成的集合 • 个体:组成总体的基本单元 • 样本: 从总体中抽取的部分观察单位
4. 变异系数 Coefficient of Variation
• 全距(极差)是表示资料中各观测值变异 程度大小最简便的统计量。 • 离均差平方和即 ( x )2 ,简称平方和, 记为SS(sum of square, SS); • 离均差平方和的平均数,即方差,也称均 方(mean square ,MS)
• 系统误差:也称片面误差,在实际观测过程中, 由受试对象、研究者、仪器设备、研究方法、非 实验因素影响等固定因素造成的有一定倾向性或 规律性的误差。可以通过严格的实验设计和技术 措施消除。 • 随机误差:试验中受多种无法控制的偶然因素的 影响。也称偶然误差。可通过增加抽样或实验次 数降低随机误差,但不可避免,但有一定的分布 规律,可估计。
2.中位数(median)
中位数是将一批数据从小至大排列后,位次居中 的数据值,符号为Md,反映一批观察值在位次上的 平均水平。
反映数据的离散度( Dispersion ),即个 体观察值的变异程度。常用的指标有: 1. 极差(Range) (全距) 2. 方差 Variance 3. 标准差Standard Deviation
2 2 2 2
2 2
( x x ) 2 ( x x )( x a ) ( x a ) ( x x ) 2( x a ) ( x x ) n( x a) 2 ( x x ) n( x a)
2 2 2
0
2
n( x a) 0 ( x a ) ( x x )
s ( x ) / n
2 2
S ( x x) / n 1
2 2
• 统计学上把样本方差 S2 的算术平方根叫做样本 标准差,记为S,即: ( x x) S n1
• 连续性变异资料:资料间的变异是连续性的 • 不连续性变异资料:观察值只能以整数来表示, 各观察值是不连续的,因此该类资料也称为不连 续性变异资料。 • 质量性状/属性资料:只能观察而不能直接测量的 性状,如花的颜色、动物的性别、人的血型、药 物的疗效、植物的抗性等。
二、资料的整理——定性描述 • 编制次数/频数分布表
i 1 n
i 1
( xi
n
x ) ( x1 x ) ( x 2 x ) .... ( xn x )
x1 x 2 ... xn nx 0
B. 离均差的平方和最小,即
(x - x) (x - a)(a x)
2 2
证明: ( x a ) ( x x ) (a - x )
1. 算术平均数
算术平均数是指资料中各观测值的总和除以观测值 个数所得的商,简称平均数或均数 • 样本平均数记为
x1 x 2 x n x n
x
i 1
n
i
n
平均数的基本性质
A.样本各观测值与平均数之差的和为零,即离均差
之和等于零。 或简写成 ( x x ) 0 ( x x ) 0 i