当前位置:文档之家› 生物统计学总结

生物统计学总结

正态分布
1) 概念:一种连续型随机变量的概率分布 密度函数: 分布函数:
2) 特征: 1. 在横轴上均数处最高 2. 以均数为中心,左右对称 3. 有两个参数 4. 曲线下的面积分布有一定的规律 F(x)
3) 应用: 1. 以曲线下的面积反映频率及概率分布 2. 估计正常值范围或正常值范围的正态分布法 3. 质量控制 4. 正态分布是很多种统计方法的理论基础
1)直接法
2)频数表法:
(3)注意事项 1)适用场合:偏态,开口(一端或两端无界限) ,分布不清的 2)特性:只代表了居中观察值的特性,敏感性低,不受特小特大值的影响 3)对于正态分布资料,理论上,中位数 =均数(数值上)
百分位数
(1)定义:将 n 个观察值由小到大排列,编上秩次,将 n 个秩次 100 等分,与 X%秩次相对应的数 值,即 X 的百分位数,是一个位置指标,以 Px 表示( x 代表百分秩次) Px将整个数列分为两半, X%比 Px 小, 1-X%比 Px大
抽样误差:因个体变异的存在,由抽样而导致的样本指标与总体指标之差
统计量:有样本所得指标或数 参数:由总体所得指标,关于特征的表征
频数:完全相同的观察只出现的次数 频率:某一观察值出现的次数与样本含量的比值 概率:描述某事物发生可能性大小的一个度量
样本空间:一次实验所有可能的结果的集合 基本事物:样本空间每一个可能的结果
标准正态分布, u 分布
双侧正常值范围
Uα 与面积的关系
对数正态分布 原观察值 x 呈偏态(正偏) ,取对数后, lgX 呈正态分布 x 服从对数正态分布
均数的抽样误差
1. 定义:平均数与总体均数之差 2. 均数抽样误差大小的度量
标准误 1) 定义:样本均数的标准差 2) 意义:反映抽样误差的大小
步骤
1. 建立假设,确定检验水准 先确定是单侧还是双侧的
若考虑 u, u0 有误差别 若不仅考虑差别,还关注 一般认为双侧
双侧 u, u0 大小
单侧
无效假设 H0:从反证法的基础上提出的,无论何时,假设差别是由抽样误差造成的,但具 体问题具体分析
备择假设 H1:与 H0 相对立的假设,是依 H0 而产生的,一旦 H0 不成立,只能接受 H1,现在
(四)多个样本均数的比较(单因素方差分析) 条件:
1. 个样本是相互独立的随机样本 2. 小样本要求正态方差齐
* 多个样本均数间的两两比较
二、配对设计
(一)配对设计的计量资料的比较
q 检验
小样本, t 检验 t =
???
????√/ ??
三、配伍组设计
(一)多个样本均数的比较(两因素方差分析) 多个性质相同的配伍,同一配伍组中的 N 个受试对象分别接受
三、何时用?
1. 为了说明资料是否服从正态分布
一定要做
2. 为了满足特定统计方法的需要
可以不做
四、怎么做?
正态分布分布的特征: 1. 对称性 偏度(正偏、对称、负偏) 三阶 偏度系数 g1
态峰 翘度(正态峰、尖峭峰、平阔峰) 四阶 峰度系数 g2
方差齐性检验
一、为什么?
二、定义
1. t 检验 F 检验 使用条件的要求 2. 方差的抽样波动
方差分析
方差分析又叫变量分析,俗称 F 检验 用途:
1. 两个或多个均数的比较 2. 分离各有关因素,并分别估计其对变异的作用 3. 分析两个或多个因素的交互作用 4. 方差齐性检验
适用条件(用于多个均数比较时) 1. 个样本是相互独立的随机样本 2. 小样本要求正态方差齐
基本思想:把全部观察值之间的变异,总变异,按设计需要,分为两个或多个组成部分再作分析 计算
的应用条件 依据:只改变观察值的分布形式,而不是其相对大小 常用方法:
1)
对数变换: 以观察值 x 的对数值作为新的分析数据
2) 选取
1. 极差中的一部分
2. 单侧或双侧正常值之分,由指标实际情况及实验要求确定
3. 方式之一为正常值范围的百分位数,习惯上 双侧:确定或
95%
单侧: P5 或 P95,看实验需要
计量资料的统计推断
统计推断
用样本信息推断总体特征 参数估计:由样本结果对总体参数在一定概率水平下所做出的估计 假设检验
t 检验(要求 ???取自正态总体)
2. 大样本,总体标准差σ未知:
1) t 检验(严格) 法 2 无需来自正态总体
2) u 检验(ν ∞, t u) 法 1
3. 大样本,总体标准差σ已知
u 检验
(二)两个样本均数比较的假设检验
1. 小样本(有一个就算) ,总体标准差σ未知,正态方差齐
t 检验
A. 先求合并方差 B. 再求两样本均数差的标准误
4.变异系数 CV
1) 定义:标准差与均数之比,用百分数表示 2) 计算: 3) 应用:单位不同的几组资料变异度及均数相差悬殊的几组资料的变异度的比较,不单独使用 自由度ν 泛指可以自由取值的变量的个数
正常值:正常动植物解剖生理生化等各种数据的波动范围
1) 必要性
1. 区分正常和异常
2. 看不同种群在不同时间地域上某一指标的差异
C. 计算 t 值
2. 小样本(有一个就算) ,总体标准差σ未知,方差不齐(非正态) 1) 采用适当的变量变换使达到方差齐性的要求
2) 采用不要求方差齐的方法比较
非参数统计
3) 采用近似的 t ‘检验
3. 大样本 u 检验(不考虑正态方差齐的情况下,仍可用
t 检验)
(三)两个样本几何均数比较的假设检验 对 x 取反对数,用 t 检验或者 u 检验
作用:
1.可改善处理组间的均衡性 2.可分析配伍因素的的影响
3.提高设计效率,分析两个因素
* 多个样本均数间的两两比较
q 检验
k 种处理
正态性检验
一、为什么做正态性检验
特定统计方法要求的
描述统计 统计推断
平均数、标准差 正常值范围的正态统计法 t 检验 F 检验
二、定义
判定资料是否服从正态分布或样本是否来自正态总体的一类检验方法
H0 不成立 非 H0 体现单双侧之分 检验水准α:界定小概率事件的一个标准(有单双侧之分)
通常α =
2. 选定检验方法,计算统计量 3. 确定 P 值,做出统计推断
P 值:指由 H0所规定的总体中做随机抽样,获得等于大于或小于现有统计量的概率。若
P<=α,拒绝 H0;若 P>α,接受 H0
第一类错误和第二类错误
第一类:拒绝实际上成立的 H0
第二类:不拒绝实际上不成立的 H0
客观实际
拒绝 H0
不拒绝 H0
H0 成立
第一类错误(α)
推断正确( 1-α)
H0 不成立
推断正确( 1-β)
第二类错误(β)
可信度 1-α
把握度 β:未知,只能估计,不能单独存在,只有与
H1 结合才有意义
检验效能 1-β:计量总体却有差别,按α水准,能够发现他们有差别的能力
生物统计学 总结
绪论
统计工作的四大步骤:设计、搜集、整理、分析 统计资料的三大类型:
计量资料:对每个观察值单位用 定量方法 测得每项指标量的大小所得的资料 计数资料:将观察单位按照某种属性类别分组,所得的观察单位数 等级资料:将观察单位按某种属性的不同程度分组所得的资料
同质与变异 同质:除研究因素外,其他因素相同或相近为同质 变异:观测值的不齐性
(2)计算:
(3)应用注意
1)百分位数常用于描述一组资料(样本或总体)在某百分位数上的水平和分布特征,多个百分位 数结合使用,可全面描述观察值分布特征,包括位置的大小和变异度
2)一般分布中部的百分位数相当稳定,代表性好, 靠近两端的百分位数,只在样本含量足够大( 所以当样本含量不够大时,不宜取两端百分位数
3. 标准差:
1) 定义:描述一组同质计量资料离散程度大小的指标 反映了均数对一组观察值的代表性 说明了观察值围绕均数分布的离散程度,个体变异
2) 计算:
3) 应用: 1. 表示变量分布的离散程度 2. 结合均数描述正态分布特征 3. 结合均数计算变异系数 4. 结合样本含量计算标准误
4) 注意: ( 1) 不同单位,相同标准差,不能比较 ( 2) 大个体差异大,变异度大,小个体则变异度小
注意
1. 样本的代表性 组间的均衡性 资料的可比性 2. 选用的假设检验方法一定要符合其适用条件 3. 正确理解差别有无显着性的含义(显着、极显着 4. 结论不能绝对化 5. 报告要规范化
不意味着差别的大小)
检验方法
一、完全随机设计
(一)样本均数与已知总体均数比较的假设检验
1. 小样本,总体标准差σ未知
是样本均数围绕总体均数分布的离散程度,衡量了样本均数的可靠程度 3) 计算:
一般一次抽样估计 总体没有标准误,只针对样本 4) 用途: ( 1) 计算可信区间(参数估计) ( 2) 用于统计推断(假设检验)
t 分布
1. t 变换与 t 变量
2. t 分布的特征 1) 单峰,一 0 为中心,左右对称
2) 曲线中间比正态分布低,两端翘得比正态分布高
3) 有无数根,中间越低,两端越翘
t 分布与自由度有关,自由度越小,中间越低,两端越翘 当自由度趋向无穷时, t 分布趋向标准正态分布, t u
3. 概率密度函数与分布函数
4. t 介值与 t 介值表
tα ,ν:给定自由度为ν,两侧双尾面积之和为α时,相应
t 值。
5. t 分布原理: P(-tα,ν<= t <= tα,ν)=1- α
小概率事件: P<=或 P<=的事件 小概率原理:小概率事件在一次抽样中不可能发生
计量资料的统计描述
相关主题