4方差分析PPT课件
不同离子对木聚糖酶活性的影响(mg/ml)
Na+
K+
0.00
0.00
0.25
0.40
0.50
0.75
0.80
1.00
1.00
1.25
1.20
Mn2+
0.00 0.06 0.12 0.18 0.24 0.30
Cu2+
0.00 0.40 0.80 1.20 1.60 2.00
在固定模型中,除去随机误差之后的每个处理 水平所产生的效应是固定的,试验重复时会得 到相同的结果
重复(repetition): 在实验中,将一个处理实施在两
个或两个以上的试验单位上,称为处理有重复;同一 处理实施的试验单位数称为处理的重复数。例如,用 某种饲料喂4头猪,就说这个处理(饲料)有4个重复。
第一节 方差分析的基本原理
方差分析的基本思想、目的和用途 数学模型 平方和与df的分解 统计假设的显著性检验 多重比较
重复
1 2 … i …k
1 2 … j … n
总和 平均
x11 x21 x12 x22 ……
x1j x2j ……
x1n x2n
T1 T2
x1
x2
… xi1 … …xi2 ……
… xij
…… … xin
… Ti xi
… xk1 … xk2 …… … xkj …… … xkn
… Tk xk
T=∑xij x
在一个多处理试验中,可以得出一系列不同的观测值。
观
处理效应(treatment effect):
测
值
处理不同引起
不
同
的
试验误差:试验过程中偶然性
原
因素的干扰和测量误差所致。
因
1.1方差分析的基本思想
总变异
处理效应
试验误差
1.2 方差分析的目的
确定各种变异在总变异中所占的重要程度。
处理效应 试验误差
美国的黑核桃品种对不同地理条件的适应情况
河南
北京
广州
江苏 新疆
气候、水肥、土壤
无法人为控制 如果实验条件不能人为控制,那么这个样本对所属 总体作出推断就属于随机模型。
在随机模型中,水平确定之后其处理所产生的 效应并不是固定的,试验重复时也很难得到相 同的结果
第四章
方差分析的定义
方差分析(Analysis of variance,ANOVA) 又叫变量分析,是英国著名统计学家R . A . Fisher 于20世纪提出的。它是用以检验两个或多个均数间 差异显著性并能分析变异原因的一种统计方法。它 是一类特定情况下的统计假设检验,或者说是平均 数差异显著性检验的一种引伸。
试验处理( treatment): 事先设计好的实施在实
验单位上的具体项目就叫试验处理。如进行饲料的 比较试验时,实施在试验单位上的具体项目就是具 体饲喂哪一种饲料。
试验单位( experimental unit ): 在实验中能接受不
同试验处理的独立的试验载体叫试验单位。一只小白 鼠,一条鱼,一定面积的小麦等都可以作为实验单位。
相差不大,说明试验处理对指标影响不大。
相差较大,即处理效应比试验误差大得多, 说明试验处理影响是很大的,不可忽视。
1.3方差分析的用途
用于多个样本平均数的比较 分析多个因素间的交互作用 回归方程的假设检验 方差的同质性检验
1.4 数学模型
假定有k组观测数据,每组有n个观测值,则共有nk个观测值
处理
用线性模型(linear model)来描述每一观测值:
xij =μ + ai +εij
(i=1,2,3…,k j=1,2,3…,n)
μ -总体平均数
ai -处理效应
xij -第 i 次处理的第 j 次观测值
εij -试验误差
εij 是相互独立的,且服从正态分布 N(0,σ2 )
根据ai的不同假定,可将数学模型分为以下三种:
试验因素( experimental factor): 试验中所研究的
影响试验指标的因素叫试验因素。当试验中考察的因 素只有一个时,称为单因素试验;若同时研究两个或 两个以上因素对试验指标的影响时,则称为两因素或 多因素试验。
因素水平( level of factor): 试验因素所处的某种
特定状态或数量等级称为因素水平,简称水平。如 研究3个品种奶牛产奶量的高低,这3个品种就是奶 牛品种这个试验因素的3个水平。
固定模型
随机模型
混合模型
固定模型(fixed model)
指每个处理水平的处理效应值ai 是固定值,
ai = μi - μ是一个常量。就是说除去随机误差以
后各水平所产生的效应是固定的。
若因素的水平是主观选定的,则该因素称为 固定因素。例如,几个不同的实验温度,几个不 同的化学药物或一种药物的几种不同浓度,几个 作物品种等。处理这样的因素所用的模型称为固 定效应模型(fixed effect model)。
2.无统一的试验误差,误差估计的精确性和检验的 灵敏性低。 t检验:C42 =6次
需计算 6个标准误
误差估计不统一
误差估计精确性降低
3.推断的可靠性低,检验时犯α错误概率大。
例如我们用t检验的方法检验4个样本平均数之间的差异显著性
t检验: C42 =6次
6次检验 相互独立
H0的概率: 1-α=0.95
6次都接受的概率(0.95)6=0.735 犯α错误的概率=1-0.735=0.265
犯α错误的概率明显增加
几个概念
试验指标(experimental index): 为衡量试验结果的
好坏和处理效应的高低,在实验中具体测定的性状或 观测的项目称为试验指标。常用的试验指标有:身高、 体重、日增重、酶活性、DNA含量等等。
方差分析所得到的结论只适合于选定的那几个 水平,并不能将其结论扩展到未加考虑的其它 水平上。
随机模型(random model)
指各处理的效应值ai 不是固定的数值,而是
由随机因素所引起的效应。
若因素的a 个水平,是从该因素全部水平的总体 中随机抽出的,则该因素称为随机因素。从随机因 素的a 个水平所得到的结论,可以推广到这个因素的 所有水平上。处理随机因素所用的模型称为随机效 应模型(random effect model)。
t 检验可以判断两组数据平均数间的差异显著
性,而方差分析既可以判断两组又可以判断多组数 据平均数之间的差异显著性。
是否可以把多组数据化成n个两组数据,用n次t检验来 完成这个多组数据差异显著性的判断?
多组平均数差异显著性检验采用t检验的缺点:
1.检验过程烦琐。 试验包含4个处理
t 检验: C42 = 6次