方差分析方法
10.2.1 单因素方差分析的问题
因而有: 因而有: (1) 粮食产量是随机变量,是数值型的变量; 粮食产量是随机变量,是数值型的变量; (2) 把同一化肥 的同一水平 得到的粮食产量看作 把同一化肥(A的同一水平 的同一水平)得到的粮食产量看作 同一总体抽得的样本, 同一总体抽得的样本,施用不同化肥得到的粮食产量 视为不同总体下抽得的样本, 视为不同总体下抽得的样本 ,表中数据应看成从三个 总体X 中分别抽了容量为6的样本的观测值 的样本的观测值. 总体 1,X2,X3中分别抽了容量为 的样本的观测值 推断甲乙丙三种化肥的肥效是否存在差异的问题, 推断甲乙丙三种化肥的肥效是否存在差异的问题, 就是要辨别粮食产量之间的差异主要是由随机误差造 成的,还是由不同化肥造成的, 成的,还是由不同化肥造成的,这一问题可归结为三 个总体是否有相同分布的讨论. 个总体是否有相同分布的讨论.
10.2.1 单因素方差分析的问题
由于在实际中有充分的理由认为粮食产量服从正 态分布, 且在安排试验时, 除所关心的因素(这里是化肥 这里是化肥) 态分布 且在安排试验时 除所关心的因素 这里是化肥 外, 其它试验条件总是尽可能做到一致. 其它试验条件总是尽可能做到一致 这使我们可以认为每个总体的方差相同 即 Xi~N(µi,σ2) i = 1, 2, 3 因此,推断三个总体是否具有相同分布的问题就简 因此, 化为: 化为:检验几个具有相同方差的正态总体均值是否相 等的问题, 等的问题,即只需检验 H0: µ 1 = µ 2 = µ 3
10. 10.2.2 单因素方差分析的数学模型
进行单因素方差分析时, 需要得到如表10.2所示的 进行单因素方差分析时 , 需要得到如表 所示的 数据结构. 数据结构.
表10.2 单因素方差分析中数据结构
观测值 (j) ) 1 2 … ni 平均值 A因素(i) 因素( ) 因素 A1 x11 x12 … A2 x21 x22 … … … … … … Am xm1 xm2 …
产量 甲化肥 乙化肥 丙化肥 50 49 51 46 50 50 49 47 49 52 47 46 48 46 50 48 49 50
试根据试验数据推断甲乙丙三种化肥的肥效是否存 在差异. 在差异.
10.2.1 单因素方差分析的问题
本例中,只考虑化肥这一个因素(记为 记为A)对粮食产量 本例中,只考虑化肥这一个因素 记为 对粮食产量 的影响, 的影响, 三种不同的化肥称为该因素的三个不同水平 分别记为A (分别记为 1,A2,A3). 从表中数据看出,即使是施同一种化肥, 从表中数据看出, 即使是施同一种化肥,由于随机因 温度,湿度等)的影响,产量也不同. 素(温度,湿度等)的影响,产量也不同.
10.2.1 单因素方差分析的问题
因此, 因此 , 推断三个总体是否具有相同分布的问题就 简化为: 简化为: 检验几个具有相同方差的正态总体均值是否 相等的问题,即只需检验 相等的问题, H0: µ 1 = µ 2 = µ 3 象这类检验若干同方差的正态总体均值是否相等的 一种统计分析方法称为方差分析 方差分析. 一种统计分析方法称为方差分析. 当只有两个正态总体时, 当只有两个正态总体时, 这类问题也可以用第八章 讲过的两正态总体均值比较的方法来解决. 讲过的两正态总体均值比较的方法来解决.
SSE = ∑ ∑ ( x ij − x i . ) 2
i =1 j =1 m ni
反映了组内数据和组内平均的随机误差,称为组内离 反映了组内数据和组内平均的随机误差,称为 组内离 差平方和,或称为误差平方和 误差平方和. 差平方和,或称为误差平方和.
10.2.3 方差分析的方法
可以证明 SST = SSMA + SSE 构造检验统计量
来源 Source 组间 组内 全部 平方和 Sun of Square SSMA SSE SSMA+SSE 自由度 DF m–1 n–m n–1 平均平方和 Mean Square SSMA / (m – 1) SSE / (n – m) F统计量 统计量 F value MSA / MSE P值 值 Pr > F P
x1.
Байду номын сангаас
表中用A表示因素, 的 个取值称为 个取值称为m个水平分别用 表中用 表示因素,A的m个取值称为 个水平分别用 表示因素 A1,A2,…,Am表示,每个水平对应一个总体. , 表示,每个水平对应一个总体. 从不同水平(总体)中抽出的样本容量可以相同, 从不同水平 (总体) 中抽出的样本容量可以相同, 也可以不同.若不同水平抽出的样本容量相同则称为 也可以不同. 均衡数据,否则称非均衡数据 非均衡数据. 均衡数据,否则称非均衡数据.
10.2 单因素方差分析
10. 10.2.3 方差分析的方法
为了方便起见, 记为: 为了方便起见,可将µi记为:µi = µ + νi 1 m 称为总均值, 其中 µ = ∑ µ i 称为总均值 νi = µi – µ (i = 1, 2, …, m) m i =1 称为因素A的第 个水平的附加效应. 的第i个水平的附加效应 称为因素 的第 个水平的附加效应 对不同水平下均值是否相同的检验 H0:µ1 = µ2 = … = µm, H1:µ1,µ2,…,µm不全相等; , 不全相等; 就可以表示为: 就可以表示为: H0:ν1 = ν2 = … = νm = 0, , H1:ν1,ν2,…,νm不全为零. , 不全为零.
其中,MSA = SSMA/(m – 1),MSE = SSE/(n – m).利用方 其中, , . 差分析表中的信息, 差分析表中的信息,就可以对因素各水平间的差异是否显 著做出判断. 著做出判断.
10.2.3 方差分析的方法
实验10.1】 利用 的数据分析工具对例10.1作方 【 实验 】 利用Excel的数据分析工具对例 的数据分析工具对例 作方 差分析. 差分析. Excel的数据分析工具作方差分析的步骤如下: 的数据分析工具作方差分析的步骤如下: 的数据分析工具作方差分析的步骤如下 (1) 将例 将例10.1中数据输入 中数据输入Excel中,如图 所示. 中数据输入 中 如图10.1所示. 所示
SSM A ( m − 1) ≥ Fα ( m − 1,n − m ) F = SSE ( n − m )
若由观测数据x 若由观测数据 ij(j = 1, 2, …, ni,i = 1, 2, …, m)计算 计算 得到F的观测值为 的观测值为F 落入拒绝域时拒绝原假设H 得到 的观测值为 0, 当F0落入拒绝域时拒绝原假设 0, 可以认为因素A对响应变量有显著影响 对响应变量有显著影响; 可以认为因素 对响应变量有显著影响 ; 否则不能拒 认为因素A对响应变量无显著影响 对响应变量无显著影响. 绝H0,认为因素 对响应变量无显著影响.
10.2.3 方差分析的方法
另外, 统计量的 值为P=P{F ≥ F0},在显著水平α下,若 统计量的P值为 另外,F统计量的 值为 , P=P{F ≥ F0} < α, 则拒绝原假设 0, 可以认为所考虑的因素 则拒绝原假设H 对响应变量有显著影响;否则不能拒绝H0, 认为所考虑的 对响应变量有显著影响; 否则不能拒绝 因素对响应变量无显著影响. 因素对响应变量无显著影响. 通常将上述计算结果表示为方差分析表. 通常将上述计算结果表示为方差分析表.
10.2.3 方差分析的方法
(3) 在打开的“方差分析:单因素方差分析”对话框中, 在打开的“方差分析:单因素方差分析”对话框中, 输入“ 输入区域” 输入 “ 输入区域 ” : B2:D8, “ 分组方式 ” 取默认的 , 分组方式” “ 列”方式,选中“标志位于第一行”复选框,如图 方式, 选中“ 标志位于第一行” 复选框, 10.2所示,单击“确定”按钮. 所示, 所示 单击“确定”按钮. 得到单因素方差分析的结果如图10.3所示. 得到单因素方差分析的结果如图10.3所示. 所示
10.2.2 单因素方差分析的数学模型
表示第i个总体的第 个观测值(j 个总体的第j个观测值 设xij表示第 个总体的第 个观测值 = 1, 2, …,ni, , i = 1,2,…,m), 由于 x ij ~ N(µ i,σ 2) i = 1, 2, …, m , , , , 单因素方差分析模型常可表示为: 单因素方差分析模型常可表示为: xij = µi + εij ,相互独立,1≤i≤m,1≤j≤ni. 相互独立, , 其中µi表示第 个总体的均值,εij为随机误差. 表示第i个总体的均值 个总体的均值, 为随机误差.
10.2.3 方差分析的方法
另外
SSM A = ∑ ∑ ( x i . − x ) 2 = ∑ ni ( x i . − x ) 2
i =1 j =1 i =1
m
ni
m
反映了每组数据均值和总平均值的误差,称为组间离 反映了每组数据均值和总平均值的误差,称为 组间离 差平方和,简称组间平方和 组间平方和, 称因素A平方和 平方和. 差平方和,简称组间平方和,或称因素 平方和.
第10章 方 差 分 析 章
10.2 单因素方差分析
10. 10.2.1 单因素方差分析的问题 单因素方差分析用来检验根据某一个分类变量得到 的多个分类总体的均值是否相等. 的多个分类总体的均值是否相等.下面以一简例说明 方差分析的原理. 方差分析的原理.
10.2.1 单因素方差分析的问题
【 例 10.1】 某化肥生产商要检验三种新产品的效果 , 】 某化肥生产商要检验三种新产品的效果, 在同一地区选取18块大小相同 块大小相同, 在同一地区选取 块大小相同,土质相近的农田中播 种同样的种子,用等量的甲乙丙化肥各施于六块农田, 种同样的种子, 用等量的甲乙丙化肥各施于六块农田, 试验结果每块农田的粮食产量如下所示. 试验结果每块农田的粮食产量如下所示.
(2) 在Excel主菜单中选择“工具”→“数据分析”, 主菜单中选择“ 数据分析” 主菜单中选择 工具” 打开“数据分析”对话框, 分析工具” 打开“数据分析”对话框,在“ 分析工具 ”列表中选 方差分析:单因素方差分析”选项,单击“确定” 择“方差分析:单因素方差分析”选项,单击“确定” 按钮. 按钮.