第四章 方差分析
X 2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
g 1 1 1 1 1 1 1 1
表 6.2 资料数据格式 X g X 3.83 2 5.41 3.15 2 3.47 4.70 2 4.92 3.97 2 4.07 2.03 2 2.18 2.87 2 3.13 3.65 2 3.77 5.09 2 4.26
• • • • • • • • • • • • • • • • • • • • • • • •
Data new; Do c=1 to 5; Input n; Do i=1 to n; Input x @@; Output; End; End; Cards; 6 21.5 19.5 20.0 22.0 18.0 20.0 6 16.0 18.5 17.0 15.5 20.0 16.0 5 19.0 17.5 20.0 18.0 17.0 4 21.0 18.5 19.0 20.0 4 15.5 18.0 17.0 16.0 ; Proc anova; Class c; Model x=c; Run;
过程步--glm过程
proc glm; /*方差分析*/ class g; model x=g; means g/ hovtest snk ; run;
结果解释:
1、三组数据正态性检验作出判断
2、方差齐性检验:F=1.45,P=0.2567 >0.05,方差齐;
3、方差分析:F=4.28,P=0.0275,拒绝H0,差别有统计学 意义,三组小鼠FDP酶活力不全相等。
12.0 8.5 8.5 9.8 10.9 9.2 10.4 8.2 10.0
PROC ANOVA; CLASS a b; MODEL x=a b; RUN;
二.有重复的两因素方差分析
• 【例6.6】为了研究饲料中钙磷含量对幼猪生长发育的影 响,将钙(A)、磷(B)在饲料中的含量各分4个水平进行交 叉分组试验。先用品种、性别、日龄相同,初始体重基本 一致的幼猪48头,随机分成16组,每组3头,用能量、蛋 白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪, 经两月试验,幼猪增重结果(kg)列于表6-29,试分析钙磷 对幼猪生长发育的影响。
棉布
府绸
的确凉
尼龙
2.33 2.00 2.93 2.73 2.33
2.48 2.34 2.68 2.34 2.22
3.06 3.06 3.00 2.66 3.06
4.00 5.13 4.61 2.80 3.60
程序如下:
DATA an; DO i=1 TO 4; DO a=1 TO 5; INPUT x @@; OUTPUT; END; END; CARDS; 2.33 2.00 2.93 2.73 2.33 2.48 2.34 2.68 2.34 2.22 3.06 3.06 3.00 2.66 3.06 4.00 5.13 4.61 2.80 3.60 ; PROC ANOVA; CLASS i; MODEL x=i; RUN;
一、方差分析的基本思想
根据资料的设计类型和研究目的,把全部观察值 的变异(总变异)分解为两个或多个部分,每 部分可以用某因素的作用来解释,将某因素解 释的变异和误差变异进行比较,作出某因素是 否有统计学意义的结论。
完全随机设计的方差分析表
变异来源
组间(处理组间) 组内(误差)
SS SS组间 SS组内
4 、两两比较:可以认为对照与水层RNA组间,对照组 与酚层RNA组间均有差别,而还不能认为水层RNA组与 酚层RNA组间有差别。
单因素方差分析 一.样本含量相等
某劳动卫生教研组研究棉布、府绸、的确凉、 尼龙四种衣料内棉花吸附十硼氢量。每种衣料各做 五次测量,所得数据如表。试检验各种衣料间棉花 吸附十硼氢量有没有显著差别?
Data new; Do c=1 to 5; Do i=1 to 6; Input x @@; Output; End; End; Cards; 21.5 19.5 20.0 16.0 18.5 17.0 19.0 17.5 20.0 21.0 18.5 19.0 15.5 18.0 17.0 ; Proc anova; Class c; Model x=c; Run;
过程步1---正态性检验
proc univariate normal; class g; var x;
run;
过程步2--方差分析
proc anova; class g; model x=g;
run;
过程步3 --方差分析同时输出统计表
proc anova;
class g;
model x=g;
DATA an; DO b=1 TO 8; DO a=1 TO 4; INPUT x @@; OUTPUT; END; END; CARDS;
8.4 12.8 9.6 9.4 15.2 9.1 9.8 12.9 11.2 12.2 14.4 9.8
9.8
8.8 8.4 8.6 8.9 7.9
9.9 8.2 9.9 9.0 8.1
受试者编 号 (区组) 1
2 3 4
处理组
1 2 3 4
8.4 12.8 9.6 9.8
9.4 15.2 9.1 8.8
9.8 12.9 11.2 9.9
12.2 14.4 9.8 12.0
5
6
8.4
8.6
8.2
9.9
8.5
9.8
8.5
10.9
7
8
8.9
8.4
9.0
9.4
9.2
9.8
10.4
10.0
二.样本含量不相等
• 5个不同品种猪的育肥试验,后期30天增重(kg)如表 6-16所示。试比较品种间增重有无差异。 • 表6-16 5个品种猪30天增重 • 品种 增 重 • B1 21.5 19.5 20.0 22.0 18.0 20.0 • B2 16.0 18.5 17.0 15.5 20.0 16.0 • B3 19.0 17.5 20.0 18.0 17.0 • B4 21.0 18.5 19.0 20.0 • B5 15.5 18.0 17.0 16.0
常用MODEL语句效应模型如下:
1)主效应模型
MODEL y=a ;(单因素方差分析模型) MODEL y=a b;(二因素方差分析模型) MODEL y=a b c;(三因素方差分析模型) 模型中,a ,b ,c 是主效应,y 是因变量 。
2)交互效应模型
MDOEL y=a b a*b MDOEL y=a b c a*b a*c b*c a*b*c; 模型中, a ,b ,c 是主效应, a*b,a*c ,b*c,a*b*c 是交互效应,y 是因变量。
MS区组/ MS误
差
总
二、 应用条件
独立性: 各样本是相互独立的随机样本 ; 正态性: 各样本来自正态总体; 方差齐性: 各总体方差相等。
不满足条件的处理
(1)轻微
– 允许应用t检验、方差分析来作分析。
(2)严重
– 数据转换
– 非参数统计
五、方差分析所用的过程
ANOVA过程(Analysis Of Variance)
means g;/*关于均数和标准差的统计表
*/
run;
过程步4--方差分析同时进行方差齐性检验和两两比较
proc anova; class g; model x=g; means g/ snk; run; /*homogeneity of variance*/
过程步(完整)
proc univariate normal; /*正态性检验*/ class g; var x; run; proc anova; /*方差分析*/ class g; model x=g; means g/ hovtest snk ;(HOVTEST选项实现方差齐性检验) run;
表 6.1 对照组 2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
三组小鼠的 FDP 酶活力 水层 RNA 组 酚层 RNA 组 3.83 5.41 3.15 3.47 4.70 4.92 3.97 4.07 2.03 2.18 2.87 3.13 3.65 3.77 5.09 4.26
高级生物统计
第四章 方差分析
目的与要求: (一)掌握内容 1. anova和glm过程的格式 2.能对SAS程序的输出结果作出合理解释 (二)熟悉内容 snk、Dunnett、Bonfferoni等多重比较方法 在SAS中的实现
过程简介
方差分析在SAS系统中由SAS/STAT模 块来完成,其中我们常用的有ANOVA过程 和GLM过程。前者运算速度较快,但功能较 为有限;后者运算速度较慢,但功能强大。 本章将首先介绍方差分析所用数据集的建立 技巧,然后重点介绍这两个程序步。
(3) MEANS语句是选择语句,计算并输 出所列的效应对应的因变量均数,若指明了 选择项,则将进行主效应均数间的检验。常 用的选择项如下:
• DUNCAN: 对MEANS语句列出的所有主效应均值进行DUNCAN检验。 • SNK: 对MEANS语句列出的所有主效应均值进行Student-Newman-Keuls检验。 • T | LSD: 对MEANS语句列出的所有主效应均值进行两两t检验,它相当于在样本含 量相同时的LSD检验。 • ALPHA= 均值间对比检验的显著水平,缺省值是0.05。当用DUNCAN选项时只能 取0.01、0.05和0.10,对于其它选项,α可取0.0001到0.9999之间的任何值。 • CLDIFF: 在选项T和LSD时,过程将两个均值之差以置信区间的形式输出。 • CLM: 在选项T和LSD时,过程把变量的每一水平均值以置信区间的形式输出。
22.0 15.5 18.0 20.0 .