实验设计与方差分析
1 1 LSD 2.306 1301393 ( ) 1698 6 4
南区vs西区 LSD 2.306 1301393 ( 1 1 ) 1860
4 4
基于统计量
• 第4步:做出决策
的Fisher LSD方法
在5%的显著性水平下,拒绝 x1 x2 2136>1698 北区和南区每场比赛平均观众 人数无显著差异的原假设
响应变量总平方和分解为处理平方和SSTR和误 差平方和SSE。二者分别除以其自由度,得到
第一节
方差分析和完全随机化实验设 计(单因素)
一、检验多个总体均值是否有显著差异 均方处理MSTR和均方误差MSE 。如果原假设 为真,MSTR为响应变量总体方差的无偏估计 量,MSE永远都是其无偏估计量,这两个估计 量是独立的,F统计量服从F分布。 3.根据P值法或临界值法确定决策规则 4.根据样本数据算出P值或检验统计量的实际值 5.做出结论
x1 x3 728<1698
在5%的显著性水平下不能拒 绝北区和西区每场比赛平均观 众人数无显著差异的原假设 在5%的显著性水平下拒绝南 区和西区每场比赛平均观众 人数无显著差异的原假设
x2 x3 2864>1860
使用Fisher LSD方法的两个总体均值之差的 置信区间估计
置信区间估计
二、多重比较检验
多重比较检验用于确定哪些总体(处理)均 值之间存在差异 多重比较检验方法有Fisher的LSD方法、 Bonferroni方法、Turkey方法、Duncan方法 等。这些方法的主要区别在于是控制犯比较 方式的第一类错误概率还是犯实验方式的第 一类错误概率。
Fisher 最小显著性差异(LSD)方法
• Bonferroni修正方法
控制实验方式的第一类错误概率, 因此在每一次两两比较的检验中都使 用一个较小的比较方式的第一类错误 概率。 例如,要检验C个成对的两两比较 ,并希望总的犯实验方式的第一类错 误的概率最大为α EW,那么只要简单的 将犯比较方式的第一类错误的概率等 于α EW/C即可。
第一节
方差分析和完全随机化实验设 计(单因素)
实验设计的原则:随机化 和 复制 为了得到更多的数据,我们需要重复或复 制基本实验过程。在Chemitech公司实验中 ,得到三个样本,n1=5,n2=5,n3=5. 假设: j 代表第j个总体的均值 方差分析要解决的问题就是:在三个样本均 值之间观察到的差异是否足够大到可以拒 绝 H0
实验设计与方差分析
本章主要内容
方差分析和完全随机化实验设计(单因素) 方差分析和随机化区组设计(单因素) 双因素方差分析和析因实验
实验设计
• 实验是研究者实际上在各个领域进行的,通 常是要发现关于一个特定过程或系统的某些 事情。从字义上说,一个实验就是一个试验 。一个设计的实验是一个试验或一系列试验 ,它对一个过程或系统的输入变量(称为因 素,factor)作一些有目的的改变,以使能 够观察到和识别出引起输出响应(称为因变 量或响应变量)变化的缘由。 • 实验设计就是设计实验的过程,使得收集得 到的数据适合于用统计方法分析,得出有效 和客观的结论。
第一节
方差分析和完全随机化实验设 计(单因素)
Chemitech公司所遇到的问题 哪种装配方法能使每周生产的过滤系统的数 量最多。 三种装配方法确定了Chemitech公司实验的 三个总体,分别是使用方法A、B、C的全体 工人。 假设不只抽取3名工人,而是15名工人,然后 对每一个处理随机地指派5名工人,也就是 说我们得到了5个复制。复制的过程是实验 设计的另一个重要原则。
式中
且tα/2是基于自由度为nT-k的t分布。
第一类错误概率
检验一 检验二 检验三
比较方式的第一类错误概率 :与单个两两 比较相联系的犯第一类错误的概率(α) 。 实验方式的第一类错误概率 :多个两两比 较中至少有 1个犯第一类错误的概率,记为 α EW。
在以上棒球赛的例子中,α =0.05,则对于 每个检验,犯第一类错误的概率为α =0.05, 不犯第一类错误的概率就是1-0.05=0.95。 三次成对的两两比较都不犯第一类错误的概 率为0.95×0.95×0.95,至少有一次犯第一类 错误的概率是:1-0.95×0.95×0.95=0.1426。 所以该例比较方式的第一类错误概率是0.05, 实验方式的第一类错误概率为0.1426。 若总体个数较多,实验方式的第一类错误概 率则更大。
检验统计量 拒绝法则
P-值法 如果P≤ ,则拒绝H0
临界值法
式中,tα/2是基于自由度为nT-k的t分布。
基于统计量
的Fisher LSD方法
检验统计量
显著性水平α下的拒绝法则
式中
例题(P286, Q20)
• 美国职业棒球小联盟有14支3-A级球队, 这些球队分为北区、南区和西区。14支球 队在参加国际联盟比赛时,每场比赛的平 均观众人数如表中所示。求在α=0.05的显著 水平下,检验三个地区每场比赛的平均观 众人数是否存在显著差异。如存在明显差 异,确定差异发生在哪些地区之间。
例:空中交通管制员工作压力测试
• 在完全随机化实验中,管理员的随机样本 被指派给每种工作站方案。但是,管理员 认为,在应对有压力的局面时,他们的能 力是大不相同的(区组)。 • 一名空管人员认为是高压力,而对于另外 一名空管人员来说可能是中等压力,甚至 是低压力。 • 因此,当考虑变异的组内来源(MSE)时, 我们必须意识到:பைடு நூலகம்变异既包括随机误差 也包括管理人员个人差异。
析因实验
可重复多因 素方差分析
无重复双因 素方差分析
单因素 方差分析
第一节
方差分析和完全随机化实验设 计(单因素)
一、检验多个总体(处理)均值是否有显著差异 完全随机化实验设计指将每一个处理随机地指 派给一个实验单元的实验设计。 检验过程:
1.建立原假设:多个总体(处理)均值相等
2.构建检验统计量 F=MSTR/MSE
基于统计量
的Fisher LSD方法
第1步:提出假设 检验1: H 0:1 2 ,H1:1 2 检验2: H 0:1 3 ,H 1:1 3 检验3: H 0: 2 3 ,H1: 2 3 第2步:计算检验统计量 检验1: x 1 x 2 7702 5566 2136 检验2: 检验3:
• 在实验性研究中,感兴趣的变量是明确规 定的。因此,研究中的一个或多个因素可 以被控制,使得数据可以按照因素如何影 响变量来获得。
• 在观察性或非实验性研究中,则不去控制 这些因素。(抽样调查)
完全随机化设计
• 例:Chemitech公司开发了一种新的城市供水过 滤系统,其元件需从几家供应商处购买,然后 Chemitech公司在位于南加州哥伦比亚的工厂装
可构建检验统计量
该检验统计量服从分子自由度为k-1, 分母自由度为nT-k的F分布
第一节
方差分析和完全随机化实验设 计(单因素)
将统计量的值 F与给定的显著性水平 的临界 值F进行比较,作出对原假设H0的决策 临界值法 若F>F ,则拒绝原假设H0 。 若F<F ,则不拒绝原假设H0 。 Fα是分子自由度为k-1,分母自由度为nT-k 时,使F分布的上侧面积为α的F值
• 随机化的概念是所有实验设计的一个重要 原理。
方差分析
• 方差分析是一种通过对响应变量方差进行 分解构建检验统计量,检验多个总体均值 是否有差异的统计方法。 • 方差分析的三个假定: • 对每个总体,响应变量服从正态分布 • 响应变量的方差对所有总体都是相同的 • 观测值独立
实验设计
随机化 区组设计 完全 随机化设计
配这些元件。由工程部负责确定新过滤系统的最
佳装配方法。考虑过各种可能之后,工程部将范
围缩小至三种方法:方法A、方法B及方法C。这
些方法在产品装配步骤上有所不同。 – Chemitech公司的管理者希望确定哪种装配方 法每周生产的过滤系统数最大。
完全随机化设计
• 指每一个处理被随机地指派给一个实验单 元的实验设计。 • 假定从 Chemitech公司的生产车间的全体装 配工人中随机抽取了由三名员工组成的样 本,这三名随机抽取的工人被称为实验单 元。每种方法(即处理)被随机地指派给 一名工人,这种实验设计就是完全随机化 设计。
x 1 x 3 7702 8430 728
x2 x3 5566 8430 2864
基于统计量
的Fisher LSD方法
第三步:计算LSD, α =0.05 北区vs南区 北区vs西区
1 1 LSD 2.306 1301393 ( ) 1698 6 4
第一节
方差分析和完全随机化实验设 计(单因素)
相关专业术语
在Chemitech公司实验设计中: 装配方法 独立变量或因素 对应这个因素有三种装配方法,我们说这 一实验有三个处理。每个处理对应一种装 配方法。 每周装配的过滤系统的数量 响应变量 实验设计主要的统计目的:检验三个总体 (三种方法)每周所生产的过滤系统的平 均数量是否相同。
第二节
方差分析和随机化区组设计 (单因素)
• 为什么要进行随机化区组设计 • 为检验处理均值之间的差异,计算F值时使用了 比值 • 当外在因素(实验中没有考虑到的因素)引起的 差异导致该比值中MSE增大时,F值会变小。这 样,在实际中处理均值之间存在差异时, F值却 给出处理均值之间没有差异的信号。 • 随机化区组设计通过消除MSE项中来自外部的变 异(除去随机误差外的其他外部变异),以达到 控制变异外部来源的目的。
第一节
方差分析和完全随机化实验设 计(单因素)
拒绝H0
不拒绝H0
0
F
F(k-1,nT-k)
第一节
方差分析和完全随机化实验设 计(单因素)