当前位置:文档之家› EXCEL均数差异显著性检验

EXCEL均数差异显著性检验


1 、提出假设
无效假设 /零假设 /检验假设
H0 误差 效应
1 = 2
对 立
备择假设 /对应假设
1 2 HA
处理 效应
例:比较内江猪与荣昌猪两品种经产母猪产仔数 是否存在显著差异。
提出假设:
(1)无效假设H0: 1 = 2
即假设两品种经产母猪产仔数的总体平均数相等, 试验的处理效应(品种间差异)为0。
与否进行推断就是假设检验,也称显著性检
验。
五、显著性检验的分类
t 检验——主要用于检验两个处理平均数
差异是否显著; 方差分析——主要用于检验多个处理平均 数间差异是否显著;
检验 —— 主要用于由质量性状得来的次
数资料的显著性检验等。
六、显著性检验的步骤
1、提出假设
2、确定显著水平 3、选定检验方法,计算检验统计量, 确定概率值作出推断 4、结论:是否接受假设
注:由于计算过程复杂,这里不再重复书上内容,在下 面将具体讲解如何用Excel来进行统计分析。
Excel进行t检验分类
Excel可提供的t检验工具:

t-检验:双样本等方差假设
此 t-检验先假设两个数据集取自具有相同方差的分布,可确定两个样本 是否来自具有相同总体平均值的分布。

t-检验:双样本异方差假设
下面以两均数差异显著性检验为例具体说 明操作步骤。
例1: 随机抽测9头内江猪和9头荣昌猪经产母猪的产仔 数,得到如下数据资料:
产仔数 内江猪 荣昌猪 14 12 15 14 12 13 11 13 13 12 17 14 14 10 14 10 13 10
试比较内江猪与荣昌猪两品种经产母猪产仔数 是否存在显著差异。
第四步,计算结果
95%置信区间 下限:114.3333-1.025696=113.3 上限:114.3333+1.025696=115.4
总体平均数: 114d
分析:总体平均数落在样本均数置 信概率为95%的置信区间内(113.3 ~115.4),说明样本均数与总体均 数差异不显著。
九、两个样本平均数的差异显著性检验
(2)备择假设HA : 1 ≠2
即假设两品种经产母猪产仔数的总体平均数1 和2 不相等,亦即存在处理效应,其意义是指两品种经产母 猪产仔数存在本质上的差异。
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。
统计学中,一般认为概率小于0.05或0.01的事件 为小概率事件,所以在小概率原理基础上建立的假设 检验也常取=0.05和=0.01两个显著水平 。
二、频率(frequency)
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。
0≤W(A) ≤1
抛掷一枚硬币发生正面朝上的试验记录
实验者
蒲峰 皮尔逊 皮尔逊
投掷次数 (n)
一、概率基本概念 1 6 2 7 3 8 4 9 5 10
A=“一次取一个球,取得红球的概率”
10个球中取一个球,其可能结果有10个基本事件(即每个球 被取到的可能性是相等的),即n=10 事件A:取得红球,则A事件包含3个基本事件,即m=3 P(A)=3/10=0.3
四、小概率事件原理
概念: 如果某事件发生的概率很小,在大量 重复试验中事件发生的频率也很小, 在1次试验中该事件被看做是不会发 生的。 应用:是假设检验时进行统计推断的理论依据。
差异
在试验进行过程中,尽管尽量排除随机误差的影响,以 突出试验的处理效应,但由于生物个体间无法避免的差异, 以及诸多无法控制的随机因素,使得试验结果最后表现的观 察值除了处理效应以外,还包括试验误差的效应。
处理 效应 误差 效应
表 面 效 应
二、显著性检验的目的
对两个样本进行比较时,必须判断样本 间差异主要是随机误差造成的,还是本质不 同或处理效应引起的?
例5.2:母猪的怀孕期为114d,现抽测12头大白猪母猪的怀孕期分别
为115,113,114,112,116,115,114,118,113、115、114、113,试 检验所得样本的平均数与总体平均数114d有无显著差异?
第一步, 输入数据
第二步,工具---数据分析---描述统计
第三步,输入参数
=0.05 =0.01
P<
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值 根据研究设计的类型和统计推断的目的选 择使用不同的检验方法。 例: 这里是对两品种经产母猪产仔数的总体
平均数进行比较,因此为均数差异显著性检 验------t检验。
在无效假设H0成立的前提下计算t值
此 t-检验先假设两个数据集取自具有不同方差的分布,可以确定两个样本是否来 自具有相同总体平均值的分布。当两个样本中有截然不同的对象时,可使用此检验。

t-检验:平均值的成对二样本分析
当样本中存在自然配对的观察值时(例如,对一个样本组在实验前后进 行了两次检验),可以使用此成对检验,以确定取自处理前后的观察值是否 来自具有相同总体平均值的分布。
在一定条件下必然出现某种结果或必然不出现某种结果。
确定性事件
必然事件(U) (certain event)
不可能事件(V) (impossible event)
在一定条件下可能发生也可能不发生。
随机事件(random event) 不确定事件(indefinite event) 为了研究随机现象,需要进行大量重复的调查、实验、 测试等,这些统称为试验。
第一类错误(type I error),又称弃真错误或 错误; 第二类错误( type II error ) ,又称纳伪错误或 错误
1、 两类错误既有联系又有区别
错误只在否定H0时发生
错误只在接受H0时发生
错误增加 错误减小 错误增加 错误减小
2、 还依赖于 - 0 的距离
随着实验次数的增多,正面朝上这个事件发生的频率稳定 接近0.5,我们称0.5作为这个事件的概率。
三、概率(probability,P)
m m P(A) = p=lim n n
在一般情况下,随机事件的概率P是不可 能准确得到的。通常以试验次数n充分大,随 机事件A的频率作为该随机事件概率的近似值。
1
2
3
4
5
6
7
8
9
10
随机抽取一个球,求下列事件的概率; (1)事件A=抽得一个编号< 4 (2)事件B =抽得一个编号是2的倍数
该试验样本空间由10个等可能的基本事件构成,即n=10,而 事件A所包含的基本事件有3个,即抽得编号为1、2、3中的任 何一个,事件A便发生。 P(A)=3/10=0.3 P(B)=5/10=0.5
性说明了随机事件发生的可能性大小,是其本身固 有的客观属性,提示了隐藏在随机现象中的规律性。
定义:设在相同的条件下,进行大量重复试验, 若事件A的频率稳定地在某一确定值p的附近摆动, 则称p为事件A出现的概率。
P(A) = p
统计概率
抛掷一枚硬币发生正面朝上的试验记录 实验者 蒲丰 K 皮尔逊 K 皮尔逊 投掷次数 4040 12000 24000 发生正面朝上的次数 2048 6019 12012 频率(m/n) 0.5069 0.5016 0.5005
结果输出区域,可选 任一空白单元格
Excel进行t检验步骤(四)
计算所得t值 双尾概率P
4、作出推断结论:是否接受假设
小 概 率 原 理
P>
假设H0成立 可能正确
接受H0 否定HA 否定H0 接受HA
P<
假设H0成立 可能错误
例:上例中 P=0.053>0.05
所以接受H0,从而得出结论:内江猪与
3、n , 2 可使两类错误的概率都减小.
八、样本均数与总体均数 差异显著性检验
样本均数与总体均数差异显著性检验t检验
无效假设为Ho:o
备择假设为HA:o
计算公式如下:
根据以上公式可导出以下结论:
由此可知,当总体平均数落在已知的样本均数置 信概率为(1-)的置信区间以外时,就表明在显著 水平时差异显著。
如:随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数: 内江猪:14,15,12,11,13,17,14,14,13 荣昌猪:12,14,13,13,12,14,10,10,20
分析:这里两品种猪的产仔数无任何关联,每种猪的产仔数分别组 成一组数据,相互比较时以组平均数做为比较标准,在Excel里进行t检验 时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进 行分析。
配对试验—成对数据平均数的比较
试验单位两两配对,随机分配到两个处理,配 对的试验单位要求存在相似性,而每个处理内的各 试验单位不一定相似,可以变异较大,但配对内试 验单位要求相似,因此,两样本容量相同,所得数 据为成对数据,两组数据以相配对的试验单位之间 的差异作为相互比较的标准,来检验其差异的显著 性。
通常将5%,1%认为是小概率的标准,又称 显著水平。
第二节 均数差异显著性检验
一、复习回顾
生物统计的本质: 研究如何从样本推断总体 样本抽取的原则: 随机抽样 试验误差的概念: 由样本推断总体时,由各种 无法控制的随机因素引起的误差。
现在,我们假设有这样一个情况: 从一批同质(相同品种、相同日龄、 相同饲料、相同饲养管理等)的20000只肉 鸡中随机抽取各含100只肉鸡的两个样本, 分别称量其42天出栏重,结果发现: 样本1平均出栏重为:2.24kg/只 样本2平均出栏重为:2.31kg/只
第四章 均数差异显著性 检验 — t检验
河南农业职业学院 孙攀峰
相关主题