当前位置：文档之家› EXCEL均数差异显著性检验

EXCEL均数差异显著性检验

1 、提出假设
无效假设 /零假设 /检验假设
H0 误差效应
1 ＝ 2
对立
备择假设 /对应假设
1 2 HA
处理效应
例：比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。
提出假设：
（1）无效假设H0： 1 ＝ 2
即假设两品种经产母猪产仔数的总体平均数相等，试验的处理效应（品种间差异）为0。
与否进行推断就是假设检验，也称显著性检
验。
五、显著性检验的分类
t 检验——主要用于检验两个处理平均数
差异是否显著；方差分析——主要用于检验多个处理平均数间差异是否显著；
检验 —— 主要用于由质量性状得来的次
数资料的显著性检验等。
六、显著性检验的步骤
1、提出假设
2、确定显著水平 3、选定检验方法，计算检验统计量，确定概率值作出推断 4、结论：是否接受假设
注：由于计算过程复杂，这里不再重复书上内容，在下面将具体讲解如何用Excel来进行统计分析。
Excel进行t检验分类
Excel可提供的t检验工具：

t-检验：双样本等方差假设
此 t-检验先假设两个数据集取自具有相同方差的分布，可确定两个样本是否来自具有相同总体平均值的分布。

t-检验：双样本异方差假设
下面以两均数差异显著性检验为例具体说明操作步骤。
例1：随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数，得到如下数据资料：
产仔数内江猪荣昌猪 14 12 15 14 12 13 11 13 13 12 17 14 14 10 14 10 13 10
试比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。
第四步，计算结果
95%置信区间下限：114.3333-1.025696=113.3 上限：114.3333+1.025696=115.4
总体平均数： 114d
分析：总体平均数落在样本均数置信概率为95%的置信区间内（113.3 ～115.4），说明样本均数与总体均数差异不显著。
九、两个样本平均数的差异显著性检验
（2）备择假设HA ： 1 ≠2
即假设两品种经产母猪产仔数的总体平均数1 和2 不相等，亦即存在处理效应，其意义是指两品种经产母猪产仔数存在本质上的差异。
2 、确定显著水平
能否定H0的人为规定的概率标准称为显著水平，记作。
统计学中，一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平。
二、频率（frequency）
若在相同的条件下，进行了n次试验，在这n 次试验中，事件A出现的次数m称为事件A出现的频数，比值m/n称为事件A出现的频率(frequency)，记为W(A)=m/n。
0≤W(A) ≤1
抛掷一枚硬币发生正面朝上的试验记录
实验者
蒲峰皮尔逊皮尔逊
投掷次数（n）
一、概率基本概念 1 6 2 7 3 8 4 9 5 10
A＝“一次取一个球，取得红球的概率”
10个球中取一个球，其可能结果有10个基本事件（即每个球被取到的可能性是相等的），即n=10 事件A：取得红球，则A事件包含3个基本事件，即m=3 P(A)=3/10=0.3
四、小概率事件原理
概念：如果某事件发生的概率很小，在大量重复试验中事件发生的频率也很小，在1次试验中该事件被看做是不会发生的。应用：是假设检验时进行统计推断的理论依据。
差异
在试验进行过程中，尽管尽量排除随机误差的影响，以突出试验的处理效应，但由于生物个体间无法避免的差异，以及诸多无法控制的随机因素，使得试验结果最后表现的观察值除了处理效应以外，还包括试验误差的效应。
处理效应误差效应
表面效应
二、显著性检验的目的
对两个样本进行比较时，必须判断样本间差异主要是随机误差造成的，还是本质不同或处理效应引起的？
例5.2：母猪的怀孕期为114d，现抽测12头大白猪母猪的怀孕期分别
为115，113，114，112，116，115，114，118，113、115、114、113，试检验所得样本的平均数与总体平均数114d有无显著差异？
第一步，输入数据
第二步，工具---数据分析---描述统计
第三步，输入参数
＝0.05 ＝0.01
P<
显著水平* 极显著水平**
3 、选定检验方法，计算检验统计量，确定概率值根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例：这里是对两品种经产母猪产仔数的总体
平均数进行比较，因此为均数差异显著性检验------t检验。
在无效假设H0成立的前提下计算t值
此 t-检验先假设两个数据集取自具有不同方差的分布，可以确定两个样本是否来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时，可使用此检验。

t-检验：平均值的成对二样本分析
当样本中存在自然配对的观察值时（例如，对一个样本组在实验前后进行了两次检验），可以使用此成对检验，以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。
在一定条件下必然出现某种结果或必然不出现某种结果。
确定性事件
必然事件（U) (certain event)
不可能事件（V) (impossible event)
在一定条件下可能发生也可能不发生。
随机事件(random event) 不确定事件(indefinite event) 为了研究随机现象，需要进行大量重复的调查、实验、测试等，这些统称为试验。
第一类错误（type I error），又称弃真错误或错误; 第二类错误（ type II error ），又称纳伪错误或错误
１、两类错误既有联系又有区别
错误只在否定H0时发生
错误只在接受H0时发生
错误增加错误减小错误增加错误减小
2、还依赖于 - 0 的距离
随着实验次数的增多，正面朝上这个事件发生的频率稳定接近0.5，我们称0.5作为这个事件的概率。
三、概率（probability,P)
m m P(A) = p=lim n n
在一般情况下，随机事件的概率P是不可能准确得到的。通常以试验次数n充分大，随机事件A的频率作为该随机事件概率的近似值。
1
2
3
4
5
6
7
8
9
10
随机抽取一个球，求下列事件的概率; （1)事件A＝抽得一个编号< 4 （2)事件B =抽得一个编号是2的倍数
该试验样本空间由10个等可能的基本事件构成，即n=10，而事件A所包含的基本事件有3个，即抽得编号为1、2、3中的任何一个，事件A便发生。 P(A)=3/10=0.3 P(B)=5/10=0.5
性说明了随机事件发生的可能性大小，是其本身固有的客观属性，提示了隐藏在随机现象中的规律性。
定义：设在相同的条件下，进行大量重复试验，若事件A的频率稳定地在某一确定值p的附近摆动，则称p为事件A出现的概率。
P(A) = p
统计概率
抛掷一枚硬币发生正面朝上的试验记录实验者蒲丰 K 皮尔逊 K 皮尔逊投掷次数 4040 12000 24000 发生正面朝上的次数 2048 6019 12012 频率(m/n) 0.5069 0.5016 0.5005
结果输出区域，可选任一空白单元格
Excel进行t检验步骤（四）
计算所得t值双尾概率P
4、作出推断结论：是否接受假设
小概率原理
P>
假设H0成立可能正确
接受H0 否定HA 否定H0 接受HA
P<
假设H0成立可能错误
例：上例中 P＝0.053>0.05
所以接受H0，从而得出结论：内江猪与
3、n , 2 可使两类错误的概率都减小.
八、样本均数与总体均数差异显著性检验
样本均数与总体均数差异显著性检验t检验
无效假设为Ho：o
备择假设为HA：o
计算公式如下：
根据以上公式可导出以下结论：
由此可知，当总体平均数落在已知的样本均数置信概率为（1-）的置信区间以外时，就表明在显著水平时差异显著。
如：随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数：内江猪：14，15，12，11，13，17，14，14，13 荣昌猪：12，14，13，13，12，14，10，10，20
分析：这里两品种猪的产仔数无任何关联，每种猪的产仔数分别组成一组数据，相互比较时以组平均数做为比较标准，在Excel里进行t检验时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进行分析。
配对试验—成对数据平均数的比较
试验单位两两配对，随机分配到两个处理，配对的试验单位要求存在相似性，而每个处理内的各试验单位不一定相似，可以变异较大，但配对内试验单位要求相似，因此，两样本容量相同，所得数据为成对数据，两组数据以相配对的试验单位之间的差异作为相互比较的标准，来检验其差异的显著性。
通常将5%，1%认为是小概率的标准，又称显著水平。
第二节均数差异显著性检验
一、复习回顾
生物统计的本质：研究如何从样本推断总体样本抽取的原则：随机抽样试验误差的概念：由样本推断总体时，由各种无法控制的随机因素引起的误差。
现在，我们假设有这样一个情况：从一批同质（相同品种、相同日龄、相同饲料、相同饲养管理等）的20000只肉鸡中随机抽取各含100只肉鸡的两个样本，分别称量其42天出栏重，结果发现：样本1平均出栏重为：2.24kg/只样本2平均出栏重为：2.31kg/只
第四章均数差异显著性检验 — t检验
河南农业职业学院孙攀峰

e商务文档

EXCEL均数差异显著性检验

相关文档推荐：