当前位置:
文档之家› 均数差异显著性检验EXCEL
均数差异显著性检验EXCEL
随机事件(random event) 随机事件 不确定事件(indefinite event) 不确定事件 为了研究随机现象,需要进行大量重复的调查、实验、 为了研究随机现象,需要进行大量重复的调查、实验、 测试等,这些统称为试验。 测试等,这些统称为试验。
二、频率(frequency) 频率( )
P(A) = p
统计概率
抛掷一枚硬币发生正面朝上的试验记录 实验者 蒲丰 投掷次数 4040 发生正面朝上的次数 频率(m/n) 频率 2048 6019 12012 0.5069 0.5016 0.5005
K 皮尔逊 12000 K 皮尔逊 24000
随着实验次数的增多, 随着实验次数的增多,正面朝上这个事件发生的频率稳定 接近0.5,我们称0.5作为这个事件的概率 作为这个事件的概率。 接近 ,我们称 作为这个事件的概率。
第四章 均数差异显著性检验 — t检验
河南农业职业学院 孙攀峰
目的要求
显著性检验的目的、 显著性检验的目的、 方法以及步骤 Excel进行 Excel进行t检验的步 进行t 骤、方法
第一节 概率及分布概述
一、事件
定义:在一定条件下, 定义:在一定条件下,某种事物出现与否 就称为是事件。 就称为是事件。 自然界和社会生活上发生的现象是各 种各样的,常见的有两类。 种各样的,常见的有两类。
若在相同的条件下,进行了n次试验,在这n 若在相同的条件下,进行了 次试验,在这 次试验 次试验中,事件 出现的次数 称为事件A出现的 出现的次数m称为事件 次试验中,事件A出现的次数 称为事件 出现的 频数,比值 称为事件A出现的频率 频数,比值m/n称为事件 出现的频率 称为事件 出现的频率(frequency), , 记为W(A)=m/n。 。 记为
即假设两品种经产母猪产仔数的总体平均数µ 即假设两品种经产母猪产仔数的总体平均数µ1 和µ2 不相等,亦即存在处理效应, 不相等,亦即存在处理效应,其意义是指两品种经产母 猪产仔数存在本质上的差异。 猪产仔数存在本质上的差异。
(2)备择假设HA : µ1 ≠µ2 备择假设H
2 、 确定显著水平
能否定H 人为规定的概率标准称为显著水平, 规定的概率标准称为显著水平 能否定 0的人为规定的概率标准称为显著水平,记作α。
统计学中,一般认为概率小于 统计学中,一般认为概率小于0.05或0.01的事件 或 的事件 为小概率事件,所以在小概率原理基础上建立的假设 为小概率事件 所以在小概率原理基础上建立的假设 检验也常取α 检验也常取α=0.05和α=0.01两个显著水平 。 和 两个显著水平
=0.05 α=0.05
显著水平*
P< α
α=0.01
极显著水平**
选定检验方法,计算检验统计量, 3 、选定检验方法,计算检验统计量,确定概率值 根据研究设计的类型和统计推断的目的选 择使用不同的检验方法。 例:
这里是对两品种经产母猪产仔数的总体 平均数进行比较, 平均数进行比较,因此为均数差异显著性检 ------t检验。 验------t检验。
1
2
3
4
5
6
7
8
9
10
随机抽取一个球,求下列事件的概率 随机抽取一个球,求下列事件的概率; (1)事件 =抽得一个编号< 4 事件A=抽得一个编号 事件 事件B 抽得一个编号是2的倍数 (2)事件 =抽得一个编号是 的倍数 事件 抽得一个编号是 该试验样本空间由10个等可能的基本事件构成, 该试验样本空间由 个等可能的基本事件构成,即n=10,而 个等可能的基本事件构成 , 事件A所包含的基本事件有 所包含的基本事件有3个 即抽得编号为1、 、 中的任 事件 所包含的基本事件有 个,即抽得编号为 、2、3中的任 何一个,事件A便发生 便发生。 何一个,事件 便发生。 P(A)=3/10=0.3 P(B)=5/10=0.5
四、小概率事件原理
概念: 如果某事件发生的概率很小 很小, 概念: 如果某事件发生的概率很小,在大量 重复试验中事件发生的频率也很小, 重复试验中事件发生的频率也很小, 在1次试验中该事件被看做是不会发 次试验中该事件被看做是不会发 生的。 生的。 应用:是假设检验时进行统计推断的理论依据。 应用:是假设检验时进行统计推断的理论依据。
通常将5%,1%认为是小概率的标准,又称 通常将 , 认为是小概率的标准, 认为是小概率的标准 显著水平。 显著水平。
第二节 均数差异显著性检验
一、复习回顾
生物统计的本质: 生物统计的本质: 研究如何从样本推断总体 样本抽取的原则: 样本抽取的原则: 随机抽样 试验误差的概念: 试验误差的概念: 由样本推断总体时, 由样本推断总体时,由各种 无法控制的随机因素引起的误差。 无法控制的随机因素引起的误差。
六、显著性检验的步骤
1、提出假设 提出假设 2、确定显著水平 、 3、选定检验方法,计算检验统计量, 、选定检验方法,计算检验统计量, 确定概率值作出推断 确定概率值 4、结论:是否接受假设
下面以两均数差异显著性检验为例具体说 明操作步骤。 明操作步骤。
例1: 随机抽测9头内江猪和9 随机抽测9头内江猪和9头荣昌猪经产母猪的产 仔数,得到如下数据资料:
一、概率基本概念 1 6 2 7 3 8 4 9 5 10
A=“一次取一个球,取得红球的概率” = 一次取一个球,取得红球的概率”
10个球中取一个球,其可能结果有10个基本事件(即每个球 个球中取一个球,其可能结果有 个基本事件 个基本事件( 个球中取一个球 被取到的可能性是相等的), ),即 被取到的可能性是相等的),即n=10 事件A:取得红球, 事件包含3个基本事件 事件 :取得红球,则A事件包含 个基本事件,即m=3 事件包含 个基本事件, P(A)=3/10=0.3
处理 效应 误差 效应
三、显著性检验的任务
分析误差产生的原因 排除误差干扰 确定差异的性质 对总体特征做出正确判断
四、显著性检验的原理
小概率原理: 小概率原理: 统计假设:对总体的某些未知或不完全知道 统计假设:
的性质提出待考查的命题,通常包括无效假 的性质提出待考查的命题, 设和备择假设。 设和备择假设。根据样本资料对假设的成立 与否进行推断就是假设检验, 与否进行推断就是假设检验,也称显著性检 验。
一、概率基本概念
在一定条件下必然出现某种结果或必然不出现某种结果。 在一定条件下必然出现某种结果或必然不出现某种结果。
确定性事件
必然事件( 必然事件(U) (certain event)
不可能事件( 不可能事件(V) (impossible event)
在一定条件下可能发生也可能不发生。 在一定条件下可能发生也可能不发生。
差异
在试验进行过程中,尽管尽量排除随机误差的影响,以 在试验进行过程中,尽管尽量排除随机误差的影响, 突出试验的处理效应,但由于生物个体间无法避免的差异, 突出试验的处理效应,但由于生物个体间无法避免的差异, 以及诸多无法控制的随机因素, 以及诸多无法控制的随机因素,使得试验结果最后表现的观 察值除了处理效应以外,还包括试验误差的效应。 察值除了处理效应以外,还包括试验误差的效应。
在无效假设H 成立的前提下计算t 在无效假设H0成立的前提下计算t值
注:由于计算过程复杂,这里不再重复书上内容,在下 由于计算过程复杂,这里不再重复书上内容, 面将具体讲解如何用Excel来进行统计分析。 来进行统计分析。 面将具体讲解如何用 来进行统计分析
三、概率(probabห้องสมุดไป่ตู้lity,P) 概率(
m m P(A) = p=lim ≈ n n
在一般情况下,随机事件的概率 是不可 在一般情况下,随机事件的概率P是不可 能准确得到的。通常以试验次数n充分大 充分大, 能准确得到的。通常以试验次数 充分大,随 机事件A的频率作为该随机事件概率的近似值 的频率作为该随机事件概率的近似值。 机事件 的频率作为该随机事件概率的近似值。
一、概率基本概念
频率表明了事件频繁出现的程度, 频率表明了事件频繁出现的程度,因而其稳定 性说明了随机事件发生的可能性大小, 性说明了随机事件发生的可能性大小,是其本身固 有的客观属性,提示了隐藏在随机现象中的规律性。 有的客观属性,提示了隐藏在随机现象中的规律性。
定义:设在相同的条件下,进行大量重复试验, 定义:设在相同的条件下,进行大量重复试验, 若事件A的频率稳定地在某一确定值 的附近摆动 若事件 的频率稳定地在某一确定值p的附近摆动, 的频率稳定地在某一确定值 的附近摆动, 则称p为事件 出现的概率 则称 为事件A出现的概率。 为事件 出现的概率。
0≤W(A) ≤1
抛掷一枚硬币发生正面朝上的试验记录 实验者 蒲峰 皮尔逊 皮尔逊 投掷次数 ( n) 4040 12000 24000 发生正面朝上次数 频率 (m/n) m/n) (m) 2048 6019 12012 0.5069 0.5016 0.5005
从表中可以看出,试验随着 值的不同 值的不同, 从表中可以看出,试验随着n值的不同,正面朝上出现 的频率也不相同, 越大时, 的频率也不相同,当n越大时,频率越接近 越大时 频率越接近0.50。 。
五、显著性检验的分类
t 检验——主要用于检验两个处理平均数差 检验——主要用于检验两个处理平均数差 异是否显著; 异是否显著; 方差分析——主要用于检验多个处理平均 方差分析——主要用于检验多个处理平均 数间差异是否显著; 数间差异是否显著; 检验 —— 主要用于由质量性状得来的次 数资料的显著性检验等。 数资料的显著性检验等。
处理 效应 误差 效应
表 面 效 应
二、显著性检验的目的
对两个样本进行比较时, 对两个样本进行比较时,必须判断样本 间差异主要是随机误差造成的, 间差异主要是随机误差造成的,还是本质不 同或处理效应引起的? 同或处理效应引起的? 处理 效应 误差 效应