小样本资料的差异显著性检验
58.3 59.2 58.6 60.6 60.3 59.5 59.1 58.0 61.0 58.9 n = 10 下面我们作统计分析
由于是小样本,且总体方差为未知 因此应使用 t-test 进行分析 (请同学们先自行立题、计算)
首先计算平均数和标准差,得:
x 59.35 s 0.999
s 0.999 sx 0.32 n 10
一、成组数据的平均值比较
方法介绍:
在一个总体中,随机地抽取两个样本,在这两个样
本中,被抽取的个体是相互独立的,且基本条件
(如品种、日龄、性别、体况等)都应一致、均
匀,必要时须作适当的调整,尽可能使两个组在 样本量上一致,各组的基本情况一致 随机地指定一组作处理,另一组作对照
一定要注意其中的任意一组作处理,一组作对照, 而不能事先规定哪一组做处理,哪一组作对照
典规定 (试想一下,该题可以用一尾检验吗?)
我们有三个公式用于单个样本的统计假设检验:
u x
x
x u sx
t
x sx
能说出这三个公式各自的使用场合和它们之间的区 别吗?
第二节 两个样本平均值相比较的 统计假设检验
很多情况下,我们不只是将样本平均数与总体平均
数相比较
而是做一个试验,这个试验中设置两个组,一个组
间应有较大的差异
2、选取若干个动物,每一个动物在试验前测定一 次,试验后测定一次,这样的两次记录就是配对 数据,如同一个人吃早饭前后各测一次血糖值, 这同一个人的两次血糖值就是一对数据,若干个 人就有若干个数据对 3、同一个体的不同部位可以配成一对,如一个兔 子的左右体侧,就可以配成一对,若干个兔子的 不同体表就是若干对
4、同一个动物的不同试验时期所施加的不同处理 形成一个对子,如一只猪在第一试验期施加 A 处 理,在第二试验期施加 B 处理;或第一试验期施 加处理,第二试验期作对照
作试验,施加某种试验条件(即处理 ),另一个 组作对照,试验完了将这两个组的试验数据进行 比较 这种试验可以采用两种方法进行: 第一种方法是两个组的数据是相互独立的:一组是 处理,另一组是对照
第二种方法是两个组的数据是配对的
下面我们先讨论两个组是相互独立的情况
这种统计假设检验的方法称为成组数据的比较
么? )
二、配对数据的平均值比较
方法介绍:
配对数据来自于配对试验,配对试验根据具体试验
情况可以有好多种方法: 1、将两个品种、性别、日龄、体况等一致的动物 (最好是有血缘关系的同胞或半同胞)配成一对, 任意一只进入试验组,另一只进入对照组,配成
若干对,试验中做好记录,这种记录到的数据就
是配对数据
注意:对子内的两个个体应尽可能一样,但对子之
2
2
n2
1 1 n1 n2
或:
sx1 x2
n1 1 s12 n2 1 s22
n1 1 n2 1
1 1 n1 n2
t 公式中分母两样本差的标准误也可以这样写:
sx1 x2 1 1 s n1 n2
2
2 1
其中:
s2
所得 t 值出现的概率 p 0.01 ,因此更应该否定无效 假设而接受备择假设
即:该猪群肛温与正常猪肛温差异极显著,我们有 99% 以上的把握认为该猪群犯病了
再举一例:
药典规定,某药物每 100ml 中应含有 60mg 的总黄 酮,现对某药厂生产的某一批次的这种药进行检 测,得如下数据,试问该批次药物的总黄酮含量 合格吗?
查附表4:t 分布表,得知:自由度为 df = 24 - 1 =
23 时的
t0.05,23 2.069
t0.01,23 2.807
本例中所得 t 4.71 t0.05,23 2.069
所得 t 值的概率 p 0.05 因此,应否定无效假设, 接受备择假设 即:该猪群肛温与正常猪肛温差异显著,我们有 95% 以上的把握认为该猪群犯病了 由于所得 t 值远大于 t0.05,23 2.069 因此还应当作进一 步的检验: t 4.71 t0.01,23 2.807
检验
已知: = 39 ℃,样本 x = 40.2 ℃, = 1.25 ℃ s
检验步骤如下:
设 H0 : 39 ℃ vs H A 39 ℃
计算 sx 和 t 值:
s 1.25 sx 0.255 n 24
x 40.2 39 t 4.71 sx 0.255
试验,并对试验后所得资料进行分析,通过统计 推断来定性或定量地分析研究总体的特征 本章主要介绍总体方差未知、且样本较小时不同资 料类型的统计推断——差异显著性检验(假设检
验)的具体方法
第一节 单个平均数的假设检验
单个平均数的假设检验是检验一个样本所属的总体
平均数 0 与一个特定(已知)总体平均数 间是
在第四章讨论 t- 分布时,我们已经知道,总体方差
未知、且样本较小时,可以用 s 2 代替 2 ,其统计 x 量 就不再服从标准正态分布,而是服从 t分布: x t
sx
sx
(请回忆一下 t- 分布曲线及其特点)
t- 分布曲线受自由度制约,不同自由度下的 t- 分布
曲线其形状是不同的,因此不同自由度下算得的
一、总体方差已知时单个平均数的假设检验
当总体方差 2 已知,不管样本多大,均可用 u- 分 布计算实得差异由抽样误差造成的概率,所以称
u-test
u- 检验(u-test)的方法和步骤见前一章内容
(请逐一回忆一下检验公式和检验步骤)
二、总体方差未知时单个样本平均数的假设 检验
(一)当总体方差未知、而样本较大时,可以使用
否存在显著差异的一种统计方法,也可理解为检
验一个样本是否来自某一特定(已知)总体的统 计分析方法
根据统计假设检验的基本原理可知,假设检验的关
键是根据统计量的分布计算实得差异(即表面效
应)由抽样误差造成的概率
测验的统计量分布服从 u- 分布或 t- 分布,所以单
个平均数的假设检验可分为 u-test 和 t-test 两种
t- 值落在某一范围内的概率值也随自由度的不同 而不同
下面我们用例子来说明这一类型的 t-test
例:猪的正常肛温为 39℃,今有一个猪场报告,怀
疑其猪群可能是发病了,某兽医在该场内随机抽
测了 24 头猪的体温,得到这 24 头猪的平均肛温 为 x = 40.2 ℃,标准差为 s = 1.25 ℃,试问该猪 场的猪犯病了吗? 该例仅有总体平均值 = 39 ℃,而无总体方差,且 样本量不大(n = 24 < 30),因此符合总体方差 未知、且是小样本的情况,应使用 t-test 来进行
显然,这两个厂家的药物是相互独立的,试验所用 动物也是独立的;样本较小 因此应使用成组数据的 t-test 进行分析
(同学们先行分析)
先做预备计算,将两个样本的平均值、方差等计算 出来:n1 10 x1 49.95 s12 1.225 2 n2 8 x2 48.70 s2 1.074
0
由于 t '处于 t1 ~ t2 之间,因此,只有在实际计 算得到的 | t | 在 t1 ~ t2 之间时,才需要计算 t '
附:
两均方是否齐性的判别方法: F
2 s大 2 s小
如果 F F ,df1 ,df2 表示两均方齐性,否则就是不齐
(例题见P 52 该例实际是不需要计算 t ' 的,为什
sx1 x2
因此: t x1 x2 1 2 sx1 x2 由于我们在之前的无效假设是:H0 : 1 2
(备择假设是: H A : 1 2 )
因此这一式子可以简化为:t x1 x2 sx1 x2
得到成组数据所进行的试验称为完全随机设计法 (仅两个组)
所得 t 值出现的概率 p 0.05
因此,否定无效假设,接受备择假设 即:A、B 两厂生产的该类药物的 24h 血液残留量 差异显著(下面应针对这一现的是合并均方,合
并均方只有在两总体方差(我们一般用样本均方
估计总体方差)相同,即两方差差异不显著的情 况下才能得到 这里我们总假定两个均方差异不显著,但如果两方 差差异显著,就不能合并,两均方是否相等,必 须用下一章的 F-test 进行检验才能知道
试验过程中注意记录资料,结束以后整理资料并进 行统计分析 这样得到的资料称为成组数据 这样的数据在组间、组内都是独立的 成组数据的 t-test 其公式是:
x1 x2 t sx1 x2
其中:
sx1 x2
x
2 1
x
1
2
n1 n1 1 n2 1
x
2 2
x
u- 分布计算实得差异由抽样误差造成的概率
因此,其检验还是 u-test
(请回忆一下以上两种 u-test 的共同点和不同点;
公式的不同:哪里不同)
(二)总体方差未知,且样本较小时的单个 样本平均数的假设检验
实际上,在很多情况下,总体方差往往是未知的,
而由于各种条件的限制,试验的样本又不可能很 大,即只能用小样本来作试验,或调查时抽取的 样本较小 因此,总体方差未知、样本较小是试验中最常见的 一种情况
sx1 x2 1 1 1.159 0.51 10 8
设立无效假设: H0 : 1 2 vs H A : 1 2
计算 t 值,并作比较:
t 2.45 t0.05,16 2.120
49.95 48.70 1.25 t 2.45 0.51 0.51
A、B 两厂生产某同类药物,现作 24 小时血液内残 留量检测,得如下数据,试分析哪一厂家的该类 药物的残留量大