当前位置:
文档之家› 计量资料两组均数的比较-t检验
计量资料两组均数的比较-t检验
▪ 为什么要进行假设检验? ▪ 假设检验能够处理哪些问题? ▪ 假设检验的基本思想是什么? ▪ 假设检验的基本步骤有哪些? ▪ 应用假设检验还要涉及哪些问题?
假设检验的思维逻辑
▪ 实例:欲探讨男性成人肺炎患者的血红蛋白同男性健康成人有无区别,如 果能够测量所有的男性成人肺炎患者和男性健康成人的血红蛋白数值, 我们通过计算均数就可以进行大小的比较。可是,男性成人肺炎患者和男 性健康成人的群体是无限大的,其血红蛋白值构成的总体也是无限的。
▪ 若随机抽取两个样本,各10例:
▪ 10例男性成人肺炎患者的血红蛋白(g/dl)测量值:
▪ 11.9,10.9,10.1,10.2,9.8,9.9,10.3,9.3,9.8,8.9;
▪ 10例男性健康成人的血红蛋白(g/dl)测量值:
▪ 13.9,14.2,14.0,14.3,13.7,13.9,14.1,14.7,13.5,13.6。
乙车间:86.71 93.14 106.51 90.11 121.32 116.14 56.92 78.78 61.14 100.30
1. 建立检验假设,确定检验水准 H0:两车间的氟作业工人的尿氟含量无差异,即 µ1=µ2 H1:两车间的氟作业工人的尿氟含量有差异,即 µ1≠µ2 α=0.05
2. 计算统计量
▪ 算得10例男性成人肺炎患者的血红蛋白均数为10.11(g/dl),
▪
10例男性健康成人的血红蛋白均数为 13.99(g/dl),
▪ 差别的原因?
▪ 差别的原因可能有两种: ▪ 本质上的差异 ▪ 抽样误差
▪ 只要个体之间存在差异,抽样误差就不可 避免。
▪ 欲想知道差别到底是本质上的差异还是纯 粹的抽样误差,需进行假设检验。
2.计算统计量 根据样本数据计算相应的统计量。统计量 (statistic)是随机样本的函数。它不应包含任何未知参数。
在例 7-1 中,应计算 t 检验的统计量 t。 t x 0 14.3 14.1 0.236
s / n 5.08 / 36
(相应的自由度为) n 1 36 1 35 .
较来对待
基本思想和步骤
(一)两样本所属总体方差相等
如果两总体均为正态分布,分别记为 N(μ1,σ2)和 N(μ2,σ2), 检验假设为
H0 (两样本所属的)两个总体均数相等,即μ1=μ2 H1:μ1≠μ2 已知当 H0 成立时,检验统计量
t X1 X 2 ~t(n1+n2-2)
S2( 1 1 )
▪ H1的内容直接反映了检验单双侧。若H1中
只是 0 或 <0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的 方向。
▪ 单双侧检验的确定,首先根据专业知识, 其次根据所要解决的问题来确定。若从专 业上看一种方法结果不可能低于或高于另 一种方法结果,此时应该用单侧检验。一 般认为双侧检验较保守和稳妥。
▪ 2.计算统计量
▪ 推断样本来自的总体均数µ与已知的某一总体均数µ0(常 为理论值或标准值) 有无差别
n 1 t X 0 X 0
sx
sn
3.确定P值 P值的意义是: 如果总体状况和 一致,统计 量获得现有数值以及更不利于 的数值的可能性(概率) 有多大
第二节 两相关样本均数的比较
和 S x2 分别为样本均数的标准误, n1 和 n2 分别为两组的样本量。
▪ 例 为探讨硫酸氧钒对糖尿病性白内障的防治作用, 研究人员将已诱导糖尿病模型的20只大鼠随机分为两 组。一组用硫酸氧钒治疗(DV组),另一组作对照观察 (D组),12周后测大鼠血糖含量(mmol/L)。结果为,
▪ DV组12只,样本均数为6.5mmol/L,标准差为 1.34mmol/L;D组8只,样本均数为13.7mmol/L,标 准差为4.21mmol/L。
第三节 两独立样本均数的比较
▪ 两组独立样本(two independent sample) ▪ 将受试对象随机分配成两个处理组,每一组随机接受
的一种处理 ▪ 一般把这样获得的两组资料视为代表两个不同总体的
样本,推断它们的总体均数是否相等 ▪ 从两个人群(例如某年龄组男性与女性)分别随机抽
取一定数量的观察对象,测量某项指标进行比较 ▪ 在实际工作中这类资料也按完全随机设计的两样本比
▪ 借助抽样误差的分布规律: ▪ 均数的分布、t 分布、z分布、…
t变换
假设检验的原理:
1
P
t t / 2,
拒绝H0
接受无效假设
t t
/
t
2,
拒绝H0
▪ 假设检验(hypothesis test) ▪ 也称显著性检验(significance test),采用的是小概率
反证法的思想,即是事先对样本统计量的分布和总体参数 作出某种假设
▪ 配对设计主要适用于以下情况: ▪ 同一受试对象处理前后的比较,或两个部位的数据,
(若为某种处理前后的数据,需要经历的处理时间较长, 测量结果稳定) ▪ 同一样品(或受试对象)用两种处理方法(或测量等) 检测的结果; ▪ 根据非处理因素配对后,两个受试对象分别接受两种不 同处理的数据
基本思想与步骤
究人员从东北某县抽取36名儿童,得囟门闭合月龄均值 为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄 的均数是否大于一般儿童? ▪ 1.选择检验方法,建立检验假设并确定检验水准 ▪ 根据研究目的、研究设计的类型和资料特点(变量种类、 样本大小)等因素选择合适的检验方法。并且将需要推 断的问题表述为一对关于总体特征的假设。 ▪ 原假设(null hypothesis),又称无效假设,记为H0; ▪ 对立假设(alternative hypothesis),又称备择假设,记 为 H1。
这里 X 1 =127.1200,S1=23.4467; X 2 =91.1070,S2=21.3553;n1=n2=10
Sc2= (10 1) 23.4467 2 (10 1) 21.3553 2 =502.8983 10 10 2
t= 91.1070 127 .1200 =-3.591 502 .8983 ( 1 1 ) 10 10
Sd 48.2052 6.9430
t 16.9133 0 8.4386 6.9430 / 12
3. 确定 P 值和作推断 查附表 2(t 界值表), t0.05/2,11 2.201,得 p<0.05, 在 =0.05 的水准上
拒绝 H0 ,可以认为健康教育干预措施对于该地区儿童血铅水平的下降有效。
5
136.77
6
198.35
7
1710.50
10
148.39
11
172.18
12
180.11
184.68 128.67 208.30 210.35 126.25 188.32 164.72 150.48 98.64 129.98 158.36 164.07
差值
15.74 26.72 33.92 16.53 10.52 10.03 12.17 16.10 11.96 18.41 14.82 16.04
1. 建立检验假设,确定检验水准 H0 :干预前后血铅水平差值的总体均数相等,即 d 0 ,
H1 :: d 0 = 0.05
2. 计算统计量
这里 n=12, d 202.96, d d / n 202.96 /12 16.9133 d 2 3962.9872 Sd2 3962.9872 (202.96)2 /12 /11 48.2052
n c 1
n2
其中,
S
2 c
是合并方差
S
2 c
(n1
1)S12
(n2
1)S
2 2
n1 n2 2
(X1 X1)2 (X2 X2)2 n1 n2 2
如果根据样本算得的 t 值偏大,有理由拒绝 H 0 。
▪ 例 某职防所测定了某工厂不同工种的两个车间 的氟作业工人的尿氟含量(μmol/L),资料如下,问两 车间的氟作业工人的尿氟含量有无差别? 甲车间:126.12 143.20 139.41 161.11 123.21 110.33 98.06 151.44 86.76 31.56
▪ 无论做出哪一种推断结论(接受或是拒 绝 ),都面临着发生判断错误的风险。这 就是假设检验的两类错误
第一节 样本均数与总体均数的比较
▪ 基本思想与步骤: ▪ 1. 假设检验: H0:总体均数为μ0,即μ=μ0 H1:μ≠μ0. ▪ 其对立假设H1包括μ>μ0和μ<μ0两种可能。
一般情况下均采用双侧检验
第六章 计量资料两组均数 的比较—t检验
主要内容
假设检验的基本原理和步骤 样本均数与总体均数的比较 两相关样本均数的比较 两独立样本均数的比较 t检验的应用条件 检验假设注意的问题 案例讨论
假设检验的概念与原理
▪ 对所估计的总体首先提出一个假设,然后通 过样本数据去推断是否拒绝这一假设,称为 假设检验(hypothesis testing)。
3. 确定 P 值和作统计推断 自由度υ=10+10-2=18,查 t 界值表得: 0.002<P<0.005 按照 α=0.05 的水准,拒绝 H0,(接受 H1,有差异)。即可以认为两车间的氟作业工人的尿 氟含量有差异,乙车间较高
(二)两样本所属总体方差不等
(Satterthwaite近似法)
▪ 然后判定样本统计量在总体分布所处的位置和对应的概率 值
▪ 如果样本统计量(如)在总体分布中的位置远离假定的参 数,相对应的P值也小(如小于0.05)
▪ 根据“小概率事件在一次试验中一般不可能发生”的原理, 统计学有理由认为样本统计量不是来自事先假定的总体
假设检验的基本步骤
▪ 例 已知北方农村儿童前囟门闭合月龄为14.1月。某研