07假设检验基础
26/114
单样本资料的t检验
单样本资料的t检验(样本均数与总体均数比较的t 检验)实际上是推断该样本来自的总体均数µ 与已 知的某一总体均数µ (常为理论值或标准值) 有 0 无差别。 在进行样本均数与总体均数比较中,需要建立一 个统计量,根据样本所属不同总体,该统计量的 分布也不同,由此作出相应的统计推断。
x 0 x 0 74.2 72.0 t 1.833 s 6.0 sx n 25
31/114
样本均数与总体均数比较
3.确定p值,判断是否应该拒绝
查t界值表,临界值t0.05/2,24=2.064,检验统计量
t=1.833<2.064不是小概率事件,对于一14
故0.005>P>0.002。按水准,拒绝H0, 接受H1, 差异有统计学意义。
两独立样本资料的t检验 independent samples t-test
适用于比较按完全随机设计而得到的两组资料,比较的目 的是推断它们各自所代表的总体均数和是否相等。
两总体方差齐性,即总体方差相等。 1 2
假设检验基础
学习要点
为什么要进行假设检验?
假设检验的基本步骤
假设检验中的两类错误
假设检验与置信区间的关系
配对t检验与成组t检验对资料的要求
二项分布近似服从正态分布条件与分析方法
正态近似法分析泊松分布问题
2/114
统计资料处理 统计描述(statistical description)
的脉搏数不同?
4/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L, 铅作业工人的血红蛋白含量与正常人有无不同?
5/114
根据以往的资料得知A、B两校男生50米跑成 绩的标准差分别为0.4秒和0.2秒。今从两校中分 别抽测了25名和28名男生,其50米跑平均成绩分 别为8.1秒和7.9秒。问两校男生50米跑水平是否 相同?
统计推断 (statistical inference)
1、参数估计estimation of parameter 2、假设检验 hypothesis testing
3/114
根据大量调查,已知健康成年男子脉搏均数为72次/分钟 某医生在一山区随机测量了25名健康成年男子脉搏数, 求得其均数为74.2次/分钟,标准差为6.5次/分钟, 能否认为该山区成年男子的脉搏数与一般健康成年男子
8.0867 6.812 / 8 Sd 0.572 ( mol / g ) 8 1 0.851 t 4.208 0.572 / 8
查表,t0.005/2,7=4.029, t0.002/2, 7=4.785, 现t0.005/2,7<t< t0.002/2,7 ,
可认为不同饲料的大白鼠肝中维生素A含量有差别,正常饲料的
样本均数与总体均数比较
上述两个均数不等既可能是抽样误差所致,也有可 能真是环境差异的影响,做假设检验。 因为σ未知,可用t检验,检验过程如下:
1. 建立假设 H0:µ 0=72次/分,H1:µ≠µ0, =µ
检验水准α为0.05。
30/114
样本均数与总体均数比较
2. 计算统计量 进行样本均数与总体均数比较的u检验,计算u值
第一步:提出一对检验假设, (1)无效假设null hypothesis, H0,又称零假设、原假设 (2)备择假设 alternative hypothesis, H1 。
H0:假设两总体均数相等。(即样本与总体或样本与样本间 的差异是由抽样误差引起的) H1:假设两总体均数不相等。(即两总体间存在本质差异)
成立。然后H0成立的条件下计算检验统计量,最后获得p
值来判断。
1、若p为小概率,则认为假设不成立; 2、若非小概率,则还不能认为假设不成立。 该结论的正确性是冒着5%的错误风险。 假设检验有自己独特的逻辑和统计学思维方式。
12/114
μ=173.2 173.83
176.5
13/114
假设检验的基本步骤
2、如果差别较大,则有可能不是抽样误差,而是来自的总体不
同。
10/114
假设检验是用来判断样本与样本,样本
与总体的差异是由抽样误差引起还是本
质差别造成的统计推断方法
11/114
假设检验理论基础
假设检验理论基础---利用小概率反证法思想,从问题的
对立面(H0)出发,间接判断要解决的问题(H1)是否
或者 H0:μ=μ0;H1:μ<μ0 (单侧检验)
16/114
对于假设检验,需注意:
检验假设是针对总体而言,而不是针对样本;
H0与H1是相互对立、相互联系的,最后的结论 是根据H0与H1做出的,两者缺一不可;
Ho是无效假设,假设常常是两个或多个总体参数 相等、或之差为0、或….无效、或某资料服从某 一特定分布;
样本均数与总体均数不等,有两种可能: 由抽样误差所致 两者来自不同的总体
9/114
本例目的是判断是否μ≠μ0,但直接判断很困难。但可以利用
反证法思想,从μ=μ0出发,间接的判断是否μ≠μ0. 假设μ=μ0 ,判断由于抽样误差造成 x 与μ0差别可能性有多 大? 1、如果 x 与μ0接近,其差别是抽样造成的可能性就很大;
d 2 d n n 1
2
710 (16 ) 2 12 7.91(k g) 12 1
t
| 1.33 | 7.91 12
0.58
(3)确定 P 值,作出推断结论 , =n-1=12-1=11, 查 附 表 2 , t 界 值 表 , 得 单 侧 t0.05/2 , 11=2.201, 现 t=0.58 <t0.05/2,11=2.201,故P > 0.05。按α=0.05 水准,不拒绝H0, 差异无统计学意义。 结论:故尚不能认为该减肥药有减肥效果。
43/114
23.01
(1)建立检验假设 H0:μ1 =μ2 ,即病人与健康人的尿中17酮类固醇的 排出量相同 H1: μ1 ≠μ2 ,即病人与健康人的尿中17酮类固醇的 排出量不同 α =0.05 (2)计算t值
14/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L,铅作业工 人的血红蛋白含量与正常人有无不同?
15/114
假设检验分为单、双侧检验
H0:μ=μ0;H1:μ≠μ0(双侧检验) 或者:
H0:μ=μ0;H1:μ>μ0 ;(单侧检验)
H1的内容直接反映了检验的单、双侧。
17/114
设定检验水准(size of test ) α常为0.05
第二步:选定统计方法,计算出统计量的大小。
根据资料的类型和特点,可分别选用t检验,则计算t值,
z检验则计算z值,或其他检验方法:秩和检验和卡方检验等。
x 0 t sx
18/114
2
2
,用t检验
t
X1 X 2 S X1X 2
S X1X 2
1 1 2 n1 n2 S Sc n n n n 2 1 1 2
2 c
2 (n1 1) S12 (n2 1) S 2 S c2 n1 n2 2
2
36/114
(1)建立检验假设 H0:μd=0, 即该减肥药无效; H1:μd≠0 ,即该减肥药有效。 α=0.05 (2)计算t值
本例n = 12, Σd = -16,Σd2 = 710,
差值的均数=Σd /n = -16/12 = -1.33(kg )
37/114
Sd
19/114
20/114
第三步:根据统计量的大小及其分布确定检验假设成立的
可能性P的大小并判断结果。
拒绝域
拒绝域
( t,z,F,x2 )
21/114
( t,z,F,x2 )
22/114
23/114
t / 2 ,
P值是指在H0成立的条件下,获得等于及大于(或 小于)现有统计量的概率。当求得统计量后,一般 可根据有关统计用表查得P值。例如t检验中, │t│≥ t / 2, ,则P≤α;│t│< t / 2 ,, 则P > α 。
38/114
某单位研究饮食中缺乏维生素E与肝中维生素A含
量的关系,将同种属的大白鼠按性别相同,年龄、
体重相近配成8对,并将每对中的两只大白鼠随
机分到正常饲料组和维生素E缺乏组,然后定期
将大白鼠杀死,测得其肝中维生素A的含量如表。
问不同饲料组的大白鼠肝中维生素A含量有无差
别?
39/114
40/114
42/114
n1 n2 2
例3.9 测得14名慢性支气管炎病人与11名健康人的尿
中17酮类固醇(mol/24h)排出量如下,试比较两组
人的尿中17酮类固醇的排出量有无不同。 原始调查数据如下:
病
人X1:n=14;
10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60 健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 13.89 19.40 15.83 26.72 17.29
34/114
t检验的公式为:
| d d | | d 0 | |d | t Sd Sd n Sd n
例题 设有12名志愿受试者服用某减肥药,服药前
和服药后一个疗程各测量一次体重(kg),数据如表 所示。问此减肥药是否有效?