当前位置：文档之家› 07假设检验基础

07假设检验基础

26/114
单样本资料的t检验
单样本资料的t检验（样本均数与总体均数比较的t 检验）实际上是推断该样本来自的总体均数µ 与已知的某一总体均数µ （常为理论值或标准值）有 0 无差别。在进行样本均数与总体均数比较中，需要建立一个统计量，根据样本所属不同总体，该统计量的分布也不同，由此作出相应的统计推断。
x 0 x 0 74.2 72.0 t 1.833 s 6.0 sx n 25
31/114
样本均数与总体均数比较
３.确定p值，判断是否应该拒绝
查t界值表，临界值t0.05/2,24=2.064,检验统计量
t=1.833<2.064不是小概率事件，对于一14
故0.005>P>0.002。按水准，拒绝H0, 接受H1, 差异有统计学意义。
两独立样本资料的t检验 independent samples t-test
适用于比较按完全随机设计而得到的两组资料，比较的目的是推断它们各自所代表的总体均数和是否相等。
两总体方差齐性，即总体方差相等。 1 2
假设检验基础
学习要点
为什么要进行假设检验？
假设检验的基本步骤
假设检验中的两类错误
假设检验与置信区间的关系
配对t检验与成组t检验对资料的要求
二项分布近似服从正态分布条件与分析方法
正态近似法分析泊松分布问题
2/114
统计资料处理统计描述（statistical description）
的脉搏数不同？
4/114
某医生测量了36名男性铅作业工人的血红蛋白含
量，均数为130.8g/L，标准差为25.74g/L，正常男性血红蛋白含量一般为140g/L, 铅作业工人的血红蛋白含量与正常人有无不同？
5/114
根据以往的资料得知A、B两校男生50米跑成绩的标准差分别为0.4秒和0.2秒。今从两校中分别抽测了25名和28名男生，其50米跑平均成绩分别为8.1秒和7.9秒。问两校男生50米跑水平是否相同？
统计推断（statistical inference）
1、参数估计estimation of parameter 2、假设检验 hypothesis testing
3/114
根据大量调查，已知健康成年男子脉搏均数为72次/分钟某医生在一山区随机测量了25名健康成年男子脉搏数，求得其均数为74.2次/分钟，标准差为6.5次/分钟，能否认为该山区成年男子的脉搏数与一般健康成年男子
8.0867 6.812 / 8 Sd 0.572 ( mol / g ) 8 1 0.851 t 4.208 0.572 / 8
查表，t0.005/2,7=4.029, t0.002/2, 7=4.785, 现t0.005/2,7<t< t0.002/2,7 ，
可认为不同饲料的大白鼠肝中维生素A含量有差别，正常饲料的
样本均数与总体均数比较
上述两个均数不等既可能是抽样误差所致，也有可能真是环境差异的影响，做假设检验。因为σ未知，可用t检验，检验过程如下：
1. 建立假设 H0：µ 0=72次/分，H1：µ≠µ0， =µ
检验水准α为0.05。
30/114
样本均数与总体均数比较
2. 计算统计量进行样本均数与总体均数比较的u检验，计算u值
第一步：提出一对检验假设，（1）无效假设null hypothesis, H0，又称零假设、原假设（2）备择假设 alternative hypothesis, H1 。
H0：假设两总体均数相等。（即样本与总体或样本与样本间的差异是由抽样误差引起的） H1：假设两总体均数不相等。（即两总体间存在本质差异）
成立。然后H0成立的条件下计算检验统计量，最后获得p
值来判断。
1、若p为小概率,则认为假设不成立； 2、若非小概率，则还不能认为假设不成立。该结论的正确性是冒着5%的错误风险。假设检验有自己独特的逻辑和统计学思维方式。
12/114
μ=173.2 173.83
176.5
13/114
假设检验的基本步骤
2、如果差别较大，则有可能不是抽样误差，而是来自的总体不
同。
10/114
假设检验是用来判断样本与样本，样本
与总体的差异是由抽样误差引起还是本
质差别造成的统计推断方法
11/114
假设检验理论基础
假设检验理论基础---利用小概率反证法思想，从问题的
对立面（H0）出发，间接判断要解决的问题（H1）是否
或者 H0:μ=μ0；H1:μ＜μ0 (单侧检验)
16/114
对于假设检验，需注意：
检验假设是针对总体而言，而不是针对样本；
H0与H1是相互对立、相互联系的，最后的结论是根据H0与H1做出的，两者缺一不可；
Ho是无效假设，假设常常是两个或多个总体参数相等、或之差为0、或….无效、或某资料服从某一特定分布；
样本均数与总体均数不等，有两种可能：由抽样误差所致两者来自不同的总体
9/114
本例目的是判断是否μ≠μ0，但直接判断很困难。但可以利用
反证法思想，从μ=μ0出发，间接的判断是否μ≠μ0. 假设μ=μ0 ，判断由于抽样误差造成 x 与μ0差别可能性有多大？ 1、如果 x 与μ0接近，其差别是抽样造成的可能性就很大；
d 2 d n n 1
2
710 (16 ) 2 12 7.91(k g) 12 1
t
| 1.33 | 7.91 12
0.58
（3）确定 P 值，作出推断结论 , =n-1=12-1=11，查附表 2 ， t 界值表，得单侧 t0.05/2 ， 11=2.201, 现 t=0.58 <t0.05/2，11=2.201,故P > 0.05。按α=0.05 水准，不拒绝H0, 差异无统计学意义。结论：故尚不能认为该减肥药有减肥效果。
43/114
23.01
（1）建立检验假设 H0：μ1 ＝μ2 ，即病人与健康人的尿中17酮类固醇的排出量相同 H1： μ1 ≠μ2 ，即病人与健康人的尿中17酮类固醇的排出量不同 α ＝0.05 （2）计算t值
14/114
某医生测量了36名男性铅作业工人的血红蛋白含
量，均数为130.8g/L，标准差为25.74g/L，正常男性血红蛋白含量一般为140g/L,铅作业工人的血红蛋白含量与正常人有无不同？
15/114
假设检验分为单、双侧检验
H0:μ=μ0；H1:μ≠μ0（双侧检验）或者：
H0:μ=μ0；H1:μ＞μ0 ；(单侧检验)
H1的内容直接反映了检验的单、双侧。
17/114
设定检验水准(size of test ) α常为0.05
第二步：选定统计方法，计算出统计量的大小。
根据资料的类型和特点，可分别选用t检验，则计算t值，
z检验则计算z值，或其他检验方法：秩和检验和卡方检验等。
x 0 t sx
18/114
2
2
，用t检验
t
X1 X 2 S X1X 2
S X1X 2
1 1 2 n1 n2 S Sc n n n n 2 1 1 2
2 c
2 (n1 1) S12 (n2 1) S 2 S c2 n1 n2 2
2
36/114
（1）建立检验假设 H0：μd=0, 即该减肥药无效； H1：μd≠0 ，即该减肥药有效。 α=0.05 （2）计算t值
本例n = 12, Σd = -16，Σd2 = 710，
差值的均数=Σd /n = -16/12 = -1.33(kg )
37/114
Sd
19/114
20/114
第三步：根据统计量的大小及其分布确定检验假设成立的
可能性P的大小并判断结果。
拒绝域
拒绝域
( t,z,F,x2 )
21/114
( t,z,F,x2 )
22/114
23/114
t / 2 ,
P值是指在H0成立的条件下，获得等于及大于（或小于）现有统计量的概率。当求得统计量后，一般可根据有关统计用表查得P值。例如t检验中， │t│≥ t / 2, ，则P≤α；│t│＜ t / 2 ,，则P ＞ α 。
38/114
某单位研究饮食中缺乏维生素E与肝中维生素A含
量的关系，将同种属的大白鼠按性别相同，年龄、
体重相近配成8对，并将每对中的两只大白鼠随
机分到正常饲料组和维生素E缺乏组，然后定期
将大白鼠杀死，测得其肝中维生素A的含量如表。
问不同饲料组的大白鼠肝中维生素A含量有无差
别？
39/114
40/114
42/114
n1 n2 2
例3.9 测得14名慢性支气管炎病人与11名健康人的尿
中17酮类固醇（mol/24h）排出量如下，试比较两组
人的尿中17酮类固醇的排出量有无不同。原始调查数据如下：
病
人X1：n=14;
10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60 健康人X2：n=11; 17.95 30.46 10.88 22.38 12.89 13.89 19.40 15.83 26.72 17.29
34/114
t检验的公式为：
| d d | | d 0 | |d | t Sd Sd n Sd n
例题设有12名志愿受试者服用某减肥药，服药前
和服药后一个疗程各测量一次体重(kg)，数据如表所示。问此减肥药是否有效？

e商务文档

07假设检验基础

相关文档推荐：