两独立样本和配对样本T检验
2 2 n1 − 1 s1 + n2 − 1 s2 n1 + n2 − 2
2 σ12 = s2
1 1 + n1 n2
构建的两独立样本 T 检验的统计量为: 1 1 s2 n + n 1 2 此时,T 统计量服从自由度为n1 + n2 − 2个自由度的 t 分布。 第二种情况:当两总体方差未知且不相等时,两样本均值差的估计方差为:
两独立样本 T 检验 目的:利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。 检验前提: 1、样本来自的总体应服从或近似服从正态分布; 2、两样本相互独立,样本数可以不等。 两独立样本 T 检验的基本步骤: 一、提出假设 原假设������0 :������1 − ������2 = 0 备择假设������1 :������1 − ������2 ≠ 0 二、建立检验统计量
F 体重 Equal variances assumed Equal variances not assumed 14.722
Sig. .001
t 6.701 6.881
df 25 17.875
Sig. (2-taileห้องสมุดไป่ตู้) .000 .000
Mean Difference 10.956 10.956
Std. Error Difference 40.839 42.157
扩展案例:
独立样本T检验只能比较两个总体的均值是否相等,这要求自量恰好分成两组,但更多时 候,自变量的分类超过两类,或是自变量是连续时,这时我们要对自变量进行处理后,才能进 行T检验。 如, 要分析不同身高儿童的体重是否有显著差异, 此时做为分组变量的身高就是连续变量。 SPSS中使用cut point功能重新处理自变量。 例:现有一组儿童身高、体重的调查资料,数据见data08-01.sav,试分析身高高于1.55m的儿童 与身高不足155cm的儿童体重是否有显著差异。 SPSS实现过程:在cut point单选框中,输入1.55即可。
问卷调查分析: 影响学习成绩的因素分析: 学习成绩的综合评价:高考成绩、四六级成绩、是否有其他考试证书; 影响因素分析: 1、 个人因素:学习时间安排、学习效率、学习动力 2、 外部因素: 家庭因素:父母文化程度,家庭和睦,学生生活来源, 学校因素:社团活动、辅导班。
2 σ12 = 2 2 s1 s2 + n1 n2
t=
x1 − x2
构建的两独立样本 T 检验的统计量为: t= x1 − x2
2 2 s1 s2 + n1 n2
此时,T 统计量服从修正自由度的 t 分布,自由度为: f=
2 2 s2 s1 + n1 n2 2 2
2 2 s1 s2 n1 n2 n1 + n2 可见,两总体方差是否相等是决定 t 统计量的关键。所以在进行 T 检验之前,要先检验两 总体方差是否相等。SPSS 中使用方差齐性检验(Levene F 检验)判断两样本方差是否相等近 而间接推断两总体方差是否有显著差异。 三、计算检验统计量的观测值和 p 值 将样本数据代入,计算出 t 统计量的观测值和对应的概率 p 值。
Group Statistics v1 性 别 男 女 N 112 72 Mean 638.84 743.75 Std. Deviation 254.040 294.065 Std. Error Mean 24.005 34.656
v14a 个 人 目 前 每 月 生活 费 ( 元 )
Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper -185.490 -188.282 -24.332 -21.539
Paired Samples Test Paired Differences 95% Confidence Interval of the Difference Lower Upper 6238.359 11828.19
Mean Pair 1 2004年 人 均 国 内 生 产 总 值 ( 元 ) - 1995年 人 均 国 内 生产 总 值 ( 元 ) 9033.276
Std. Deviation 7347.70335
Std. Error Mean 1364.434
t 6.621
df 28
Sig. (2-tailed) .000
练习: 1、通过st2004.sav数据,检验东部地区和西部地区人均国民生产总值是否存在差异。 2、通过jobsat1.sav数据,分析收入(income1)低于3000元和收入高于3000元的职工的工作快 乐感是否有显著差异。
2 如果两样本来自的总体分别服从N μ1 , σ1 和 N μ2 , σ2 则两样本均值差x1 − x2 应服从均值 2 , 2 为������1 − ������2 、方差为σ12 的正态分布。 第一种情况: 当两总体方差未知且相等时, 采用合并的方差作为两个总体方差的估计, 为:
s2 = 则两样本均值差的估计方差为:
Group Statistics 身高 >= 1.55 < 1.55 N 14 13 Mean 50.57 39.62 Std. Deviation 5.445 2.329 Std. Error Mean 1.455 .646
体重
Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper 7.589 7.609 14.323 14.303
Std. Error Difference 1.635 1.592
配对样本T检验 配对样本与独立样本的区别, 独立样本中两个样本来自两个独立的总体,而配对样本实际上来自一个总体,是对同一个体前 后不同观测的分析,如同一组喝某品牌减肥茶的人群,比较他们喝茶前与喝茶后的体重是否有 显著差异。 SPSS实现过程: 菜单:Analyze -> Compare Means-> Paired Samples T test 例:利用st2004.sav,检验1995年人均国民生产总值与2004年人均国民生产总值是否存在显著 差异?
Paired Samples Statistics Mean Pair 1 2004年 人 均 国 内 生 产 总值 ( 元 ) 1995年 人 均 国 内 生 产 总值 ( 元 ) 14450.83 5417.5517 N 29 29 Std. Deviation 10920.59913 3634.65529 Std. Error Mean 2027.904 674.93854
Test Variable(s):待检验的变量(一般是定距或定序变量) Grouping Variable :分组变量(只能比较两个样本)
结果中比较有用的值:方差齐次性检验 F 统计量对应的 P 值和方差相等或不相等 T 统计量对 应的 P 值。 例:利用 pkustedu.sav 数据,检验不同性别学生的平均月生活费是否存在差异。
2
四、在给定显著性水平上,做出决策 首先,利用 F 统计量判断两总体方差是否相等,Levene F 检验的原假设为两独立总体方差 相等。概率 p<0.05 时,有充分理由拒绝原假设,说明方差不齐;否则,两样本方差无显著性 差异。 其次,将设定的显著性水平α与检验统计量的 p 值比较,如果 t 统计量的 p 值小于α,落入 拒绝域内,则我们有充分理由拒绝原假设,认为两总体均值有显著差异。 SPSS 实现过程: 菜单:Analyze -> Compare Means-> Independent Samples T test
F v14a 个 人 目 前 每 月 生 活费 ( 元 ) Equal variances assumed Equal variances not assumed .260
Sig. .611
t -2.569 -2.489
df 182 135.517
Sig. (2-tailed) .011 .014
Mean Difference -104.911 -104.911