当前位置:文档之家› 最新SPSS中T检验的应用1

最新SPSS中T检验的应用1

S P S S中T检验的应用1本文指在简述SPSS中的T检验,主要说明了T检验的原理和应用,及使用范围。

和SPSS中的基本操作。

T检验是检验样本的均值和给定的均值是否存在显著性差异。

T检验分为3类:单样本T检验、两独立样本T检验和两配对样本T检验。

关键词:T检验、SPSS、显著性水平、统计量、概率P-值、自由度、线性相关、置信区间、零假设。

目录一、单样本T检验 (3)1.单样本T检验的目的。

(3)2.单样本T检验的基本步骤。

(3)3.单样本T检验的应用举例 (4)三、两独立样本T检验 (5)1.两独立样本T检验的目的 (5)2.两独立样本T检验的基本步骤。

(5)3.两独立样本T检验的应用举例 (7)三.两配对样本T检验 (9)1.两配对样本T检验的目的 (9)2.两配对样本T检验的基本步骤。

(9)3.两配对样本T检验的应用举例。

(9)四、参考文献。

(11)一、单样本T 检验1.单样本T 检验的目的。

单样本t 检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与制定的检验值之间存在显著性差异。

它是对总体均值的假设检验。

2.单样本T 检验的基本步骤。

⑴.提出原假设。

单样本T 检验的原假设0H 为:总体均值与检验值之间不存在显著差异,表述为0H :0μμ=。

μ为总体均值,0μ为检验值。

⑵.选择检验统计量。

当总体分布为正态分布),(2σμN 时,样本均值的抽样分布仍为正态分布,该正态分布的均值为μ,方差为2σ/n ,即),(~2nN X σμ式中,μ为总体均值,当原假设成立时,0μμ=;2σ为总体方差;n 为样本数。

总体分布近似服从正态分布时。

通常总体方差是未知的,此时可以用样本方差2S 替代,得到的检验统计量为t 统计量,数学定义为:nS X t 2μ-=①式中,t 统计量服从n-1自由度为t 分布。

单样本t 检验的检验统计量即为t 统计量。

当认为原假设成立时μ用0μ代入。

⑶计算检验统计量观测值和概率P-值该步目的是甲酸检验统计量的观测值和相应的概率P-值。

SPSS将自动将样μ、样本方差、样本数代入式①中,计算出t统计量的观测值和对应本均值、的概率P-值。

⑷给定显著性水平α,并作出决策。

如果概率P-值小于显著性水平α,则应拒绝原假设,认为总体均值与检验值之间存在显著差异;反之,如果概率P-值大于显著性水平α,则不应拒绝原假设,认为总体均值与检验值之间无显著差异。

3.单样本T检验的应用举例案例:利用住房状况问卷调查数据,推断家庭人均住房面积的平均值是否为20平方米。

数据名字为“住房状况调查.sav”推断家庭人均住房面积的平均值是否为20平方米。

由于该问题设计的是单个总体,且要进行总体均值比较,同时家庭人均住房面积的总体可近似认为服从正态分布,因此,可采用单样本T检验来进行分析。

SPSS单样本T检验的基本操作步骤是:⑴选择菜单:【Analyze】→【Compare Means】→【One- Samples T Test】出现如图所示的窗口。

图1⑵选择待检验的变量到【Test Variables】,在【Test Value】框中输入检验值。

⑶按Option按钮定义其他选项,出现图2所示的窗口。

Option选项用来指定缺失值的处理方法。

另外,还可以输出默认95%的置信区间。

图2至此,SPSS将自动计算t同嘉陵和对应的概率P-值。

分析结果如表3和表4所示。

人均住房面积的基本描述统计结果表3人均住房面积单样本T 检验结果表4由表3可知,2993个家庭的人均住房面积的平均值为22平方米,标准差为12.7平方米,均值标准误差为(nS)为0.23.表4中,第二列是t 统计量的观测值为8.64;第三列是自由度为2992;第四列是t 统计量观测值的双尾概率P-值;第五列是样本均值与检验值的差,即t 统计量的分子部分;第六列和第七列是总体均值与原假设值差的95%的置信区间,为(1.55,2.46),由此计算出总体均值的95%的置信区间为(21.55,22.46)平方米。

该问题应采用双尾检验,因此比较α和p 。

如果α给定为0.05,由于p 小于α,因此应拒绝原假设,认为家庭人均住房面积的平均值与20平方米由显著差异。

95%的置信区间告诉我们有95%的把握认为家庭人均诸方面均值在21.55~22.46平方米之间。

三、两独立样本T 检验1.两独立样本T 检验的目的两独立样本T 检验的目的是利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。

2.两独立样本T 检验的基本步骤。

⑴提出零假设两独立样本T 检验的原假设0H 为:两总体均值无显著差异。

表述为: 0H :021=-μμ1μ,2μ分别为第一个和第二个总体的均值。

⑵选择检验统计量对两总体均值差的推断是建立在来自两个总体样本均值差的基础之上的,也就是希望利用两组样本均值的差去估计量总体均值的差。

因此,应关注两样本均值的抽样分布。

当两总体分布分别为),(211σμN 和),(222σμN 时,两样本均值差的抽样分布仍为正态分布,该正态分布的均值为21μμ-,方差为212σ。

在不同的情况下,212σ有不同的计算方式。

第一种情况:当两总体方差未知且相等,即21σσ=时,采用合并的方差作为两个总体方差的估计,数学定义为2)1()1(212222112-+-+-=n n S n S n Sp式中,21S ,22S 分别为第一组和第二组样本的方差;1n ,2n 分别为第一组和第二组样本的样本数。

此时两样本均值差的抽样分布的方差212σ为2212212n Sp n Sp +=σ 第二种情况:当两总体方差未知且不相等,即21σσ≠时,分别采用各自的方差,此时两样本均值差的抽样分布的方差212σ为:2212212n S n S +=σ ② 于是,两总体均值差检验的检验统计量为t 统计量,数学定义为: 2122121)(σμμ---=X X t ③在第一种情况下,t 统计量服从221-+n n 个自由度的t 分布;在第二种情况下,服从修正自由度的t 分布,修正的自由度定义为2222121212222121)()()(n nS n n S n S n S f ++= ⑶计算检验统计量观测值和概率P-值。

该步的目的是计算F 统计量和t 统计量的观测值以及相应的概率P-值。

SPSS 将自动依据单因素方差分析的方法计算F 统计量和概率P-值,并自动将两组样本的均值、样本数、抽样分布方差等代入式③中,计算出t 统计量的观测值和对应的概率P-值。

⑷给定显著性水平α,并作出决策。

第一步,利用F 检验判断两总体的方差是否相等,并据此决定抽样分布方差和自语度的计算方法和计算结果。

如果F 检验统计量的概率P-值小于显著想水平α,则应拒绝原假设,认为两总体方差没有显著差异,应选择式②和式③计算出的结果:反之,若果概率P-值大于显著性水平α则不应拒绝原假设,认为两总体方差无显著差异。

第二步,体用t 检验判断两总体均值是否存在显著差异。

如果t 检验统计量的概率P-值小于显著性水平α,则应拒绝原假设,认为两总体均值有显著性差异;反之,如果概率P-值大于显著性水平α,则不应拒绝原假设,认为两总体均值无显著差异。

3.两独立样本T 检验的应用举例原假设是:本市户口和外地户口的家庭收入人均值无显著性差异,即0:210=-μμH⑴选择菜单【Analyze 】 → 【Compare Means 】 → 【Indendent- Samples T Test 】 于是出现如图所示的窗口。

图3⑵选择检验变量到【Test Variables (s )】框中。

⑶选择总体标识变量到【Grouping Variables 】框中。

⑷按Define Groups按钮定义两总体的标识值,显示如图4所示的窗口。

其中【Use Specified Values】表示分别输入对应两个不同总体的标志值;【Cut Point】框中应输入一个数字,大于等于该值的对应另一个总体。

图4⑸两独立样本t检验的Option选项含义与单样本t检验的相同。

分析结果如图5所示本市户口和外地户口家庭人均住房面积的基本描述统计Group Statistics户口状况N MeanStd.DeviationStd. ErrorMean人均面积本市户口2825 21.725812.17539 .22907外地户口168 26.716518.96748 1.46337图5由图5可以看出,本市户口和外地户口的家庭人均住房面积的样本平均值有一定的差距。

通过检验应推断这种差异是抽样误差造成的还是系统性的。

本市户口和外地户口家庭人均住房面积两独立样本t检验结果图6图6是本市户口和外地户口家庭人均住房面积的均值检验结果。

分析结论应通过两步完成。

第一步,两总体方差是否相等的F 检验。

这里,该检验的F 统计量的观测值为65.469,对应的概率P-值为0.00.如果显著性水平α为0.05,由于概率P-值小于0.05,可以认为两总体的方差有显著差异。

第二步,两总体均值的检验。

在第一步中,由于两总体方差有显著差,因此应看第二行T 检验的结果。

其中T 统计量的观测值为-3.369,对应的双尾开率P-值为0.001.如果显著性水平为0.05,由于概率P-值小于0.05,因此认为两总体的均值有显著差异,即本市户口和外地户口的家庭人均住房面积的平均值存在显著差异。

图6中的第七列和第八列分别为T 统计量的分子和分母;第九列和第十列为两总体差的95%置信区间的上限和下限。

三.两配对样本T 检验1.两配对样本T 检验的目的两配对样本T 检验的目的是利用来自两个不同总体的配对样本,推断两个总体的均值是否存在显著差异。

配对样本通常有两个特征:第一,两组样本的样本数相同;第二,两组样本观测值的先后顺序是一一对应的,不能随意更改。

2.两配对样本T 检验的基本步骤。

⑴提出原假设两配对样本T 检验的原假设0H 为:两总体均值无显著差异,表述为0H :021=-μμ。

1μ,2μ分别为第一个和第二个总体的均值。

⑵选择统计量。

两配对样本T检验采用T统计量。

其思路是:首先,对两组样本分别计算出每对观测值的差值得到差值样本;然后,体用差值样本,通过对其均值是否显著为0的检验来推断两总体均值的差是否显著为0.如果差值样本的均值与0有显著差异,则可以认为两总体的均值有显著差异;反之,如果差值系列的均值与0无显著差异。

则可以认为两总体均值不存在显著差异。

⑶计算检验统计量观测值和概率P-值SPSS将计算两组样本的差值,并将相应数据代入式①,计算出T统计量的观测值和对应的概率P-值。

⑷给定显著水平α,并作出决策。

给定显著水平α,与检验统计量的概率P-值作比较。

相关主题