当前位置:文档之家› SPSS17.0在生物统计学中的应用实验指导-实验三、参数估计 实验四、t检验(可打印修改) (

SPSS17.0在生物统计学中的应用实验指导-实验三、参数估计 实验四、t检验(可打印修改) (

SPSS在生物统计学中的应用——实验指导手册实验三:参数估计一、实验目的与要求1.理解参数估计的概念2.熟悉区间估计的概念与操作方法二、实验原理1. 参数估计的定义●参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中的未知参数的方法。

它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。

●点估计(point estimation):又称定值估计,就是用实际样本指标数值作为总体参数的估计值。

当总体的性质不清楚时,我们须利用某一量数(样本统计量)作为估计数,以帮助了解总体的性质,如:样本平均数乃是总体平均数μ的估计数,当我们只用一个特定的值,亦即数线上的一个点,作为估计值以估计总体参数时,就叫做点估计。

✧点估计的数学方法很多,常见的有“矩估计法”、“最大似然估计法”、“最小二乘估计法”、“顺序统计量法”等。

✧点估计的精确程度用置信区间表示。

●区间估计(interval estimation)是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间。

其中这个给定的概率值称为置信度或置信水平(confidence level),这个建立起来的包含待估计函数的区间称为置信区间,指总体参数值落在样本统计值某一区内的概率●置信区间(confidence interval)是指在某一置信水平下,样本统计值与总体参数值间误差范围。

置信区间越大,置信水平越高。

划定置信区间的两个数值分别称为置信下限(lower confidence limit,lcl)和置信上限(upper confidence limit,ucl)2. 参数估计的基本原理统计分析的目的就是由样本推断总体,参数估计即是实现这一目的的方法之一。

3. 参数估计的方法参数估计的结果,常用点估计值(样本均值)+置信区间(置信下限、置信上限)来表示。

三、实验内容与步骤1. 单个总体均值的区间估计打开数据文件“描述性统计(100名女大学生的血清蛋白含量).sav”选择菜单【分析】—>【描述统计】—>【探索】”,打开图3.1探索(Explore)对话框。

♦从源变量清单中将“血清蛋白含量”变量移入因变量列表(Dependent List)框中。

图3.1 Explore对话框♦单击上图右方的“统计量”按钮打开“探索:统计量”对话框。

在设置均值的置信水平,如键入95%,完成后单击“继续”按钮回到主窗口。

图3.2 探索统计量设置窗口♦返回主窗口点击“确定”运行操作。

♦分析结果简单说明:表3.1 描述统计量Descriptive♦如上表显示。

从上表“ 95%Confidence Interval for Mean ”中可以得出,女大学生区间估计(置信度为95%)为:(72.4932,74.0848),其中lower Bound 表示置信区间的下限,Upper Bound表示置信区间的上限。

点估计是:73.2890。

说明女大学生血清蛋白含量总体水平有平百分之九十五的机率落72.4932g/L和74.0848g/L之间,总体水平低于72.4932g/L和高于74.0848g/L的可能性小于百分之五。

2.两个总体均值之差的区间估计【课本例14-2 】现有两组饲料喂猪的料重比数据如下。

饲料A 3.08 2.73 3.03 2.95 2.21 3.03 2.86 3.13 2.59 2.89饲料B 3.43 3.04 3.37 3.29 2.46 3.37 3.19 2.89 3.49要求对饲料A喂猪的平均料重比与饲料B喂猪的平均料重比之差进行区间估计,预设的置信度为95%。

♦打开SPSS,打开数据文件:“两组饲料喂猪的料重比数据.xls”。

♦计算两总体均值之差的区间估计,采用“独立样本T 检验”方法。

选择菜单“【分析】→【比较均值】→【独立样本T检验】”,图3.3 “独立样本T检验”菜单选择打开“独立样本T检验”对话框。

♦变量选择(1)从源变量清单中将“料重比”变量移入检验变量框中。

表示要求该变量的均值的区间估计。

从源变量清单中将“饲料”变量移入分组变量框中。

表示总体的分类变量。

图3.4 独立样本T检验对话框♦定义分组单击定义组按钮,打开Define Groups 对话框。

在Group1 中输入A,在Group2 中输入B(A表示饲料A,B表示饲料B)。

图3.5 定义组define groups设置窗口完成后单击“继续”按钮返回到“独立样本T检验”对话框。

♦确定置信水平单击“独立样本T检验”对话框右上方的“选项”按钮,弹出“独立样本T检验:选项”对话框,图3.6 “独立样本T检验:选项”对话框确定置信区间为95%,单击“继续”按钮返回到“独立样本T检验”对话框。

♦计算结果单击“确定”按钮,输出结果如下图所示。

(1)Group Statistics(分组统计量)表分别给出不同总体下的样本容量、均值、标准差和平均标准误。

从该表中可以看出,A饲料的平均增重为2.8500,B饲料的平均增重为3.1700。

表3.2 分组统计量(2)Independent Sample Test (独立样本T 检验)表表3.3 独立样本T检验结果结果说明,在当前抽样方式下,由样本均数差值-.32000(A饲料的平均增重2.8500与B饲料的平均增重3.1700之差。

)估计两种饲料喂猪的总体增重水平差值有95%的可能性在-.61399与-.02601之间。

T检验结果:⑴方差同质性检验:F值为0.275,其概率P=0.670>0.05,表明两未知总体方差差异不显著,可按照等方差假设进行检验。

(Levene检验统计量W服从自由度为 1=k-1, 2=N-k的F分布。

)⑵检验:t 值为-2.296,其概率P=0.035<0.05,表明B饲料增重效果显著地好于A饲料。

⑶置信区间为-.61399与-.02601,推断总体参数的差异为0的可能性很小。

实验四:t检验一、实验目的与要求1. 理解t 检验的基本原理和用途2. 熟练掌握T检验的SPSS操作3. 学会利用T检验方法解决身边的实际问题二、实验原理●有三类t 检验可用:✧独立样本t 检验(双样本t 检验)。

利用成组设计获取样本数据,比较一个变量中两组个案的均值,以推断两组个案所在总体的差异是否显著。

提供了每组的描述统计和Levene 方差相等性检验,以及相等和不等方差t 值和均值差分的95% 置信区间。

✧配对样本t 检验(相关t 检验)。

利用配对设计获取成对样本数据,比较单个组的两个变量的均值。

此检验还用于匹配对或个案控制研究设计。

输出包括检验变量的描述统计、变量之间的相关性、配对差分的描述统计、t 检验和95% 置信区间。

✧单样本t 检验。

将一个变量的均值与已知值或假设值进行比较。

检验变量的描述统计随t 检验一起显示。

检验变量的均值和假设的检验值之间差的95% 置信区间是缺省输出的一部分。

三、实验演示内容与步骤㈠独立样本t 检验在“实验三”内容里“2.两个总体均值之差的区间估计”中,已完成独立样本t检验的操作,大家可重复其操作步骤,以熟练操作步骤。

应记住独立样本t检验的数据结构,可在SPSS中创建数据文件,也可以在EXCEL中创建数据文件。

独立样本t检验的重点在于先根据方差齐性检验的结果,确定方差的同质性,再选择t检验的结果。

㈡配对样本t 检验【课本例5.7 】在研究饮食中缺乏维生素E 与肝中维生素A 的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和维生素E 缺乏组,然后将试验动物杀死,测定其肝中的维生素A 的含量,其结果如下表,试检验两组饲料对试验动物肝脏中维生素A 含量的作用是否有显著差异。

正常饲料组35502000300039503800375034503050维生素E 缺乏组24502400180032003250270025001750♦打开SPSS,打开数据文件:“课本5.7配对设计资料.xls”。

♦选择菜单“【分析】→【比较均值】→【配对样本T检验】”,弹出“配对样本T检验”对话框,图4.1 “配对样本T检验”菜单选择图4.2 “配对样本T检验”对话框Paired-Samples T Tes如图4.2所示,将两个配对变量移入右边的成对变量Pair Variables列表框中。

移动的方法是先选择其中的一个配对变量,再选择第二个配对变量,接着单击中间的箭头按钮。

♦选项按钮的用于设置置信度选项,这里保持系统默认的95%♦在主对话框中单击ok按钮,执行操作。

♦在输出视图中看分析结果表4.1 两组饲料饲养后样本肝中的维生素A 的含量的描述统计量表3.4给出了两组饲料饲养后样本肝中的维生素A 的含量的均值、标准差、均值标准误差。

表3.5给出了两组饲料饲养后样本肝中的维生素A 的含量的相关系数。

表4.3 配对样本t检验结果表4.3给出了配对样本t检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的95%置信度下的区间估计。

当然也给出了最为重要的t统计量和p值。

✧结果显示p=0.004<0.01,表明,维生素E缺乏组肝中的维生素A 的含量极显著地低于正常饲料组,造成肝中的维生素A 的含量低的原因是饲料中缺乏维生素E。

✧置信区间为355.821与1269.179,推断总体参数的差异为0的可能性极小。

㈢单样本t 检验(单个总体均值的假设检验)【课本例5.1 】按照规定,100g罐头番茄汁中的平均维生素C含量不得少于21mg/g,现从工厂的产品中随机抽取17个罐头,其100g番茄汁中的维生素C含量记录如下:维生素c含1625212023211915132317202918221622量,问这批罐头是否符合规定要求。

♦打开SPSS,打开数据文件:“课本例题5.1单样本t检验资料.xls”。

♦判断检验类型该例属于“小样本、总体标准差σ未知。

假设形式为:H0:μ=μ0,H1 :μ≠μ0♦判断分布类型因不知道番茄汁中的平均维生素C含量是否服从正态分布,先按照“实验二描述性统计:频率”的方法,对数据进行描述性统计。

选择菜单“【分析】—>【描述统计】—>【频率】”。

弹出如图 2.7 所示“频率”对话框,在“频率:统计量”、“频率:图表”、“频率:格式”三个对话框中选择“均值”、“标准差”、“方差”、“均值的标准误”、“偏度”、“峰度”、“直方图-带正态曲线”后,点击【继续】继续返回“频率”对话框,点击【确定】后,在弹出的“结果输出”视图中显示上述各项选择的对应结果如下:表4.4 描述统计:频率从表4.4和图4.3可知,茄汁中的平均维生素C含量是基本服从正态分布的,可以采用基于正态分布的T检验进行分析。

相关主题