SPSS最适用的统计学方法(X2检验和T检验)1.SPSS的启动(1)在windows[开始]→[程序]→[spss20],进入SPSS for Windows对话框,2.创建一个数据文件三个步骤:(1)选择菜单【文件】→【新建】→【数据】新建一个数据文件。
(2)单击左下角【变量视窗】标签进入变量视图界面,定义每个变量类型。
(3)单击【数据视窗】标签进入数据视窗界面,录入数据库单元格内。
3.读取外部数据当前版本的SPSS可以很容易地读取Excel数据,步骤如下:(1)按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择数据文件,如图所示。
图 Open File对话框(2)选择要打开的Excel文件,单击“打开”按钮,调出打开Excel数据源对话框,如图所示。
对话框中各选项的意义如下:工作表下拉列表:选择被读取数据所在的Excel工作表。
范围输入框:用于限制被读取数据在Excel工作表中的位置。
图 Open Excel Data Source对话框4.数据编辑在SPSS中,对数据进行基本编辑操作的功能集中在Edit和Data菜单中。
5.SPSS数据的保存SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。
保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。
在数据保存对话框(如图所示)中根据不同要求进行SPSS数据保存。
图 SPSS数据的保存5. 数据分析在SPSS中,数据整理的功能主要集中在【数据】和【分析】两个主菜单下6.语言切换:编辑(E)—选项(N)--用户界面-语言--简体中文第六章:描述性统计分析(X2检验)完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。
6.1.1界面说明界面如下所示:分析—描述统计—频率用于定义需要计算的其他描述统计量。
现将各部分解释如下:Percentile Values复选框组定义需要输出的百分位数,可计算1.四分位数(Quartiles)、2.每隔指定百分位输出当前百分位数(Cut points for equal groups)3.直接指定某个百分位数(Percentiles),如直接和o Central tendency复选框组用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。
o Dispersion复选框组用于定义描述离散趋势的一组指标:标准差、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误。
o Distribution复选框组用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。
o Values are group midpoints复选框当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
【Charts钮】弹出Charts对话框,用于设定所做的统计图。
o Chart type单选钮组定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。
例:许根友要求统计的。
丙氨酸氨基转移酶(ALT)调查,男性244人有50人异常,女性255人有6人结果异常,结果是否有统计学意义。
X2卡方值是,P<6.1.2 分析实例例某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、和(卫统第三版p233 题)。
解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为X,具体解法如下:1. Analyze==>Descriptive Statistics==>Frequencies (分析—描述统计—频率--)2. Variables(变量)框:选入X3. 单击Statistics(统计量)钮:4. 选中Mean(均数)、(标准差)、Median(中位数)复选框5. 单击Percentiles(百分位数):输入:单击Add(添加):输入:单击Add:6. 单击Continue钮7. 单击Charts(图表)钮:8. 选中Bar charts (条形图)9. 单击Continue钮10.单击OK得出结果后手工计算出CV。
6.1.3 结果解释上题除直方图外的的输出结果如下:Frequencies统计量XN有效101缺失0均值中值标准差.86162百分位数25最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=,中位数Median=,标准差STD=,=,=。
系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency 为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent 为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。
§ Descriptives过程最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=,中位数Median=,标准差STD=,=,=。
X频率百分比有效百分比累积百分比有效1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 2 122211121112111211系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency 为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent 为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。
Descriptives过程(描述性统计分析)以上面的题为例,分析—统计描述—描述—选项—均值、标准差、方差、最小值、最大值、均值的标准误、变量例表---继续---确定。
§ Crosstabs过程(交叉表)Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。
在分析时可以产生二维至n维列联表,并计算相应的百分数指标。
统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2)。
如果安装了相应模块,还可计算n维列联表的M-H确切概率(Fisher's Exact Test)值。
6.4.2 分析实例例某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗行变量、列变量和指示每个格子中频数的变量,然后用Weight Cases对话框指定频数变量,最后调用Crosstabs过程进行X2检验。
假设三个变量分别名为R、C和W,则数据也可以这样在变量视图—药物的值中标签(1=呋喃硝胺,2=甲氰咪胍)在变量视图—治疗情况、药物、X的类型全为数值一、1. Data==>Weight Cases (数据==>加权个案)2. Weight Cases by单选框:选中加权个案单选框3. Freqency Variable(频率变量):选入X4. 单击OK钮(单击确定按钮)二、5. Analyze==>Descriptive Statistics==>Crosstabs (分析==>描述统计==>交叉表)6. Rows(行)框:选入药物、7. Columns(列)框:选入治疗情况8. Statistics(统计量)钮:Chi-square(卡方)复选框:选中:单击Continue(继续)钮9. 单击OK(确定)钮6.4.3 结果解释上题的结果如下:首先是处理记录缺失值情况报告,可见126例均为有效值。
药物* 治疗情况交叉制表计数治疗情况合计愈合未愈合呋喃硝胺54862药物甲氰咪胍442064合计9828126上面为列出的四格交叉表,实际使用时可以在其中加入变量值标签,使看起来更清楚。
卡方检验精确 Sig.(双侧)精确Sig.(单侧)值df渐进 Sig. (双侧)Pearson 卡方1.013连续校正b1.024似然比1.012Fisher 的精确检验.018.011线性和线性组合1.014有效案例中的 N126上表给出了一堆检验结果,从左到右为:检验统计量值(Value)、自由度(df)、双侧近似概率、双侧精确概率(Exact 、单侧精确概率(Exact ;从上到下为:Pearson卡方(Pearson Chi-Square即常用的卡方检验)、连续性校正的卡方值(Continuity Correction)、对数似然比方法计算的卡方(Likelihood Ratio)、Fisher's确切概率法(Fisher's Exact Test)、线性相关的卡方值(Linear by Linear Association)、有效记录数(N of Valid Cases)。
另外,Continuity Correction和Pearson卡方值处分别标注有a和b,表格下方为相应的注解:a.只为2*2表计算。
%个格子的期望频数小于5,最小的期望频数为。
因此,这里无须校正,直接采用第一行的检验结果,即X2=,P=。
如何选用上面众多的统计结果令许多初学者头痛,实际上我们只需要在未校正卡方、校正卡方和确切概率法三种方法之间选择即可,其余的对我们而言用处不大,可以视而不见。
例:许根友要求统计的。
丙氨酸氨基转移酶(ALT)调查,男性244人有50人异常,女性255人有6人结果异常,结果是否有统计学意义。
假设三个变量检查情况、性别、数量分别名为R、C和W,检查情况中 1=阳性,2=阴性,性别中 1=男,2=女一、1. Data==>Weight Cases (数据==>加权个案)2. Weight Cases by单选框:选中加权个案单选框3. Freqency Variable(频率变量):选入W4. 单击OK钮(单击确定按钮)5. Analyze==>Descriptive Statistics==>Crosstabs (分析==>描述统计==>交叉表)6. Rows(行)框:选入男女、7. Columns(列)框:阳性、阴性8. Statistics(统计量)钮:Chi-square(卡方)复选框:选中,单击Continue(继续)钮,单元格---百分比---行9. 单击OK(确定)钮看第一行: X2卡方值是,P<,有显著性意义。
如果,单元格---百分比---行第七章均数间的比较(T—检验)Compare Means(均值比较)使用频率最高过程对准备比较的各组计算描述指标,进行预分析,也可直接比较。