当前位置:文档之家› 实验指导一:spss简介(数据与画图)

实验指导一:spss简介(数据与画图)

实验一一、实验目的:1.掌握SPSS的数据编辑功能利用SPSS的数据编辑器窗口,可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等一般性操作,还可以对数据文件中的数据进行顺序、转置、拆分、聚合、加权等操作,对多个数据文件可以根据变量或个案进行合并。

可以根据需要把将要分析的变量集中到一个集合中,打开时指定打开该集合,而不必打开整个数据文件。

2.掌握表格的生成和编辑利用SPSS可以生成数十种风格的表格,利用编辑窗口或监视器可以编辑所要生成的表格。

在SPSS的高级版本中,统计成果多被归纳为表格或图形的形式。

3.掌握图形的生成和编辑利用SPSS可以生成数十种基本图形和交互式图形。

其中基本图形包括条形图、线形图、面积图、圆饼图、高低图、帕雷托图、控制图、箱形图、误差条形图、散点图、直方图、ROC曲线图、P-P概率图、Q—Q图、序列图和时间序列图等。

交互式图形比基本图形更漂亮,可有不同风格的2D、3D图形。

交互式图形包括条形交互作用图、点形交互作用图、线形交互作用图、带形交互作用图、圆形交互作用图、箱形交互作用图、误差条形交互作用图、直方交互作用图和散点交互作用图等。

4.会用SPSS的简单统计功能(1)摘要性分析摘要性分析是对原始数据进行描述性分析,是统计工作的出发点。

统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。

SPSS统计软件通过调用摘要性分析,可完成均数、标准差、标准误差等指标的计算,对于计数和一些等级资料,可完成构成比率等指标的计算和2检验。

SPSS的摘要性分析包括以下几个过程:1) Frequencies(频数)过程调用此过程可进行频数分布表的分析。

频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。

2) Descriptives(描述)过程调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存人数据库。

3) Explore(探索)过程调用此过程可对变量进行更为深入详尽的描述性统计分析,即探索性统计。

它是在一般描述性统计指标的基础上,增加有关数据其他特征文字与图形描述,有助于思考对数据进行分析的方案。

二、实验指导(一)SPSS的启动与主窗口1.SPSS的启动SPSS安装完毕后,系统会自动在Windows(窗口)菜单中创建快捷方式。

单击Windows 的“开始”按钮,在“程序”菜单的SPSS for Windows中找到SPSS l3.0 for Windows并单击,即可启动SPSS。

2.SPSS数据编辑窗口SPSS主界面有两个,一个是SPSS数据编辑窗口,另一个是SPSS结果输出窗口。

SPSS的数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名称栏、内容区、窗口切换标签页和状态栏组成(如图12-1所示)。

图12-1数据编辑窗口(1)标题栏中显示编辑的数据文件名称。

(2)菜单栏中列出了SPSS 的命令菜单,每个菜单对应一组相应的功能。

其中File (文件)是对SPSS 文件的操作;Edit (编辑)是SPSS 文件的编辑菜单;View (视图)是用户界面设置菜单;Data(数据)是数据文件的建立和编辑菜单;Transform (转换)是数据基本处理菜单;Analyze (分析)是统计分析菜单,主要统计功能都集中在该菜单中;Graphs (图表)是统计图形菜单;Utilities (工具)是相关应用和设置菜单;Windows (窗口)是SPSS 各窗口切换菜单;Help (帮助)是SPSS 帮助菜单。

(3)工具栏中列出了一些常用的快捷按钮。

(4)编辑栏中可以输入数据。

(5)变量名称栏中列出了该编辑文件中所含有的变量名称SPSS 自动命名变量名称为var0001、var0002等。

(6)内容区列出了各个个案在变量中的取值。

SPSS 中每一行表示一个个案。

内容区的最左边是行的标号。

该窗口下方有两个标签:Data View (数据视图) 和Variable View (变量视图)。

这两种视图提供了一种类似于电子表格的方法,用以产生和编辑SPSS 数据文件中的变量和数据。

Data View (数据视图)显示具体的数据内容,可以输入编辑数据。

Variable View (变量视图),可以看到它显示的是数据文件中变量的定义,包括变量的名称、类型、宽度、小数点位数等(如图12-2所示)。

此时可以根据需要对数据文件中的变量进行增删或修改。

数据视图和变量视图可看作是数据编辑窗口的两个方面。

图12-2变量视图3.SPSS结果输出窗口结果输出窗口是另一个十分重要的窗口,它在完成Analyze(分析)菜单中的某个统计分析过程后,就会将分析结果呈现出来(如图12-3所示)。

只有当完成一项处理后,才在该窗口显示处理过程和计算结果。

图12-3结果输出窗口结果输出窗口包括标题栏、菜单栏、工具栏、索引区、内容区以及状态栏6个部分。

结果输出窗口第一次出现时标题名称是Outputl.spo-SPSS Viewer,第二次出现时标题名称是Output2.spo-SPSS Viewer,依次类推。

菜单栏显示了结果输出窗口的主菜单,菜单栏共有File(文件)、Edit(编辑)、View(视图)、Data(数据)、Transform(转换)、Insert(插入)、Format(格式)、Analyze(分析)、Graphs(图表)、Utilities(工具)、Windows(窗口)、Help(帮助)12个选项。

与数据编辑窗口相比,结果输出窗口的主菜单增加了Insert(插入)、Format(格式)两个菜单选项。

Insert (插入)菜单主要是插入某个输出的辅助选项,如标题、文本等。

Format(格式)菜单主要是对输出的内容进行格式化,索引区显示结果输出内容包含哪些部分。

内容区显示了具体的统计分析的各个方面的结果。

(二)SPSS的数据处理1.SPSS录入数据(1)将数据录入成SPSS的数据文件。

SPSS也可以读入其他格式的数据文件。

(2)对数据文件进行必要的编辑。

(3)利用SPSS的统计功能对编辑好的数据文件进行统计处理。

(4)调整SPSS输出的统计结果(包括报表、图形和文本等)。

(5)将结果输出、存盘、打印等。

例12-1 某高校一次运动会上大一到大三年级学生铁饼标枪成绩(如表12-1所示),现将数据文件进行统计处理。

2 spss操作步骤打开SPSS的数据编辑器。

通常我们先要定义变量的属性,然后再输入数据。

在数据编辑窗口的左下端,有两个页标签:Date View(数据视图)、Variable View(变量视图)。

我们可以通过鼠标单击方便地在两个窗口之间切换。

在录入数据之前,应该对数据的统计处理有一个基本的框架:计算哪些变量、做何种统计、生成哪种统计图等。

在本例中,只做一般性的描述性统计处理,即求各年级男女选手的成绩平均值、标准差、最大值、最小值等。

首先单击Variable View (变量视图)页按钮,进入图中所示的变量属性窗口。

可以像输入数据一样定义一些变量的属性,如变量名、变量的长度、变量标签、变量的缺失值等。

对于某些变量属性还会弹出对象框,可以进行进一步的定义工作。

然后按照表12-1的结构输入数据即可(如图12-4所示)。

图12-4 某高校一次运动会上大一到大三年级学生铁饼标枪成绩(三)数据描述性统计分析SPSS 基本统计分析是进行其他统计分析的基础和前提。

通过基本统计方法,可以对要分析数据的总体特征有比较准确的把握,从而可以选择其他更为深入的统计分析方法。

本节内容主要包括频数分析、描述性分析、探索分析、基本统计报表制作。

我们主要讲述了如何在SPSS 中进行的频数分析、描述性分析和基本统计报表制作等操作。

1频数分析频数分析的基本原理频数分析(Frequencies )过程是描述性统计分析中最常用的方法之一,它不仅可以产生详细的频数分析表,还可以按要求给出平均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差、四分位数、十分位数、百分位数。

频数分析中涉及到的有关描述性统计量的理论知识,在本书前几章中已经进行了详细的论述,现只对Kurtosis (峰度)和Skewness(偏度)作以解释。

峰度是描述某变量所有取值分布形态陡缓程度的统计量。

这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同,峰度大于0表示比正态分布高峰更加陡峭,为尖顶峰。

峰度小于0表示比正态分布的高峰要平坦,为平顶峰。

峰度的计算公式如下:3/)(11144---=∑=ni i SD x x n Kurtosis (12-1)偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。

具体的计算公式如下:∑=--=ni i SD x x n Skewness 133/)(11 (12-2)这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度X 相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边:偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。

而偏度的绝对值数值越大表示分布形态的偏斜程度越大。

求Quartiles (四分位数)、Deciles (十分位数) 和Percentiles (百分位数) (1)Quartiles (四分位数)基本原理 四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。

其中,Q3到Q1之间的距离的一半又称为四分位差记为Q 。

四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。

(2)Deciles (十分位数) 基本原理 十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为Dl ,D2,……,D9,表示10%的数据落在Dl 下,20%的数据落在D2下,……,90%落在D9下。

(3)Deciles (百分位数) 基本原理 百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,……,P99,表示1%的数据落在P1下,2%的数据落在P2下,……,99%落在P99下。

SPSS 实现过程例12-2 某公司20名员工的收入中的“基本工资”变量为例,求“基本工资”的均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差(如表12-2所示)。

相关主题