当前位置：文档之家› 实验指导一：spss简介(数据与画图)

实验指导一：spss简介(数据与画图)

实验一一、实验目的：1．掌握SPSS的数据编辑功能利用SPSS的数据编辑器窗口，可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等一般性操作，还可以对数据文件中的数据进行顺序、转置、拆分、聚合、加权等操作，对多个数据文件可以根据变量或个案进行合并。

可以根据需要把将要分析的变量集中到一个集合中，打开时指定打开该集合，而不必打开整个数据文件。

2．掌握表格的生成和编辑利用SPSS可以生成数十种风格的表格，利用编辑窗口或监视器可以编辑所要生成的表格。

在SPSS的高级版本中，统计成果多被归纳为表格或图形的形式。

3．掌握图形的生成和编辑利用SPSS可以生成数十种基本图形和交互式图形。

其中基本图形包括条形图、线形图、面积图、圆饼图、高低图、帕雷托图、控制图、箱形图、误差条形图、散点图、直方图、ROC曲线图、P-P概率图、Q—Q图、序列图和时间序列图等。

交互式图形比基本图形更漂亮，可有不同风格的2D、3D图形。

交互式图形包括条形交互作用图、点形交互作用图、线形交互作用图、带形交互作用图、圆形交互作用图、箱形交互作用图、误差条形交互作用图、直方交互作用图和散点交互作用图等。

4．会用SPSS的简单统计功能（1）摘要性分析摘要性分析是对原始数据进行描述性分析，是统计工作的出发点。

统计学的一系列基本描述指标，不仅让人了解资料的特征，而且可启发人们对之作进一步的深入分析。

SPSS统计软件通过调用摘要性分析，可完成均数、标准差、标准误差等指标的计算，对于计数和一些等级资料，可完成构成比率等指标的计算和2检验。

SPSS的摘要性分析包括以下几个过程：1) Frequencies（频数）过程调用此过程可进行频数分布表的分析。

频数分布表是描述性统计中最常用的方法之一，此外还可对数据的分布趋势进行初步分析。

2) Descriptives（描述）过程调用此过程可对变量进行描述性统计分析，计算并列出一系列相应的统计指标，且可将原始数据转换成标准Z分值并存人数据库。

3) Explore（探索）过程调用此过程可对变量进行更为深入详尽的描述性统计分析，即探索性统计。

它是在一般描述性统计指标的基础上，增加有关数据其他特征文字与图形描述，有助于思考对数据进行分析的方案。

二、实验指导（一）SPSS的启动与主窗口1．SPSS的启动SPSS安装完毕后，系统会自动在Windows（窗口）菜单中创建快捷方式。

单击Windows 的“开始”按钮，在“程序”菜单的SPSS for Windows中找到SPSS l3.0 for Windows并单击，即可启动SPSS。

2．SPSS数据编辑窗口SPSS主界面有两个，一个是SPSS数据编辑窗口，另一个是SPSS结果输出窗口。

SPSS的数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名称栏、内容区、窗口切换标签页和状态栏组成（如图12-1所示）。

图12-1数据编辑窗口（1）标题栏中显示编辑的数据文件名称。

（2）菜单栏中列出了SPSS 的命令菜单，每个菜单对应一组相应的功能。

其中File （文件）是对SPSS 文件的操作；Edit （编辑）是SPSS 文件的编辑菜单；View （视图）是用户界面设置菜单；Data（数据）是数据文件的建立和编辑菜单；Transform （转换）是数据基本处理菜单；Analyze （分析）是统计分析菜单，主要统计功能都集中在该菜单中；Graphs （图表）是统计图形菜单；Utilities （工具）是相关应用和设置菜单；Windows （窗口）是SPSS 各窗口切换菜单；Help （帮助）是SPSS 帮助菜单。

（3）工具栏中列出了一些常用的快捷按钮。

（4）编辑栏中可以输入数据。

（5）变量名称栏中列出了该编辑文件中所含有的变量名称SPSS 自动命名变量名称为var0001、var0002等。

（6）内容区列出了各个个案在变量中的取值。

SPSS 中每一行表示一个个案。

内容区的最左边是行的标号。

该窗口下方有两个标签：Data View （数据视图）和Variable View （变量视图）。

这两种视图提供了一种类似于电子表格的方法，用以产生和编辑SPSS 数据文件中的变量和数据。

Data View （数据视图）显示具体的数据内容，可以输入编辑数据。

Variable View （变量视图），可以看到它显示的是数据文件中变量的定义，包括变量的名称、类型、宽度、小数点位数等（如图12-2所示）。

此时可以根据需要对数据文件中的变量进行增删或修改。

数据视图和变量视图可看作是数据编辑窗口的两个方面。

图12-2变量视图3．SPSS结果输出窗口结果输出窗口是另一个十分重要的窗口，它在完成Analyze（分析）菜单中的某个统计分析过程后，就会将分析结果呈现出来（如图12-3所示）。

只有当完成一项处理后，才在该窗口显示处理过程和计算结果。

图12-3结果输出窗口结果输出窗口包括标题栏、菜单栏、工具栏、索引区、内容区以及状态栏6个部分。

结果输出窗口第一次出现时标题名称是Outputl．spo-SPSS Viewer，第二次出现时标题名称是Output2．spo-SPSS Viewer，依次类推。

菜单栏显示了结果输出窗口的主菜单，菜单栏共有File（文件）、Edit（编辑）、View（视图）、Data（数据）、Transform（转换）、Insert（插入）、Format（格式）、Analyze（分析）、Graphs（图表）、Utilities（工具）、Windows（窗口）、Help（帮助）12个选项。

与数据编辑窗口相比，结果输出窗口的主菜单增加了Insert（插入）、Format（格式）两个菜单选项。

Insert （插入）菜单主要是插入某个输出的辅助选项，如标题、文本等。

Format（格式）菜单主要是对输出的内容进行格式化，索引区显示结果输出内容包含哪些部分。

内容区显示了具体的统计分析的各个方面的结果。

（二）SPSS的数据处理1．SPSS录入数据（1）将数据录入成SPSS的数据文件。

SPSS也可以读入其他格式的数据文件。

（2）对数据文件进行必要的编辑。

（3）利用SPSS的统计功能对编辑好的数据文件进行统计处理。

（4）调整SPSS输出的统计结果(包括报表、图形和文本等)。

（5）将结果输出、存盘、打印等。

例12-1 某高校一次运动会上大一到大三年级学生铁饼标枪成绩（如表12-1所示），现将数据文件进行统计处理。

2 spss操作步骤打开SPSS的数据编辑器。

通常我们先要定义变量的属性，然后再输入数据。

在数据编辑窗口的左下端，有两个页标签：Date View（数据视图）、Variable View（变量视图）。

我们可以通过鼠标单击方便地在两个窗口之间切换。

在录入数据之前，应该对数据的统计处理有一个基本的框架：计算哪些变量、做何种统计、生成哪种统计图等。

在本例中，只做一般性的描述性统计处理，即求各年级男女选手的成绩平均值、标准差、最大值、最小值等。

首先单击Variable View （变量视图）页按钮，进入图中所示的变量属性窗口。

可以像输入数据一样定义一些变量的属性，如变量名、变量的长度、变量标签、变量的缺失值等。

对于某些变量属性还会弹出对象框，可以进行进一步的定义工作。

然后按照表12-1的结构输入数据即可（如图12-4所示）。

图12-4 某高校一次运动会上大一到大三年级学生铁饼标枪成绩（三）数据描述性统计分析SPSS 基本统计分析是进行其他统计分析的基础和前提。

通过基本统计方法，可以对要分析数据的总体特征有比较准确的把握，从而可以选择其他更为深入的统计分析方法。

本节内容主要包括频数分析、描述性分析、探索分析、基本统计报表制作。

我们主要讲述了如何在SPSS 中进行的频数分析、描述性分析和基本统计报表制作等操作。

1频数分析频数分析的基本原理频数分析（Frequencies ）过程是描述性统计分析中最常用的方法之一，它不仅可以产生详细的频数分析表，还可以按要求给出平均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差、四分位数、十分位数、百分位数。

频数分析中涉及到的有关描述性统计量的理论知识，在本书前几章中已经进行了详细的论述，现只对Kurtosis (峰度)和Skewness(偏度)作以解释。

峰度是描述某变量所有取值分布形态陡缓程度的统计量。

这个统计量是与正态分布相比较的量，峰度为0表示其数据分布与正态分布的陡缓程度相同，峰度大于0表示比正态分布高峰更加陡峭，为尖顶峰。

峰度小于0表示比正态分布的高峰要平坦，为平顶峰。

峰度的计算公式如下：3/)(11144---=∑=ni i SD x x n Kurtosis （12-1）偏度也是描述数据分布形态的，它是描述某变量取值分布对称性的统计量。

具体的计算公式如下：∑=--=ni i SD x x n Skewness 133/)(11 （12-2）这个统计量是与正态分布相比较的量，偏度为0表示其数据分布形态与正态分布偏度X 相同；偏度大于0表示正偏差数值较大，为正偏或右偏，即有一条长尾巴拖在右边：偏度小于0表示负偏差数值大，为负偏或左偏，有一条长尾拖在左边。

而偏度的绝对值数值越大表示分布形态的偏斜程度越大。

求Quartiles (四分位数)、Deciles (十分位数) 和Percentiles (百分位数) （1）Quartiles (四分位数)基本原理四分位数是将一组个案由小到大(或由大到小)排序后，用3个点将全部数据分为四等份，与3个点上相对应的变量称为四分位数，分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。

其中，Q3到Q1之间的距离的一半又称为四分位差记为Q 。

四分位差越小，说明中间的数据越集中；四分位数越大，则意味着中间部分的数据越分散。

（2）Deciles (十分位数) 基本原理十分位数是将一组数据由小到大(或由大到小)排序后，用9个点将全部数据分为十等份，与9个点位置上相对应的变量称为十分位数，分别记为Dl ，D2，……，D9，表示10％的数据落在Dl 下，20％的数据落在D2下，……，90％落在D9下。

（3）Deciles (百分位数) 基本原理百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份，与99个分割点位置上相对应的变量称为百分位数，分别记为P1，P2，……，P99，表示1％的数据落在P1下，2％的数据落在P2下，……，99％落在P99下。

SPSS 实现过程例12-2 某公司20名员工的收入中的“基本工资”变量为例，求“基本工资”的均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差（如表12-2所示）。

e商务文档

实验指导一：spss简介(数据与画图)

相关文档推荐：