当前位置:文档之家› SPSS操作步骤及解析

SPSS操作步骤及解析

目录第四章统计描述 (2)4.2 频数分析 (2)4.3描述性统计量 (2)4.4.1(探索性数据分析)操作步骤 (4)第五章统计推断 (6)5.2单样本t检验 (6)5.3 两独立样本t检验 (7)5.4 配对样本t检验 (8)第六章方差分析 (9)6.2.2 单因素单变量方差分析(One-way ANOVA)(操作步骤) (10)6.3.3 多因素单变量方差分析操作步骤 (14)6.3.5 不考虑交互效应的多因素方差分析 (17)6.3.6 引入协变量的多因素方差分析 (18)第八章相关分析 (19)8.2 连续变量相关分析实例 (20)8.3 离散变量相关分析的实例(列联表) (22)第九章回归分析 (24)9.1.3 线性回归(操作步骤) (26)1.多重共线性检验 (26)2.使用变量筛选的方法克服多重共线性 (29)二、曲线估计(操作步骤) (32)9.2.5二项Logistic回归(操作步骤) (35)第十章聚类分析 (39)10.3.1 K-均值操作步骤: (39)10.4.1 系统聚类法操作步骤 (43)第十一章判别分析 (47)11.3.1 操作步骤 (48)第十二章因子分析 (53)12.2.2操作步骤 (56)第十三章主成分分析 (64)13.2 操作步骤 (65)第十四章相应分析 (69)14.2相应分析实例(操作步骤) (70)第十五章典型相关分析 (75)15.2操作步骤: (75)第四章统计描述统计描述是指如何搜集、整理、分析、研究并提供统计资料的理论和方法,用于说明总体的情况和特征。

4.1 基本概念和原理4.1.1 频数分布4.1.2 集中趋势指标算数平均值:适用于定比数据、定距数据中位数:适用于定比数据、定距数据和定序数据众数:适用于定比数据、定距数据、定序数据和定类数据4.1.3离散程度指标作用:(1)它可以表明现象的平衡程度和稳定程度;(2)离散性指标可以表明平均指标的代表性,数据离散程度越大,则该分布的平均指标的代表性就越小。

方差、标准差、均值标准误差、极差。

均值标准误差:也叫抽样标准误差,是样本均值的标准差,反映了样本均值与总体均值之间的差异程度。

4.1.4反映分布形态的描述性指标偏度、峰度4.2 频数分析Analyze——Descriptive Statistics——Frequencies4.3描述性统计量Analyze——Descriptive Statistics——Frequencies输出结果:4.4 探索性数据分析基本思路:在统计分析时应尽量减少数据中存在的少量异常值对分析结果的影响。

只讲Explore命令:(1)异常值检验(2)分布正太性检验(3)方差齐性检验检验各观测变量在控制变量不同水平下的方差是否相等。

4.4.1(探索性数据分析)操作步骤Analyze——Descriptive Statistics——Explore齐性检验第五章统计推断统计推断内容:参数估计、假设检验。

参数估计:研究一个随机变量,推断它的数量特征和变动模式。

假设检验:检验随机变量的数量特征和变动模式是否符合事先所做的假设。

共同特点:对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征做出估计或判断。

所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度。

5.1 参数估计5.2单样本t检验用于对总体均值进行检验。

前提:样本来自的总体服从或近似服从正态分布。

检验我国上市公司的平均资产负债比是否为0.5 Analyze——Compare means——One-Sample T Test,Test value设为0.5上表1给出了资产负债率描述统计量。

从表可知,上市公司资产负债率平均为0.4677,标准差为0.16773,均值标准误差为0.00945。

上表2给出了单样本t检验结果。

从表中可以看到t统计量为-3..413,自由度为314,p值为0.01。

由于p值小于显著性水平0.05,所以拒绝上市公司资产负债率平均为0.5的原假设。

另外,单样本t检验还5.3 两独立样本t检验对两个不同总体均值之间的差异性(样本均值之差)是否显著进行检验。

前提:样本来自的总体服从或近似服从正态分布;两样本相互独立。

注意:要检验方差齐性。

(自带)Analyze——Compare means——Dependent-Sample T Test,输出结果:5.4 配对样本t检验利用来自某两个总体的配对样本,推断两个总体的均值是否存在显著差异。

特征:第一,两组样本的样本数相同;第二,两组样本观测值的先后顺序一一对应。

例如:检验某学校学生进行培训前后学生学习成绩有无显著变化。

两个样本具有一对一的配对关系Analyze——Compare means——Paird-Sample T Test输出结果:第六章 方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本的观测值之间可能存在的由该因素导致的系统性误差与随机误差加以比较,据以推断各组样本之间是否存在显著差异。

若存在显著差异,则说明该因素对各总体的影响是显著的。

● 方差分析的主要目的是通过对方差的比较来检验多个均值之间差异的显著性。

● 可以看作t 检验的扩展,只比较两个均值时与t 检验等价。

方差分析有三个基本概念:观测变量、因素和水平。

观测变量(因变量):实际测量的、作为结果的变量,是进行方差分析所研究的对象。

因素(自变量):作为原因的、把观测结果分成几个组以进行比较的变量,例如奖金水平。

水平:因素的不同表现,即每个自变量的不同取值称为因素的水平。

根据观测变量的个数分类:单变量方差分析和多变量方差分析; 根据因素的个数分类:单因素方差分析和多因素方差分析。

● 只有一个因素变量的方差分析称为单因素方差分析。

● 研究多个因素变量对因变量的影响的方差分析称为多因素方差分析,其中最简单的情况是双因素方差分析。

6.2 单因素单变量方差分析(One-way ANOV A )● 单因素方差分析:模型中有一个自变量(因素)和一个观测变量。

● 其实就是关于在一个影响因素的不同水平下,观测变量均值差异的显著性检验。

SST=SSB+SSESST:观测变量的总离差平方和SSB:组间离差平方和SSE:组内离差平方和/(1)/()MSB SSB r F MSE SSE n r -==- 方差分析需满足的假设条件:● 样本是独立的随机样本。

● 各样本皆来自正态总体。

对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。

总体方差具有齐性,即各总体方差相等。

各组观察数据是从具有相同方差的总体中抽取的。

某汽车经销商为研究东部、西部和中部地区市场上汽车销量是否存在显著差异原假设:H0:12...ru u u===6.2.2 单因素单变量方差分析(One-way ANOVA)(操作步骤)Analyze——Compare means——One-Way ANOV A输出结果:(假设一般为没有显著性差异)描述销量N 均值标准差标准误均值的95% 置信区间极小值极大值下限上限西10 157.90 22.278 7.045 141.96 173.84 120 194 中9 176.44 19.717 6.572 161.29 191.60 135 198 东7 196.14 30.927 11.689 167.54 224.75 145 224 总数26 174.62 27.845 5.461 163.37 185.86 120 224方差齐性检验销量Levene 统计量df1 df2 显著性1.262 2 23 .302ANOV A销量平方和df 均方 F 显著性组间(组合)6068.174 2 3034.087 5.241 .013 线性项未加权的6022.125 1 6022.125 10.402 .004加权的6066.237 1 6066.237 10.478 .004偏差 1.937 1 1.937 .003 .954对比系数对比地区西中东1 1 1 -12 .5 -1 .5在此之后检验6.3 多因素单变量方差分析同时研究多种因素对观测变量的影响,就是多因素方差分析。

例如,研究汽车销量问题,对汽车销量的影响很可能不仅受地区因素的影响,还受广告、居民收入以及消费偏好等其他因素的影响。

交互效应:各个因素不同水平的搭配所产生的新的影响。

主效应:各个因素对观测变量的单独影响。

SST SSA SSB SSAB SSE =+++ SST :观测变量的总变动SSA :因素A 引起的观测变量的变动 SSB :因素B 引起的观测变量的变动SSAB :因素A 和因素B 的交互效应引起的观测变量的变动 SSE :随机因素引起的观测变量的变动如果其中某种因素引起的观测变量的变动占观测变量总变动的比例足够大,则可以认为该因素变量对观测变量的影响是显著的。

/(1)/(1)A MSA SSA r F MSE SSE rs l -==-/(1)/(1)B MSB SSB r F MSE SSE rs l -==- /(1)(1)/(1)AB MSAB SSAB r s F MSE SSE rs l --==-6.3.2 固定效应、随机效应和协变量 根据可控性分为:固定效应、随机效应固定效应:因素变量的各个水平可以严格控制,它们对观测变量的影响是固定的。

如产品定价、广告类型。

随机效应:因素变量的各个水平无法严格控制,它们对观测变量的影响是随机的。

如气候条件等。

协变量:像居民收入这样的无法控制其水平的连续型变量在方差分析中通常叫做协变量。

6.3.3 操作步骤1. 提出零假设和备择假设。

双因素方差分析可以同时检验两组或三组零假设和备择假设。

要说明因素A有无显著影响,就是检验如下假设:H0:因素A不同水平下观测变量的总体均值无显著差异。

H1:因素A不同水平下观测变量的总体均值存在显著差异。

要说明因素B有无显著影响,就是检验如下假设:H0:因素B不同水平下观测变量的总体均值无显著差异。

H1:因素B不同水平下观测变量的总体均值存在显著差异。

在有交互效应的双因素方差中,要说明两个因素的交互效应是否显著,还要检验第三组零假设和备择假设:H0:因素A和因素B的交互效应对观测变量的总体均值无显著差异。

H1:因素A和因素B的交互效应对观测变量的总体均值存在显著差异。

6.3.3 多因素单变量方差分析操作步骤Analyze——General Linear Model——Univariate结果输出:主体间因子值标签N地区 1 西102 中93 东7广告 1 82 83 10描述性统计量因变量:销量地区广告均值标准偏差N西 1 179.33 13.317 32 162.75 7.136 43 130.00 8.718 3总计157.90 22.278 10主体间效应的检验因变量:销量源III 型平方和df 均方 F Sig.校正模型14047.571a8 1755.946 5.594 .001截距770802.552 1 770802.552 2455.437 .000region 7149.781 2 3574.891 11.388 .001ad 7625.708 2 3812.854 12.146 .001region * ad 637.741 4 159.435 .508 .731误差5336.583 17 313.917总计812138.000 26校正的总计19384.154(以25上三个之和)a. R 方= .725(调整R 方= .595)Model:用户建立的模型能够解释的变差。

相关主题