当前位置:文档之家› SPSS统计软件期末作业

SPSS统计软件期末作业

完成作业:3、5、11、12题
第3题:基本统计分析3
利用居民储蓄调查数据,从中随机选取85%的样本,进行分析,实现以下目标:
1、分析不同职业储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格;
2、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度;分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。

基本思路:
首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。

操作步骤:选择菜单数据→选择个案→随机个案样本,样本尺寸填大约所有个案85%。

1、题目:分析不同职业储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格。

基本思路:首先进行多选项分析,定义名为X的多选项变量集,其中包括a7_1、a7_2、a7_3三个变量,然后对多选项变量集进行频数分析;对不同职业储户储蓄目的进行分析,采用多选项交叉分组下的频数分析。

操作步骤:
分析:从折线图看出,储户中商业服务业的人数最多,总体上所有职业储户的正常生活零用所占的百分比最大,买证券及单位集资的人较少,说明大部分人群还没有这方面的意识。

2、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度。

基本思路:该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。

操作步骤:分析→描述统计→交叉表,显示复式条形图前打勾,行选择户口,列选择未来收入情况,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。

输出以下表格和图形:
分析:因为卡方值小于拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,说明城镇和农村储户对“未来收入状况的变化趋势”持不同的态度。

3、分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。

基本思路:由于存款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。

操作步骤:转换→重新编码为不同变量→选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。

最后点击确定。

再分析→描述统计→频率→变量:存款金额分组,图表选择直方图,选择显示正态曲线。

最后输出下列图表:
基本思路:进行数据拆分,并计算不同年龄段储户的一次存款金额的四分位数,并通过四分位数比较分布上的差异。

步骤:数据→拆分文件→分组方式:年龄→确定。

分析→描述统计→频率→统计量→四分位数前打勾→确定。

输出如下图表:
分析:分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。

存款在500以下所占百分比最大,有%,其次是500-1000的人数。

而存款在5000以上的也有%,说明存款数额悬殊较大。

从输出图表中看出20-35年龄段的储户最多,其次是35-50岁年龄段,这两部分的人群存款意识比较强,20岁以下的储户只有2人,人数特别少,因为这一年龄段的人群大部分是学生,而50岁以上的老人可能更愿意把钱藏在家里而不是拿到银行去存。

第5题:方差分析2
在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。

在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列(数据均已减去75)。

试在α=显著性水平下分析:
(1)给出SPSS数据集的格式(列举前4个样本即可);
(2)浓度对收率有无显著影响,并进行多重比较检验(只选用第1个检验指标) ;
(3)浓度、温度以及它们间的交互作用对收率有无显著影响。

基本思路:本道题重点考察我们对于在SPSS 应用过程中对于方差分析的应用情况。

先将这
组数据输入SPSS,然后进行两个方面的计算:单因素方差分析和多因素方差分析。

利用SPSS 的非必须功能,从而得出它们的方差数据,进而进行分析和结果的得出。

多重比较检验的方法: LSD方法适用于各总体方差相等的情况,特点是比较灵敏;Tukey 方法和S-N-K方法适用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵敏。

(1)给出SPSS数据集的格式(列举前4个样本即可);
操作步骤:分别定义分组变量A、X、B,在变量视图与数据视图中输入表格数据
(2)浓度对收率有无显著影响,并进行多重比较检验(只选用第1个检验指标) ;
操作步骤:分析-比较均值-单因素ANOVA-因变量列表:收率,因子列表:浓度-确定。

输出如下图表:
显著性=小于说明拒绝原假设(浓度对收益无显著影响),证明浓度对收益有显著影响。

操作步骤:分析-比较均值-单因素ANOVA-两两比较:LSD-选项:描述性-确定
输出:
上面有星号的说明有显著差异,即根据LCD算法,浓度1与浓度2 具有显著差异,浓度3与浓度2有显著性差异,浓度1与浓度3差异性较小。

(3)浓度、温度以及它们间的交互作用对收率有无显著影响。

操作步骤:分析-一般线性模型-单变量-因变量:收率,固定因子:浓度、温度,-模型选择全因子-确定。

输出:
主体间因子
N
浓度18 28 38
温度16 26 36 46
分析:
结果表明,只有因子A(浓度)是显著的,即浓度不同将对收率产生显著影响,而温度及交互作用的影响都不显著,这说明要提高收率必须把浓度控制好。

方差分析可以很好的去辨别两个事物之间存在联系的紧密性。

通过数据,我们可以分辨出浓度的影响更加显著,从而做出调整。

第11题:曲线回归3
根据收集的1981年至2000年的数据,分析教育支出受年人均可支配收入的影响。

(提示:首先绘制两者的散点图。

再尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。


思路:本题主要考察曲线回归的内容,先绘制两者散点图,再用二次、立方、复合、幂函数模型,进行分析。

操作步骤:图形→旧对话框→散点/点状→简单分布→Y轴:教育支出,X轴:年人均可支配收入→确定。

得到散点图如下:
步骤:分析→回归→曲线估计→因变量:教育支出,自变量:年人均可支配收入,个案标签:年份,模型二次项、立方、幂、复合前打勾→确定。

得到以下图表:
分析:在二次、三次、复合、幂函数的模型中复合函数的R方是最大、最接近1的。

所以应用复合函数来表示年人均可支配收入与教育支出的函数关系。

根据函数图象看出,教育支出是随年人均可支配收入增长而增长的,说明随着人们可支配收入增加,对教育的关注更多,投入更多。

第12题:聚类分析1
9个学生的数学、物理、化学、语文、历史、英语的成绩如下表。

要求做K-Means聚类分析,分成3类,初始类中心点由SPSS自行确定。

思路:本题考察K聚类(快速聚类)的内容,根据题目只要指定聚类数目K和确定K个初始类中心即可。

操作步骤:先把表格数据输入数据编辑器中。

分析→分类→K-均值聚类→变量中把数学、物理、化学、语文、历史、英语选进,聚类数为3→选项→初始聚类中心和ANOVA表前打勾→确定。

相关主题