当前位置:文档之家› 统计分析软件应用(题库)

统计分析软件应用(题库)

统计分析软件应用一、判断题1.spss可以读取excle格式的数据文件和文本文件。

2.当我们新建一个spss数据文件时,首先应在数据编辑器窗口中的数据视图中输入个案,然后再在变量视图中定义变量。

3.Spss允许同时创建或打开多个查看器窗口。

4.Spss两配对样本T检验中,两配对样本数据存放在同一个变量列上。

5.如果把“年龄”变量的缺失值指定为“99”,则如果某个被调查者的年龄回答为“300”,则就用99岁来代替。

6.Spss两独立样本T检验中,两个样本的样本容量是必须相同的。

7.如果一次随机抽样问卷调查共收回1000份问卷,两个同学建立spss数据文件各完成了500份问卷的录入工作,为便于对这次抽样调查结果进行统计分析,首先应该将两个数据文件进行横向合并。

8.Spss文件的变量名的首字符可以是汉字、字母和数字。

9.当变量分布不对称时,偏度值小于0为负偏,密度函数曲线有一条长尾拖在右边。

10.假设某数值变量服从正态分布,将其进行标准化处理后,如果某观测值标准化值小于-3,可认为是异常值。

11.对于所选答案不需要排序的多项选择题可采用多选项分类法进行分解12.对多项选择题进行频数分析的spss操作步骤是:【分析】→【描述统计】→【频率】13方差分析中,控制变量应为分类型变量。

14.pearson简单相关系数r 的绝对值接近0时,说明两变量没有相关关系。

15.在一元线性回归分析中,对回归方程的F检验和对回归系数的T检验的作用是相同的。

二、案例分析题1.某工厂改进了技术,调查者随机抽取了15名工人,调查他们在工艺改进前后生产100件产品的时间,数据如下表,试在5%显著性水平下,检验零件加工时间是否显著减少?以下是用spss成对样本T检验的输出结果,请填写表中的空格,并根据输出结果回答零件加工时间是否显著减少。

2.现有甲乙丙三个工厂分别生产某种电池,现在从每个厂家生产的电池中各抽取12个检验其寿命,在5%的显著性水平下,检验三个厂家的电池寿命是否具有显著差异。

以下是spss方差分析的输出结果:變異數同質性測試电池寿命Levene 統計資料df1 df2 顯著性.390 2 33 .680*. 平均值差異在0.05 層級顯著。

要求填写表中空格,并根据以上输出结果回答:(1)三个厂家生产的电池寿命是否满足方差齐性的假设,为什么?(2)三个厂家生产的电池使用寿命是否存在显著差异,为什么?(3)对多重比较的结果进行分析说明。

3、为了研究某健身器材三个品牌(A、B、C)需求,商场对消费了该健身器材的顾客进行了随机抽样调查。

调查结果的频数分析结果如下:表1 统计量购买品牌N 有效338缺失0均值 2.2811方差0.672偏度-0.560偏度的标准误0.133峰度-1.287峰度的标准误0.265百分位数25 2.000050 3.000075 3.0000请根据频数分析结果回答:(1)该样本有无缺失值?(2)该样本的中位数为多少?(3)该样本的分布形态如何?(分别描述分布的对称性、陡缓程度)。

4、在进行某项调查时,有一栏人口统计学信息为“学历”,其频数分析结果如下:表2 学历频率百分比有效百分比累积百分比有效小学或以下20 1.8 1.8 1.8中学或中专723 65.1 65.1 66.9大专230 20.7 20.7 87.6本科118 10.6 10.6 98.2硕士或以上20 1.8 1.8 100.0合计1111 100.0 100.0请根据频数分析结果,绘制频数分析的条形图。

5、现对每月信用卡消费(元)做描述分析,并通过标准化过程,寻找异常值。

其中Z月信用卡消费为标准化的数据。

表3 月信用卡消费的描述分析根据描述分析结果回答:(1)请写出数据标准化的数字定义式:Z=(2)该样本中是否有异常值?哪个是异常值,为什么?【参考答案】(1)Z=x i-x 蟽(2)有异常值,为89975.8。

因为如果标准化值的绝对值大于3,根据统计学经典3蟽准则,为异常值。

89975.8的标准化值为3.56165,大于3,因此为异常值。

6、为了研究某公司内30个员工的月基本工资,收集了30个员工的月基本工资数据,并进行了单样本T 检验。

表4为单个样本统计量,表5为单个样本的检验。

请根据单样本T检验的相关知识回答:(1)该检验中,原假设H0是什么?(2)该检验是拒绝原假设还是不拒绝原假设?为什么?(3)该公司内员工的月基本工资在95%的置信区间内,分布在多少范围之间?【参考答案】(1)原假设(2)根据假设检验的判定标准,若p<伪,则拒绝原假设;若p>伪,则不能拒绝原假设。

该单样本T检验的p=0.000<,因此拒绝原假设,即:这30人员工的月基本工资平均值不为4500。

(3)置信区间为(4500+1004.5314,4500+2053.4686)=(5504.5314,6553.4686)7、为了研究高校每年投入高级职称的人员数和每年发表的论文数的关系,做了如下相关分析。

图1表相关性投入高级职称的人年数论文数投入高级职称的人员数Pearson 相关性 1 0.953**显著性(双侧)0.000N 31 31论文数Pearson 相关性0.953** 1显著性(双侧)0.000N 31 31**. 在 .01 水平(双侧)上显著相关。

请根据相关分析结果回答:(1)在相关分析中,图1的名称叫什么?它有什么作用?(2)该分析使用的是哪种相关系数?高校每年投入高级职称的人员数和每年发表的论文数的相关系数为多少?【参考答案】(1)散点图。

散点图是相关分析过程中极为常用的直观分析方式,能够直观发现变量间的统计关系以及强弱程度。

(2)使用的是Pearson相关系数。

相关系数为0.953。

8、为了测量不同种类的饲料对家畜(猪)的体重影响,对24头家畜(猪)分别进行了3种饲料的喂养。

表6 ANOVA喂养后体重增加请根据以上信息回答:(1)该分析运用的哪种分析方法?(2)请完善表中空格部分的数据。

(需列出具体计算步骤)(3)若给定显著性水平伪=0.05,通过该分析,不同饲料对家畜(猪)的体重增加影响大吗?为什么?【参考答案】(1)方差分析(或单因素方差分析)(2)需列出具体计算步骤:①=1317.583;②=1238.375;③=21;④=58.970;⑤=11.172(3)该分析认为,不同饲料对家畜的体重增加影响大。

原因:该方差分析的P值为0.000,小于显著性水平伪=0.05,因此拒绝原假设(原假设为:不同饲料对家畜(猪)的体重增加没有影响)。

9、为了研究农业劳动者人数与粮食总产量的关系,建立了一元线性回归方程模型。

相关数据经过SPSS软件分析得出以下结果:表7 模型汇总模型R R 方调整 R 方标准估计的误差1 0.954a①0.908 2350.34682a. 预测变量: (常量), 农业劳动者人数(百万人)。

表8 Anova b模型平方和df 均方 F Sig.1 回归1.866脳109②1.866脳109⑤0.000a残差1.823脳10833 ④总计③34a. 预测变量: (常量), 农业劳动者人数(百万人)。

b. 因变量: 粮食总产量(y万吨)表9 系数a模型非标准化系数标准系数t Sig.B 标准误差试用版1 (常量) -9662.737 1908.102 -5.064 0.000农业劳动者人数(百万人) 129.257 7.033 0.954 18.378 0.000表7 模型汇总模型R R 方调整 R 方标准估计的误差1 0.954a①0.908 2350.34682a. 因变量: 粮食总产量(y万吨)请根据一元线性回归模型的结果分析:(1)请计算并填写空白处的数据。

(需列出具体计算步骤)(2)请写出一元线性回归方程模型,并解释回归系数的意义。

(3)R方(R2)是什么?它的表达式是什么?为什么它能代表回归方程的拟合优度?(4)在显著性水平下,检验回归系数是否显著。

(5) 在显著性水平下,检验线性回归方程是否显著。

【参考答案】(1)①=0.911;②=1;③=2.048脳109;④=5524130.166;⑤=337.749(2)y=-9662.737+129.257x1+蔚。

回归系数129.257的意义是,表示每增加1百万人的农业劳动者人数,粮食总产量增加129.257吨。

(3)R2是判定系数,表达式为(答对等式其中一个表达都得分)。

从其表达式上看,由于R2能体现回归方程所能解释的变差比例,因此其值可以代表回归方程的拟合优度。

R2越接近于1,表示拟合效果越好。

(4)在显著性水平伪=0.05下,回归系数的显著性检验P值为0.000<伪=0.05,因此拒绝原假设(原假设为),回归系数显著。

(5)在显著性水平伪=0.05下,线性回归方程的显著性检验P值为0.000<伪=0.05,因此拒绝原假设(原假设为), 线性回归方程显著。

10、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,结果如下表所示。

VAR00001* VAR00002 交叉制表VAR000021.002.003.00合计VAR00001 1.00 计数62 78 55 195期望的计数48.8 68.3 78.0 195.0总数的 % 10.3% 13.0% 9.2% 32.5%2.00 计数45 87 63 195期望的计数48.8 68.3 78.0 195.0总数的 % 7.5% 14.5% 10.5% 32.5%3.00 计数43 45 122 210期望的计数52.5 73.5 84.0 210.0总数的 % 7.2% 7.5% 20.3% 35.0%合计计数150 210 240 600期望的计数150.0 210.0 240.0 600.0 总数的 % 25.0% 35.0% 40.0% 100.0%卡方检验值df 渐进 Sig. (双侧)Pearson 卡方50.061a 4 .000似然比50.073 4 .000线性和线性组合27.579 1 .000有效案例中的 N 600a. 0 单元格(.0%) 的期望计数少于 5。

最小期望计数为 48.75。

问:(1)写出卡方检验的统计量并说明其构造基本原理。

(2)说明婆媳关系与住房条件有无联系。

11.下面的表格是对某班某次考试男生和女生课程平均分是否存在显著差异的软件分析结果,根据结果分析男生和女生的平均分是否有显著差异,写出分析步骤。

组统计量sex N 均值标准差均值的标准误female 30 67.5208 9.08385 1.65848male 30 68.9229 9.85179 1.79868答:可以看出男生和女生成绩平均差为1.4021在置信区间内sig值为0.307>0.05所以不能拒绝原假设(原假设u-u0=0 即男生和女生成绩的平均分不存在显著差异)即认为男生和女生的平均成绩不存在显著差异。

相关主题