一、调查问卷二、用SPSS Statistics软件进行描述统计分析1、某地区经济增长率的时间序列图形。
解:第一步:数据来源,如图1图 1 某地区经济增长率xls截图图2 Spss软件制作过程截图第二步:将数据输入SPSS软件之中,如图2,制作某地区经济增长率的时间序列图形,如图3。
图3某地区1990—2012年经济增长率的时间序列图第三步,从图中可以看出,某地区随时间的变化经济增长率变化趋势较大。
2、用SPSS Statistics进行描述统计分析解:第一步,按照题目中的要求,随机选取了148个数据,如图4部分数据:图4 Spss随机数据截图第二步,根据要求,对上月工资进行描述统计分析,主要包括描述数据的集中趋势、离散程度(见表1),绘制直方图(见图5)。
表1 上月工资描述统计表(单位:元)集中趋势离散趋势均值2925 极小值1500中值2900 极大值4800众数2900 全距3300和432900 标准差496.364偏度0.165 峰度 1.238数据总计148图5 上月工资直方图第三步,分析数据的统计分布状况。
首先,从集中趋势来,上个月平均工资2925元,其中众数和中数也都在2900元,这说明大部分工资水平在2900左右。
其次,从离散趋势来看,最高工资4800元,最低工资1500元,最高工资和最低工资相差3300元,标准差为496.364,相差较大。
最后,从直方图来看和评述统计表来看,工资在2900元以上的占多数。
可以的该地区整体工资水平大于平均值的占多数,该地区工资水平相对较高。
峰度为1.238,偏度为0.165符合正态分布。
三、用SPSS Statistics 软件进行参数估计和假设检验及回归分析1、计算总体中上月平均工资95%的置信区间(见表3)。
解:总体中上月平均工资分布未知,但是样本容量大于30,且已知标准误,所以通过SPSS 分析得出总体中上月平均工资95%的置信区间,见表3, 假设;H0:总体中上月平均工资95%的不在此在此区间H1:总体中上月平均工资95%的在此区间答,总体中上月平均工资095的置信区间为[2844.37,3005.63],p=0.000<0.01,作出这样的推论正确的概率为0.95,错误的概率为0.05。
2、检验能否认为总体中上月平均工资等于2000元。
解:在本案例中,要检验样本中上月平均工资与总体中上月平均工资(为已知值:2000元)是否存在差异,即某一样本数据与某一确定均值进行比较。
虽然不知道总体分布是否正态,但样本较大(N>30),可以运用单样本T 检验.通过SPSS 检验结果见(表4 、表5) 设; H o:2000=μH 1:2000≠μ 其中,μ表示总体中上月平均工资表4 单个样本统计量表5 单个样本检验t df Sig.(双侧) 均值差值 检验值 上月工资22.6711470.000925.0002000答:作出结论,均值差值为925,t=22.671,p=0.000<0.01,所以拒绝原假设,接受备择假设,即否认总体中上月的平均工资等于2000元。
3、检验能否认为男生的平均工资大于女生解:两个样本均来自于正态分布的总体且男女上月工资独立,可以进行独立样本T 检验,(见表6、表7)假设1:H 0:2221δδ=H 1:2221δδ≠ 其中,代表女生总体方差代表男生总体方差,2221δδ从表7中方差方程的 Levene 检验可以看出,F=0.101,P=0.751>0.05,所以不能拒绝原假设,可以认为两组数据无显著差异,所以应该选择方差相等下的T 检验。
表7独立样本检验假设2: H 0:21μμ≤H 1:21μμ 其中μ1代表男生总体平均数,μ2代表女生总体平均数,下同作出结论:从表6、表7中可以看出,男生有73人,平均工资3156.16元,女生75人,平均工资2700.00元。
t=6.277,且p=0.000<0.001 所以拒绝原假设,接受备择假设,差异极显著。
根据表6,可以最后得出结论,男生平均工资大于女生的结论。
4、一些学者认为,由于经济不景气,学生的平均工资今年和去年相比没有显著提高。
检验这一假说。
解: 根据题意可知,需要进行相关样本T 检验,设:H 0:μ1≤μ2 H 1;μ1>μ2 同上表8 相关样本T 检验均值标准差均值标准误 T df 相关系数 sig 上月工资 2925 496.364 40.801 去年同月工资 2721.62 447.296 36.767 上月工资&去年同月工资 203.378 183.10115.50113.5311470.930.000通过表8可知,t=13.531,P=0.000<0.01,所以拒绝原假设,接受备择假设,即学生的平均工资今年和去年相比有显著提高。
方差方程的 Levene 检验 T 检验FSig. t df Sig.(双侧) 均值差值 标准误差值 上月工资 假设方差相等 0.101 0.7516.2771460.000456.16472.667假设方差不相等6.277 145.859 0.000 456.164 72.6705、方差分析。
(1)使用单因素方差分析的方法检验:能否认为不同学科的上月平均工资相等。
如果不能认为全相等,请做多重比较。
解:第一步,提出假设,H0:不同学科上月的平均工资是相同的H1:至少有两门学科上个月的平局工资是相同的经过SPSS软件计算,见表9,第二步,决策,F=0.754,P=0.472>0.05,接受H0,拒绝H1,三者之间没有显著性差异。
可以认为不同学科上月工资水平相同。
第三步,多重比较,经过Levene检验(见表10),p=0.724,方差没有显著性差异,方差齐性,经过LSD检验(见表11),P值均大于0.05,所以可以得出同样的结论,三门学科的上月工资水平没有差异。
表10 方差齐性检验(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。
解:第一步,提出假设,H0:性别和学科对上月工资水平没有影响H1:性别和学科同时对上月工资水平有影响第二步,经过SPSS计算,见表12,表12主体间效应的检验第三步,作出决策性别因素P=0.000<0.01,在0.01水平上差异显著,所以拒绝原假设,接受备择假设,即性别因素对工资水平有显著性影响,和前面结果一致。
学科因素P=0.465>0.05,在0.05水平上差异不显著,所以接受原假设,拒绝备择假设,即学科因素对上月工资水平没有影响,和前面结果一致。
性别* 学科p=0.962>0.05,在0.05水平上差异不显著,所以接受原假设,拒绝备择假设,即学科和性别因素同时对上月工资水平没有影响。
6、非参数检验。
(1)用非参数检验方法检验能否认为男生和女生上月工资的中位数相等。
解:第一步,采用wilcoxon符号秩检验中位数,选择的原设与备择假设如下:H0:男生与女生上月工资的中位数相等;H1:男生与女生上月工资的中位数不相等。
第二步,通过SPSS软件计算,见表13、14表表14 wilcoxon秩和检验的检验统计量和p值第三步,男生上月工资的平均秩为41.33,女生上月工资的平均秩是19.84,说明从样本看男生上月工资的中位数要高于女生。
用正态分布计算时的M=1265.000,W=4115.000,Z=-5.663,p=0.000<0.01,可以拒绝原假设,认为男生与女生上月工资中位数不相等。
若进行单侧检验:H0:男生月收入中位数小于女生月收入的中位数;H1:男生月收入中位数大于于女生月收入的中位数。
P值为0.000,可以拒绝原假设。
H0:男生月收入中位数大于女生月收入的中位数;H1:男生月收入中位数小于女生月收入的中位数。
P值为1-0.000/2 =1,接受原假设。
因此可以认为男生上月工资中位数大于女生上月工资中位数。
(2)用非参数检验方法检验学生上月工资和去年同月工资的中位数是否有显著变化。
解:第一步,采用非参数检验中的两个相关样本样本,选择的原假设与备择假设如下:H0:上月工资与去年同月工资差值为0H1:上月工资与去年同月工资差值不为0第二步,通过SPSS软件计算,结果如表15、16第三步,作出结论,由于此样本为大样本,应该采用渐近显著性的p值(0.000),小于0.01,拒绝原假设,接受备择假设,则可以认为上月工资与去年同月工资有显著差别。
(3)用非参数检验方法不同学科学生平均学分绩点的中位数是否相等。
解:第一步,采用Kruskal-Wallis检验不同学科学生平均学分绩点的中位数是否相等,原假设和备择假设设置如下:H0:不同学科学生平均学分绩点的中位数相等;H1:不同学科学生平均学分绩点的中位数不相等第二步,通过SPSS软件计算结果如表17、18;表17 Kruskal-Wallis检验中计算的各组平均秩表18 Kruskal-Wallis检验的检验统计量和p值第三步,作出结论,因为p=0.653>0.05,不可拒绝原假设,认为三个学科平均学分绩点的中位数没有显著差异.。
(4)检验学生的上月工资是否服从正态分布。
解:第一步,样本是否来自正态分布,可用单样本K-S检验,原假设和备择假设设置如下H0:学生的上月工资服从正态分布H1:学生的上月工资不服从正态分布第二步,通过SPSS软件计算结果如表19表19 单样本Kolmogorov-Smirnov 检验第三步,作出结论,p=0.291,大于0.05,不能拒绝原假设,也就是说能认为此样本来自正态分布。
(5)检验学生对专业的满意程度是否为离散的均匀分布第一步,采用卡方分布进行检验,H0:学生对专业的满意程度服从离散的均匀分布H1:学生对专业的满意程度不服从离散的均匀分布第二步,通过SPSS软件计算结果表20、21表21 卡方分布检验计算结果和相应的p 值第三步,作出结论,因为p=0.000,小于0.01,可以拒绝原假设,接受备择假设认为学生对专业的满意程度不服从离散的均匀分布。
7、回归分析。
(1)计算上月工资与平均学分绩点的相关系数并作假设检验。
解:第一步,假设如下:H 0:0=ρ H 1:0≠ρ第二步,通过SPSS 计算,见表22第三步,根据计算相关系数为0.763,P=0.000<0.01,所以可以拒绝原假设,在0.01水平上二者显著相关。
(2)以上月工资为因变量,平均学分绩点为自变量做回归分析,分析模型的拟合效果和假设检验的结果。
(第一次抽样无法做回归分析,需要重新抽样)解:第一步,假设1,H0:回归模型无意义,H1:回归模型有意义 假设2,Ho ;常量为 H1:常量不等于0假设3,Ho :平均学分绩点的系数为0,H1:平均学分绩点的系数不等于0 第二步,通过SPSS 分析,见表23、24、25表24 回归模型模型平方和df 均方 F Sig.1 回归 2.273E7 1 2.273E7 189.216 .000a残差 1.622E7 135 120118.458总计 3.894E7 136表25模型回归系数表模型 B t Sig.1 (常量) -661.720 269.159 -2.458 .015平均学分绩点1177.971 85.636 13.756 .000图6图7图8说明:图6为残差的直方图,图中残差的分布基本均匀图7为残差的正态P-P概率图,图中散点基本呈直线趋势,且并未发现异常点图8残差是否有随标准化预测值增大而改变的趋势。