当前位置:文档之家› SPSS实验报告

SPSS实验报告

SPSS实验报告统计分析与SPSS的应用实验报告组员:高琴 200900701005闭玉媚 200900701006吴辉萍 200900701007黄艳秋 200900701008覃茜茜 200900701009案例2-1 数据组织方式示例--住房状况调查表:已定义好的SPSS数据结构示例如下:案例2-4 横向合并数据文件合并了奖金数据后的职工基本情况:案例 3-1 数据的排序--职工数据案例4-1 频数分析的应用举例案例4-3 计算基本描述统计量的应用举例本市户口和外地户口家庭人均住房面积的基本描述统计量Descriptive Statistics户口状况本市户口外地户口有效的 N :列表有效的 N :列表人均面积状态: 人均面积状态:N 统计量 2825 2825 168 168全距统计量 112.60 97.67极小值统计量 2.40 3.33极大值统计量 115.00 101.00均值统计量 21.7258 26.7165标准差统计量 12.17539 18.96748偏度统计量 2.181 1.429标准误 .046 .187峰度统计量 8.311 2.121标准误 .092 .373结果分析:上表表明本市户口家庭的人均住房面积的平均值(21.7平方米)低于外地户口家庭(26.7平方米),但外地户口的标准差却高于本市户口。

无论本市户口还是外地户口,人均住房面积的分布均呈一定的右偏分布(两个偏度统计量分别为2.18和1.43),且本市户口的偏斜程度更大些;同时,本市户口和外地户口家庭的人均住房面积均呈尖峰分布(两个峰度统计量分别为8.3和2.1),且本市更尖峰。

由此可见,本市户口和外地户口中的大部分家庭的人均住房面积都低于各自的平均水平,此时,仅用均值刻画住房状况是不准确的。

案例4-5 交叉分组下的频数分析应用举例表4-9 本市户口和外地户口家庭对“未来三年是否打算买房”看法的列联表户口状况* 未来三年交叉制表未来三年不买购买合计户口状况外地户口计数 109 59 168户口状况中的 % 64.9% 35.1% 100.0%未来三年中的 % 5.0% 8.2% 5.8%总数的 % 3.8% 2.0% 5.8%标准残差 -1.5 2.6本市户口计数 2052 660 2712户口状况中的 % 75.7% 24.3% 100.0%未来三年中的 % 95.0% 91.8% 94.2%总数的 % 71.3% 22.9% 94.2%标准残差 .4 -.7合计计数 2161 719 2880户口状况中的 % 75.0% 25.0% 100.0%未来三年中的 % 100.0% 100.0% 100.0%总数的 % 75.0% 25.0% 100.0%结果分析表4-9表明:首先,在所调查的2880样本中(有113个样本因缺失值而被剔除),2712户为本市户口,168户为外地户口,分别占总样本的94.2%和5.8%,可见本市户口占多数;未来三年不准备买房、准备买房的样本数分别为2161和719,各占总样本的75%和25%,不准备买房的占较大比例。

其次,对不同户口状况进行分析。

在本市户口(2712)中,未来三年不打算买房和打算买房的样本数分别为2052和660,各占总样本(2712)的75.7%和24.3%,不打算买房的仍占较大比例,但打算买房的比例低于总体比例(25%);在外地户口(168)中,未来三年不打算买房和打算买房的样本数分别为109和59,各占总样本(168)的64.9%和35.1%,未来三年不打算买房的仍占较大比例,但打算买房的比例高于总体比例(25%)。

最后,对不同看法进行分析。

在未来三年不打算买房的样本(2161)中,本市户口和外地户口的家庭数是2052和109,分别占总样本(2161)的95.0%和5.0%,比例相差较为悬殊;在未来三年打算买房的样本(719)中,本市户口和外地户口家庭数分别为660和59,分别占总样本(719)的91.8%和8.2%,比例差距仍较大。

但应注意的是,由于本市户口和外地户口的样本量本身存在较大悬殊,因此这里的分析是存在一定问题的。

这些分析可在图4-12中得到直观印证。

表4-10 本市户口和外地户口家庭对“未来三年是否打算买房”看法的一致性检验结果卡方检验渐进 Sig. (双精确 Sig.(双精确 Sig.(单值 df 侧) 侧) 侧)a Pearson 卡方 9.819 1 .002b 连续校正 9.252 1 .002似然比 9.148 1 .002Fisher 的精确检验 .002 .002线性和线性组合 9.816 1 .002有效案例中的 N 2880a. 0 单元格(.0%) 的期望计数少于 5。

最小期望计数为 41.94。

b. 仅对 2x2 表计算结果分析:表4-10中,第一列为统计量名称,第二列是各检验统计量的观测值,第三列是自由度,第四列是大于等于各检验统计量观测值的概率P-值。

其中,第一行是卡方检验的结果。

根据上述卡方检验的基本步骤和决策方式可知,本检验的原假设是:本市户口与外地户口对未来三年是否买房的看法是一致的。

如果显著性水平α设为0.05,由于卡方的概率P-值小于α,因此应拒绝原假设,认为本市户口与外地户口对未来三年是否买房的看法是不一致的。

这种不一致主要体现在打算买房的比例在本市户口中低于总体比例,而外地户口则高于总体比例。

脚注b表明,该分析中期望频数小于0的单元格数为0,最小的期望频数为41.94,适合作卡方检验。

另外表4-10中还输出了似然比卡方和线性相关卡方。

本例中,线性相关卡方的概率P-值小于显著性水平α,应拒绝原假设,认为行列变量具有线性相关性,但由于户口状况为定类变量,因而不宜采用该检验。

图4-12 本市户口和外地户口对是否打算买房看法的分布条形图案例4-8 比率分析的应用举例保险业务的分组描述结果Case Processing Summary计数百分比地区标志直辖市 4 11.1%省份 22 61.1%自治区 5 13.9%城市 5 13.9%总数 36 100.0%排除的 0总计 36结果分析:上表表明,36个地区中,有4个直辖市、22个省份、5个自治区和5个城市,比例分别是11.1%,61.1%,13.9%,13.9%。

财产业务的比率分析结果Ratio Statistics for 财产保险费收入/全部保险费收入方差系数帄均数绝对值偏组均值离散系数差均值居中中值居中直辖市 .349 .045 .127 14.9% 14.8%省份 .406 .040 .098 12.7% 12.6%自治区 .527 .129 .314 50.3% 71.5%城市 .445 .028 .066 8.6% 10.3%总数 .422 .054 .131 26.5% 27.1%结果分析:(1)总体来说,36个地区的财产保险保费收入占全部保费收入的比率的均值为0.422,也就是说,全国各地平均保费收入中的42.2%为财产保险收入,但直辖市的平均比例(34.9%)较低,自治区的平均比例(52.7%)高于全国平均水平。

)AAD平均绝对离差和COD离散系数全国总的情况为0.054和0.131,基于均值(2和中位数的变异系数分别为26.5%和27.1%。

相比较,自治区AAD和COD都远高于全国水平,即离散程度高,从变异系数上也同样可以证明这点。

直辖市和省市的离散程度大致相同。

总之,在各自治区中,财产险的收入所占的比例较高(高于全国平均水平),但其发展水平差异较大(离散程度高于全国平均水平)。

案例5-1 单样本t检验表一:人均住房面积的基本描述统计量单个样本统计量均值标准差均值的标准误 N人均面积 2993 22.0060 12.70106 .23216表二:人均住房面积的单样本t检验结果单个样本检验检验值 = 20差分的 95% 置信区间Sig.(双侧) 均值差值下限上限 t df人均面积 8.640 2992 .000 2.00596 1.5508 2.4612结果分析:由表一可知,2993个家庭的人均住房面积的平均值为22平方米,标准差为12.7平方米,均值标准误差(S/n的开平方)为0.23。

表二中,第二列是t统计量的观测值为8.64;第三列是自由度为2992(即n-1=2993-1);第四列是t统计量观测值的双尾概率P-值;第五列是样本均值与检验值的差,即t统计量的分子部分,它除以表一中的均值标准差(0.23)后得到t统计量的观测值(8.64);第六列和第七列是总体均值与原假设值差的95%的置信区间,为(1.55,2.46),由此计算出总体均值的95%的置信区间为(21.55,22.46)平方米。

该问题应采用双尾检验,因此比较a/2和p/2,也就是比较a和p。

如果a取0.05,由于p小于a,因此应拒绝原假设,认为家庭人均住房面积的平均值与20平方米有显著差异。

95%的置信区间告诉我们有95%的把握认为家庭人均住房面积的均值在21.55~22.46平方米之间,20平方米没有包含在置信区间内,也证实了上述推断。

案例5-2 单样本t检验表一:保险公司具有高等教育水平员工比例的基本描述统计量单个样本统计量均值标准差均值的标准误 N受高等教育比例 19 .7448 .16734 .03839表二:保险公司具有高等教育水平员工比例的单样本t检验结果单个样本检验检验值 = 0.8差分的 95% 置信区间Sig.(双侧) 均值差值下限上限 t df受高等教育比例 -1.437 18 .168 -.05515 -.1358 .0255结果分析:由表一和表二可知,被调查的有效的19家保险公司中,具有高等教育水平员工比例的平均值为0.745,标准差为0.167;单样本t检验中t统计量的双尾概率P-值为0.168,比例总体均值的95%置信区间为(0.6642,0.8255)。

如果显著性水平a为0.05,由于应进行单尾检验且0.168/2大于显著性水平a,因此不应拒绝原假设,不能认为保险公司具有高等教育水平员工比例的平均值不显著高于0.8。

同时0.8大于95%的置信区间的下限值,也从另一角度证实了这个结论。

表三:保险公司年轻人比例的基本描述统计量单个样本统计量均值标准差均值的标准误 N年轻人比例 26 .7139 .15068 .02955表四:保险公司年轻人比例的单样本t检验结果单个样本检验检验值 = 0.5差分的 95% 置信区间Sig.(双侧) 均值差值下限上限 t df年轻人比例 7.237 25 .000 .21388 .1530 .2747结果分析:由表三和表四可知,被调查的26家保险公司中,年轻人比例的平均值为0.714,标准差为0.151;单样本t检验中t统计量的双尾概率P-值接近于0,比例总体均值的95%置信区间为(0.6530,0.7747)。

相关主题