当前位置:文档之家› spss的数据分析报告范例1

spss的数据分析报告范例1

关于某地区361个人旅游情况统计分析报告一、数据介绍:本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。

通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。

二、数据分析1、频数分析。

基本的统计分析往往从频数分析开始。

通过频数分地区359个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。

统计量积极性性别N 有效359 359缺失0 0首先,对该地区的男女性别分布进行频数分析,结果如下性别频率百分比有效百分比累积百分比有效女198 55.2 55.2 55.2男161 44.8 44.8 100.0合计359 100.0 100.0表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。

其次对原有数据中的旅游的积极性进行频数分析,结果如下表:积极性频率百分比有效百分比累积百分比有效差171 47.6 47.6 47.6一般79 22.0 22.0 69.6比较好79 22.0 22.0 91.6好24 6.7 6.7 98.3非常好 6 1.7 1.7 100.0合计359 100.0 100.0其次对原有数据中的积极性进行频数分析,结果如下表:其次对原有数据中的是否进通道进行频数分析,结果如下表:Statistics通道N Valid 359Missing 0这说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。

上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171 人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。

2、描述统计分析。

再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。

下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。

如表所示,以起始工资为例读取分析结果,359个人中收入最小值为7.426¥,最大值为6250.00000¥,平均1032.9302¥,标准差为762.5239¥偏度系数和峰度系数分别为1.790和6.869。

其他数据依此读取,则该表表明该地区旅游花费的详细分布状况。

3、探索性数据分析(1)交叉分析。

通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。

就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。

现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分):Count上联表及Bar Chart涉及两个变量,即性别与积极性的二维交叉,反映了在不同的性别对于旅游积极性分布情况。

上表中,性别成为行向量,积极性列向量。

(2)性别与收入的探索性分析Descriptives性别Statistic Std. Error 收入女Mean 1005.28562 49.51479695% Confidence Interval for Mean Lower Bound 907.63853 Upper Bound 1102.932725% Trimmed Mean 957.92011Median 937.50000Variance 485439.577Std. Deviation 696.734940Minimum 7.426Maximum 3125.000Range 3117.574Interquartile Range 937.563Skewness .896 .173 Kurtosis .310 .344 男Mean 1066.92791 65.99321995% Confidence Interval for Mean Lower Bound 936.59779 Upper Bound 1197.258025% Trimmed Mean 986.95497Median 937.50000Variance 701171.907Std. Deviation 837.360082Minimum 58.630Maximum 6250.000Range 6191.370Interquartile Range 718.750Skewness 2.370 .191Kurtosis 10.166 .380收入Stem-and-Leaf Plots收入 Stem-and-Leaf Plot for性别= 女Frequency Stem & Leaf18.00 0 . 00111111111111111126.00 0 . 2222222222222333333333333317.00 0 . 4444444444455555533.00 0 . 66666666666666666666677777777777722.00 0 . 888999999999999999999913.00 1 . 000000000111118.00 1 . 22222222222222222318.00 1 . 4444555555555555554.00 1 . 77775.00 1 . 8888814.00 2 . 00000111111111.00 2 .4.00 2 . 55551.00 2 . 62.00 2 . 883.00 Extremes (>=3000)Stem width: 1000.000Each leaf: 1 case(s)收入 Stem-and-Leaf Plot for性别= 男Frequency Stem & Leaf15.00 0 . 00111111111111117.00 0 . 2222223333333333313.00 0 . 444444555555526.00 0 . 66666666666667777777777777 19.00 0 . 888889999999999999913.00 1 . 000000000001119.00 1 . 222222222222222222313.00 1 . 44445555555552.00 1 . 776.00 1 . 8888896.00 2 . 00011112.00 Extremes (>=2351)Stem width: 1000.000Each leaf: 1 case(s)结果分析如下收入女男平均数1005.28562 1066.92791均数的95%可信区间(907.63853,1102.93272)(936.59779,1197.25802)5%的调整均数957.92011 986.95497 中位数937.50000 937.50000标准差696.734940 837.360082标准差485439.577701171.907最小值7.426 58.630最大值3125.000 6250.000极差3117.574 6191.370四分位数间距937.563 718.750偏度系数 2.370 2.370峰度系数.31010.166(3)p-p图分析结果分析年龄在正态p-p图的散点近似成一条直线,无趋势正态p-p图的散点均匀分布在直线y=0的上下,故可认为本资料服从正态分布4、相关分析。

相关分析是分析客观事物之间关系的数量分析法,明确客观事之间有怎样的关系对理解和运用相关分析是极其重要的。

函数关系是指两事物之间的一种一一对应的关系,即当一个变量X取一定值时,另一个变量函数Y可以根据确定的函数取一定的值。

另一种普遍存在的关系是统计关系。

统计关系是指两事物之间的一种非一一对应的关系,即当一个变量X 取一定值时,另一个变量Y无法根据确定的函数取一定的值。

统计关系可分为线性关系和非线性关系。

事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。

如何测度事物之间的统计关系的强弱是人们关注的问题。

相关分析正是一种简单易行的测度事物之间统计关系的有效工具。

上表是对本次分析数据中,旅游花费、收入、、额外收入的相关分析,表中相关系数旁边有两个星号(**)的,表示显著性水平为0.01时,仍拒绝原假设。

一个星号(*)表示显著性水平为0.05是仍拒绝原假设。

先以现旅游花费这一变量与其他变量的相关性为例分析,由上表可知,旅游花费与额外收入的相关性最大,5.回归分析有相关性分析可得收入,旅游花费呈线性相关,因此作回归分析Variables Entered/Removed bModel VariablesEnteredVariablesRemoved Method1 收入a. Entera. All requested variables entered.b. Dependent Variable: 旅游花费由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为$3,000,0,因此可采取单样本t检验来进行分析。

分析如下:One-Sample Statistics单个样本统计量单个样本检验检验值 = 0t df Sig.(双侧)均值差值差分的 95% 置信区间 下限上限收入25.666358.000 1032.930214 953.78493 1112.07550由One-Sample Statistics 可知,359个被调查的人中收入平均值1032.93021 ,标准差为762.523942,均值标准误差为40.244474。

图表One-Sample Test 中,第二列是t 统计量的观测值为25.666;第三列是自由度为358(n-1);第四列是t 统计量观测值的双尾概率值;第五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%的置信区间为(953.78493 , 1112.07550)。

相关主题