统计分析方法:应用及案例名称:姓名:学号:年级专业:12级电子科学与技术年月日成绩:评语:指导教师:(签名)关于某地区361个人旅游情况统计分析报告一、提出问题为了了解某地区的旅游情况,发展该地的旅游经济,促进该地人民的生活水平的提高,现通过SPSS软件对某地区361个人旅游情况进行分析,从而更好地掌握该地旅游情况,为经济发展提出决策二、数据收集本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好4代表积极性非常好);额外收入,一类变量。
通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。
以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系此数据来源于/publications/jse/jse_data_archive.htm三、数据统计处理1、频数分析基本的统计分析往往从频数分析开始。
通过频数分地区359个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性况的基本分布。
Statistics性别N Valid 359Missing 0首先,对该地区的男女性别分布进行频数分析,结果如下性别Frequency Percent Valid Percent Cumulative PercentValid 女198 55.2 55.2 55.2男161 44.8 44.8 100.0Total 359 100.0 100.0表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性其次对原有数据中的旅游的积极性进行频数分析,结果如下表:旅游积极性Frequency Percent Valid Percent Cumulative PercentValid 差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6比较好79 22.0 22.0 91.6好24 6.7 6.7 98.3非常好 6 1.7 1.7 100.0Total 359 100.0 100.0Statistics通道N Valid 359Missing 0通道Frequency Percent Valid Percent Cumulative PercentValid 没走通道293 81.6 81.6 81.6通道66 18.4 18.4 100.0Total 359 100.0 100.0表说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。
上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171 人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%2、相关分析相关分析是分析客观事物之间关系的数量分析法,明确客观事之间有怎样的关系对理解和运用相关分析是极其重要的。
函数关系是指两事物之间的一种一一对应的关系,即当一个变量X取一定值时,另一个变量函数Y可以根据确定的函数取一定的值。
另一种普遍存在的关系是统计关系。
统计关系是指两事物之间的一种非一一对应的关系,即当一个变量X取一定值时,另一个变量Y无法根据确定的函数取一定的值。
统计关系可分为线性关系和非线性关系。
事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。
如何测度事物之间的统计关系的强弱是人们关注的问题。
相关分析正是一种简单易行的测度事物之间统计关系的有效工具。
Correlations收入旅游花费额外收入收入Pearson Correlation 1 .140**.853**Sig. (2-tailed) .008 .000N 359 359 359旅游花费Pearson Correlation .140** 1 .183**Sig. (2-tailed) .008 .000N 359 359 359额外收入Pearson Correlation .853**.183** 1Sig. (2-tailed) .000 .000N 359 359 359**. Correlation is significant at the 0.01 level (2-tailed).上表是对本次分析数据中,旅游花费、收入、、额外收入的相关分析,表中相关系数旁边有两个星号(**)的,表示显著性水平为0.01时,仍拒绝原假设。
一个星号(*)表示显著性水平为0.05是仍拒绝原假设。
先以现旅游花费这一变量与其他变量的相关性为例分析,由上表可知,旅游花费与额外收入的相关性最大,3、回归分析有相关性分析可得收入,旅游花费呈线性相关,因此作回归分析Variables Entered/Removed bModel VariablesEnteredVariablesRemoved Method1 收入a. Entera. All requested variables entered.b. Dependent Variable: 旅游花费Model Summary bModel R R Square Adjusted RSquareStd. Error of theEstimate1 .140a.020 .017 129.604a. Predictors: (Constant), 收入b. Dependent Variable: 旅游花费ANOVA bModel Sum of Squares df Mean Square F Sig.1 Regression 120443.809 1 120443.809 7.170 .008aResidual 5996596.239 357 16797.188Total 6117040.048 358a. Predictors: (Constant), 收入b. Dependent Variable: 旅游花费Coefficients aModel Unstandardized CoefficientsStandardizedCoefficientst Sig.B Std. Error Beta1 (Constant) 91.563 11.528 7.943 .000收入.024 .009 .140 2.678 .008Coefficients aModel Unstandardized CoefficientsStandardizedCoefficientst Sig.B Std. Error Beta1 (Constant) 91.563 11.528 7.943 .000收入.024 .009 .140 2.678 .008 a. Dependent Variable: 旅游花费Residuals Statistics aMinimum Maximum Mean Std. Deviation N Predicted Value 91.74 241.90 116.41 18.342 359 Std. Predicted Value -1.345 6.842 .000 1.000 359 Standard Error of PredictedValue6.840 47.362 9.048 3.426 359 Adjusted Predicted Value 92.09 271.79 116.53 19.018 359 Residual -193.904 891.785 .000 129.423 359 Std. Residual -1.496 6.881 .000 .999 359 Stud. Residual -1.607 6.891 .000 1.002 359 Deleted Residual -223.789 894.316 -.117 130.229 359 Stud. Deleted Residual -1.611 7.390 .004 1.025 359 Mahal. Distance .000 46.811 .997 2.955 359 Cook's Distance .000 .199 .003 .015 359 Centered Leverage Value .000 .131 .003 .008 359 a. Dependent Variable: 旅游花费Charts由上图可知回归方程:y=91.563+ 0.024 (x1) ,(P(Sig=0.000)<0.01)即旅游花费=91.563+0.024*收入( p<0.01) 4、参数检验(1)单样本T检验首先对现工资的分布做正态性检验,结果如下:由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为$3,000,0,因此可采取单样本t检验来进行分析。
分析如下:One-Sample Statistics单个样本统计量N 均值标准差均值的标准误收入359 1032.93021 762.523942 40.244474单个样本检验检验值 = 0t df Sig.(双侧) 均值差值差分的 95% 置信区间下限上限收入25.666 358 .000 1032.930214 953.78493 1112.07550由One-Sample Statistics可知,359个被调查的人中收入平均值1032.93021,标准差为762.523942,均值标准误差为40.244474。
图表One-Sample Test中,第二列是t统计量的观测值为25.666;第三列是自由度为358(n-1);第四列是t统计量观测值的双尾概率值;第五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%的置信区间为(953.78493 , 1112.07550)。
该问题的t值等于25.666对应的临界置信水平为0,远远小于设置的0.05,因此拒绝原假设,表明该地区被调查的359名人中收入与1032.93021存在显著差异。
(2)独立样本t检验T-TestGroup Statistics性别N Mean Std. Deviation Std. Error Mean旅游花费女198 126.09 149.533 10.627男161 104.51 102.187 8.053Independent Samples TestLevene's Test for Equality ofVariances t-test for Equality of Means95% Confidence Interval ofthe DifferenceF Sig. t dfSig.(2-tailed)MeanDifferenceStd. ErrorDifference Lower Upper旅游花费Equalvariancesassumed 6.302 .013 1.559 357 .120 21.5813.844 -5.647 48.806Equal variances not assumed 1.618 347.241.106 21.5813.334 -4.645 47.805四、结果分析及对策建议1、结果分析得到两组的均数(mean)分别为198 和161独立样本t检验,取的t值1.559与Sig为0.120 p>0..05旅游花费不成显著性差异,由图中可知旅行的旅游花费较高2、对策建议从上数据的结果可知,被调查者旅游积极性较差的好多,原因在于工资收入不是很高,用在旅游方面的花费就比较少。