《统计分析软件(双语)》实验报告题目:关于“某地区买房数据”的分析报告姓名:学号:1204100215专业:统计学院系:统计学院指导教师:完成日期:2014年12月10日摘要利用SPSS统计分析软件对“某地区买房”数据进行了描述性统计分析,比较均值,相关分析,回归分析四大类型的数据分析。
其中在描述性统计分析中作了频数分析,探索分析,交叉分析,得出了该地区中年龄段在25~45居多,就业大多在国企,文化程度高中和大学所占比重大;大学学历的现居住面积较大,其最大值,最小值以及均值均大于其他三种学历的居住面积。
人均居住面积的单样本T检验的出了的结论是人均居住面积与均值之间存在显著性差异。
现居住面积和人居住面积的双变量的相关分析得出了两者之间存在显著性差异。
在回归分析中得出的结论是现居住面积是服从正态分布的且和满意度是显著相关的。
目录一、数据简要 (3)二、数据分析 (3)(一)描述分析性统计, (3)1,就业状况的频数分析 (3)2,文化程度的频数分析 (3)3,现居住面积及人均居住面积的描述性分析 (3)4,居住面积和文化程度的探索分析 (3)5,文化程度与年收入的交叉列联表分析 (3)(二)均值比较 (3)1,人均现住面积和年龄段的描述统计 (3)2,人均居住面积的单样本T检验 (3)3,现居住面积的独立样本T检验 (3)(三)相关分析 (3)1,现居住面积和人居住面积的双变量的相关分析 (3)2,人均居住面积,现居住面,居住类型的偏相关分析 (3)(四)回归分析 (3)三、小结 (3)一、数据简要本次分析的数据为某年某地719个人买房情况统计表,一共有11个变量,其中现居住面积与人均居住面积为scale变量,其余9个变量为nonscale变量,依次为年龄段,文化程度,从业状况,家庭类型,家庭年收入,住房满意度,卖掉现房,购买户型,是否贷款。
二、数据分析(一)描述分析性统计,1,就业状况的频数分析图1:就业状况条形图2,文化程度的频数分析图2:文化程度扇形图从图二中可以看出文化程度最比例最多的为高中占42.98%,接下来是大学为35.47%,初中以下为19.61%,最少的为研究生及以上只占1.95%。
3,现居住面积及人均居住面积的描述性分析表1:现居住面积及人均居住面积的描述性分析表Descriptive StatisticsN Minimum Maximum Mean Std. Deviation现居住面积719 6.00 168.00 58.9062 24.03677人均现住面积719 2.400 101.000 20.55481 12.728884Valid N (listwise) 719现居住面积及人均居住面积的描述性分析表表示现居住面积的有效数据为719,最小值,最大值,均值,标准差依次为6,168,58.9062,24.03677.由此可以得出现居住面积平均面积为58.9062,居住面积的围在6~168平方米之间,标准差为24.03677平方米。
而均值的有效数据为719,最小值,最大值,均值,标准差依次2.4,101,20.55481,12.728884。
,4,居住面积和文化程度的探索分析图3:居住面积和文化程度的探索分析箱图从居住面积和文化程度的探索分析箱图可以得出,大学学历的现居住面积较大,其最大值,最小值以及均值均大于其他三种学历。
也可以知道初中学历,高中,大学均有离群值,而研究生及以上没有离群值。
5,文化程度与年收入的交叉列联表分析表3:文化程度与年收入的交叉列联表Case Processing SummaryCasesValid Missing TotalN Percent N Percent N Percent文化程度* 家庭年收入719 100.0% 0 .0% 719 100.0%文化程度与年收入的交叉列联表给出了参加分析计算的样品统计,共有样品719个,没有缺失值,均为有效值。
图4:文化程度与年收入的交叉列联表从图3交叉分组下的频数分布图,从图中可以得出年收入最多75000元以上的在大学学历中,在高中及大学中年收入最多的为10000~25000元之间。
在初中学历中年收入大多都在5000~25000元之间。
研究生及以上的在10000~25000居多。
(二)均值比较1,人均现住面积和年龄段的描述统计表3:人均现住面积和年龄段的描述统计表Report表人均现住面积和年龄段的描述统计表是以年龄段为分组变量的统计结果,可以看出,不同年龄段的人均居住面积的有较大差异,人均居住面积最多的26.63721平方米在25岁以下,最少的18.01224平方米在35~45之间。
2,人均居住面积的单样本T检验表4:One-Sample StatisticsOne-Sample StatisticsN Mean Std. Deviation Std. Error Mean人均现住面积719 20.55481 12.728884 .474707基本统计量分析,如表可知,参与分析的样品数有719,平均值为20.55481,标准差为12.72884,均值误差为0.474707。
表5:One-Sample Test从表5可知单样本T检验结果为:自由度为718,t统计量为43.300,对应的置信水平为0,000,95%的置信区间为(19.6228,21.4868),因T=43.300对应的置信水平为0远小于0.05,因此拒绝原假设。
既人均现住面积与均值20.55481存在显著性差异。
3,现居住面积的独立样本T检验表6:Independent Samples Test表为独立样本T检验的结果,从表中可知,对样本的方差是否相等检验的结果为统计量F=0.,对应的置信水平为0.771,既拒绝原假设,两样本方差不等。
而对于T检验的结果为自由度为277,T=-0.,对应的置信水平为0.954远远大于设置的0.05,因此现居面积不存在显著新差异。
Group Statistics购买户型N Mean Std. Deviation Std. Error Mean现居住面积两室两厅94 56.0851 20.47378 2.11171 三室一厅185 56.2330 20.09668 1.47754表7:Group Statistics从上表中可知,参与分析的样本中两室两厅的有94个,其均值为56.0851,标准差为20.47378,均值误差为2.11171。
三室一厅的有185个,其均值为562330,标准差为20.09668均值误差为1.47754。
(三)相关分析1,现居住面积和人居住面积的双变量的相关分析表8:现居住面积和人居住面积的双变量的相关分析表Correlations现居住面积人均现住面积现居住面积Pearson Correlation 1 .572**Sig. (2-tailed) .000N 719 719人均现住面积Pearson ()Correlation .572** 1Sig. (2-tailed) .000N 719 719**. Correlation is significant at the 0.01 level (2-tailed).从现居住面积和人居住面积的双变量的相关分析表可以看出,现居住面积和人居住面积的相关系数为r=0,517,显著性水平为0.000(Sig.(2-tailed)),因此在相关系数旁以两个“**”号进行标记,现居住面积和人居住面积的相关性十分显著。
2,人均居住面积,现居住面,居住类型的偏相关分析表9:人均居住面积,现居住面,居住类型的偏相关分表CorrelationsControl Variables 人均现住面积家庭类型现居住面积-none-a人均现住面积Correlation 1.000 -.564 .572Significance (2-tailed) . .000 .000df 0 717 717 家庭类型Correlation -.564 1.000 .169Significance (2-tailed) .000 . .000df 717 0 717 现居住面积Correlation .572 .169 1.000Significance (2-tailed) .000 .000 .df 717 717 0 现居住面积人均现住面积Correlation 1.000 -.817Significance (2-tailed) . .000df 0 716家庭类型Correlation -.817 1.000Significance (2-tailed) .000 .df 716 0a. Cells contain zero-order (Pearson) correlations.从人均居住面积,现居住面,居住类型的偏相关分表可以看出人均居住面积,居住类型偏相关系数的r=-0.564,对应的显著性水平为0.000(Sig.(2-tailed)),既人均居住面积和居住类型为负显著相关。
(四)回归分析表10:现居住面积和居住满意度的一元线性回归分析表Model Sum of Squares df Mean Square F Sig.1 Regression 36018.768 1 36018.768 68.174 .000aResidual 378817.382 717 528.337Total 414836.150 718a.Predictors: (Constant), 住房满意度b.Dependent variadble:现居住面积从现居住面积和居住满意度的一元线性回归分析表可以看出离差平方和为36018.768,残差平方和为378817.382,而回归平方和为414836.150。
统计量F=68.174,对应的置信水平为0.000,远比0.05要小,因此可以认为现居住面积和居住满意度是显著的。
图6:正态P-P图图5:标准化残差的直方图标准化残差的直方图,用来表示残差的分布情况。
图6:正态P-P图正态P-P图,该图是用观察标准化残差分布是否符合正态分布,如果是,则图中散点图近似为一条直线,且为对角线重叠。
而图6的结果刚好满足,所以现居住面积服从正态分布。
三、小结从以上分析可以了解到买房与年龄段,文化程度,就业情况,家庭年收入等有一定的关系。
不同年龄段的人均居住面积的有较大差异,人均居住面积最多的26.63721平方米在25岁以下,最少的18.01224平方米在35~45之间。
这个结果的原因可能是因为在25岁以下的时候还和父母一起居住,而这个时候家庭已到成熟期,故人均居住面积较大,而在35~45岁之间自己的小家庭才是发展期,有小孩儿出生,且事业刚刚稳定,所以人均居住面积会相对较小。