统计分析综合实验报告学院:专业:姓名:学号:统计分析综合实验考题一.样本数据特征分析:要求收集国家统计局2011年全国人口普查与2000年全国人口普查相关数据,进行二者的比较,然后写出有说明解释的数据统计分析报告,具体要求如下:1.报告必须包含所收集的公开数据表,至少包括总人口,流动人口,城乡、性别、年龄、民族构成,教育程度,家庭户人口八大指标;2.报告中必须有针对某些指标的条形图,饼图,直方图,茎叶图以及累计频率条形图;(注:不同图形针对不同的指标)3.采用适当方式检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同,写明检验过程及结论。
4.报告文字通顺,通过数据说明问题,重点突出。
二.线性回归模型分析:自选某个实际问题通过建立线性回归模型进行研究,要求:1.自行搜集问题所需的相关数据并且建立线性回归模型;2.通过SPSS软件进行回归系数的计算和模型检验;3.如果回归模型通过检验,对回归系数以及模型的意义进行解释并且作出散点图一、样本数据特征分析2010年全国人口普查与2000年全国人口普查相关数据分析报告2011年第六次全国人口普查数据显示,总人口数为1370536875,比2000年的第五次人口普查的1265825048人次,总人口数增加73899804人,增长5.84%,平均年增长率为0.57%。
做茎叶图分析:描述年份统计量标准误人口数量2000年均值40084265.35 4698126.750 均值的 95% 置信区间下限30489410.50上限49679120.215% 修整均值39305445.50中值35365072.00方差684244243725744.400标准差26158062.691极小值2616329极大值91236854范围88620525四分位距41049359偏度.503 .421 峰度-.652 .8212011年均值42992737.65 4963014.104 均值的 95% 置信区间下限32856910.64上限53128564.655% 修整均值41924325.67中值37327378.00方差763576778787588.500标准差27632893.059极小值3002166极大值104303132范围101300966四分位距36481362偏度.625 .421 峰度-.332 .821茎叶图箱形图:(二)流动人口2011年人口普查数据中,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口为261386075人,同2000年第五次全国人口普查相比,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口增加116995327人,增长81.03%。
(三)城乡构成2011年人口普查显示居住在城镇的人口为665575306人,占49.68%;居住在乡村的人口为674149546人,占50.32%。
2000年农村居民人口数为783841243人,占63.08%;城镇居民则有458770983人,占36.92%。
同2000年第五次全国人口普查相比,城镇人口增加207137093人,乡村人口减少133237289人,城镇人口比重上升13.46个百分点。
通过下面的条形图可以清楚的看到2000年—2011年十年间,农村居民减少而城镇居民增加。
(四)性别构成2000年第五次人口普查男性人口为640275969人占51.53%;女性人口为602336257人,占48.47%。
2011年第六次人口普查显示男性人口为686852572人,占51.27%;女性人口为652872280人,占48.73%。
通过下面的饼图可以放大百分比上些微的变化(两个年份左边较小的部分均为女性人口数),总人口性别比(以女性为100,男性对女性的比例)由2000年第五次全国人口普查的106.74下降为105.20。
(五)年龄构成2000年人口普查:0-14岁人口为284527594人,占22.90%;15-59岁人口为828106762人,占66.64%;60岁及以上人口为129977870人,占10.46%。
2011年人口普查:0-14岁人口为222459737人,占16.60%;15-59岁人口为939616410人,占70.14%;60岁及以上人口为177648705人,占13.26%。
同2000年第五次全国人口普查相比,0-14岁人口的比重下降6.29个百分点,15-59岁人口的比重上升3.36个百分点,60岁及以上人口的比重上升2.93个百分点,65为了进一步分析各年龄段,根据联合国卫生组织的新划分标准将年龄进一步细分,用直方图进行分析。
原始数据整理如下:两次人口普查年龄数据单位(人)年龄段2000年2011年少儿(0~14岁)284527594 221322621青年(15~44岁)632911142 668233610中年(45~59岁)195195620 265660198年轻老年人(60~74岁)102058457 132752961老年人(75~89岁)26948186 42857259长寿老人(90岁及以上)971227 1984220利用SPSS软件将六个年龄段分别赋值,1=“少年”,2=“青年”,3=“中年”,4=“年轻老年人”,5=“老年人”,6=“长寿老人”。
然后将描述统计量以1300万为一单位分为个体数据,通过直方图显示其分布频数。
通过直方图的分布可以得出,两次统计结果显示了相似的正态分布。
青年人口数量占有绝对较高的比例。
具体看到各个年龄段的人口变化(为了方便陈述,以数值代指各年龄段),年龄段1有较明显的人口数量减少,年龄段2、3、4、5在其原有基础上缓慢增长,年龄段3取代年龄段1变为人口数第二的年龄段。
由于年龄段6人口数始终较少,在处理数据过程中其特征无法被放大,2000年年龄段6的频数为0.242,2011年增长到0.496,其增长比例是最为显著的,说明随着社会经济的发展高龄老年人数量逐渐增多。
(六)民族构成2000年普查,汉族人口为1137386112人,占91.53%;少数民族人口为105226114人,占8.47%。
2011年普查,汉族人口为1225932641人,占91.51%;各少数民族人口为113792211人,占8.49%。
同2000年第五次全国人口普查相比,汉族人口增加66537177人,增长5.74%;各少数民族人口增加7362627人,增长6.92%。
(七)教育程度2000年人口普查时,具有大学(大专及以上)文化程度的人口为44020145人;具有高中(含中专)文化程度的人口为138283459人;具有初中文化程度的人口为422386607人;具有小学文化程度的人口为441613351人,文盲人口(15岁及以上不识字的人)为85069667人。
2011年,具有大学(大专及以上)文化程度的人口为119636790人;具有高中(含中专)文化程度的人口为187985979人;具有初中文化程度的人口为519656445人;具有小学文化程度的人口为358764003人,文盲人口(15岁及以上不识字的人)为54656573人。
同2000年第五次全国人口普查相比,每10万人中具有大学文化程度的由3611人上升为8930人;具有高中文化程度的由11146人上升为14032人;具有初中文化程度的由33961人上升为38788人;具有小学文化程度的由35701人下降为26779人。
用累计频率条形图对教育程度进行进一步分析,类似于年龄构成的数据处理方法,以1000万为单位对各个文化段的人口数进行调整,得出具体的个体值,再利用SPSS软件分别作出两次普查教育程度的累计频率条形图。
从上图可以看到大学(大专及以上)文化程度的人口占比特别低。
累计高中以上文化程度为20%不到,累计初中以上文化程度为50%多,累计小学以上文化程度为90%左右。
通过简单的相减可以得出结论,占比最大的文化段应该在小学文化程度。
另外注意到小学文化程度过后的文盲,占比约有10%。
根据2011年人口普查的数据,首先,大学(大专文化及以上)程度人口有显著增长,接近翻倍。
其他文化程度(除文盲)也都有所增长,其中累计高中以上文化程度频率约为25%,累计初中以上文化程度频率约65%,累计小学以上文化程度频率约95%。
同样可以直观的了解到,占比最大的文化段由小学文化程度移至初中文化程度。
最后看到文盲所占比重,相比较十年前,削减了近二分之一。
总的来说,对比两次普查,可以很肯定的说十年间我国教育事业取得了较为显著的成绩,国民受教育水平有较大提升。
(八)家庭户人口2000年人口普查家庭户人口数共有1178271219人,有家庭户340491197,平均每个家庭3.44人。
2011年增长到1244608395人,平均每个家庭户的人口为3.10人,比2000年减少0.34人。
(九)对两次普查人口年龄比例这一指标是否有显著不同的检验。
采用配对样本T检验,表1-3和表1-4给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。
根据表1-5配对样本T检验的最后结果(p=0.588>0.05)显示:第六次人口普查和第五次人口普查在人口年龄比例这一指标上没有显著差异。
表1-3:表1-4:两次人口普查三个年龄段(0—14岁,15—59岁,60岁及以上)数据的相关系数成对样本相关系数N 相关系数Sig.对 1 第五次人口普查 & 第六次人口普查3 .987 .102表1-5:(十)对两次普查人口教育程度这一指标是否有显著不同的检验。
采用配对样本T检验,表1-6和表1-7给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。
根据表1-8配对样本T检验的最后结果(p=0.555>0.05)显示:第六次人口普查和第五次人口普查在教育程度这一指标上没有显著差异。
两次人口普查教育程度的描述统计量表1-6:成对样本统计量均值 N标准差 均值的标准误 对 1第五次人口普查226274645.805190872115.13085360604.888第六次人口普查248139958.005189424303.93984713124.040表1-7:成对样本相关系数N相关系数Sig. 对 1第五次人口普查 & 第六次人口普查5.920.027表1-8:配对样本T 检验结果 成对样本检验成对差分 t df Sig. (双侧)均值标准差均值的标准误差分95%置信区间下限上限对 1第五次人口普查 – 第六次人口普查 -21865312.20 75908086.27 33947128.19 -116117650.172387025.69 -.644 4 .555二、一元线性回归分析北京市1995-2015年城镇居民消费性支出与可支配收入的关系1. 问题背景:随着中国经济的高速持续增长,人们生活水平日益提高,作为我国经济文化中心,且经济发展水平位居前列的首都北京,其城镇居民消费水平在这中国经济崛起的二十多年里亦是有着翻天覆地的变化。