当前位置:文档之家› 第三章 社会统计资料的整理2015

第三章 社会统计资料的整理2015


统计表
1. 格式 总标题
纵栏标题
统计表是表示统计 资料的表格,在由横行 、纵栏交叉结合而成的 表格上,它能系统地组 织和合理地安排大量数 字资料。
横行标题 统计数值
2002年我国城乡人口情况
按城乡分 人口数(万人) 比重(%) 城镇 乡村 合计
50212 78241 128453
39.09 60.91 100.00
资料来源|:《2003中国统计年鉴》第838页。
统计表的制作规则
标题部分 1、标题置于表格正上方 2、总标题所示要点与表中项目一致,在需要时还应表 明资料所属的时间和地区 3、表次:左 ;单位:右 4、对分页的同一表格,在每页上端都要写标题,加 (续一)、(续二) 栏目部分 1、先局部后整体 2、若栏目较多,可加以编号;统计数字间有计算关系 的,可用计算式表达。
91.4 51.1 40.3 28.5 7.9 20.6 23.1 13.7 9.4 143.0
2000
107.6 60.7 46.9 31.7 8.3 23.4 28.7 19.0 9.7 168.0
2001
108.1 69.5 38.6 29.5 12.1 17.4 40.5 26.4 14.1 178.1
异距分组
异距分组主要在变量变动并不是均匀的、有急剧上
升或突然下降之类情况发生时考虑。
频数 频数密度 组距
标准组距频数的换算方法:
(1)选定某一合适的组距为标准组距; (2)用标准组距除以各组组距,得到折合系数; (3)将各组的折合系数乘以各组的频数。
频率密度 频率 组距
频数密度和标准组距频数计算表

线格部分 1、统计表上下两端线应以粗线或双细线标划,表的 左右两侧开口。 2、各栏间用直线标划,大项目间线条较粗,小栏目 线条较细;各行间不必划线条。 数字部分 1、表中数字要对准位数。 2、不存在某数字时,用“——”表示;缺少某项数字 时,用“……”表示。 3、数字较大时,加分位点。 其他规则 1、资料来源写在表格下方。 2、有说明解释需要时,在表下方注释。 3、单位有数种时而不能在表右上角划一标注时,分 两种情况处理。
间距 8―14 15―21 22―28 29―35 36―42 合计 组中值( ) 组中值( 11 18 25 32 39 —— 学校数(f )
i
2 5 10 8 4 29

编制注意四点:相邻组组限是间断的;这 两个组限在整数值上又必须衔接;组限应 使组中值为整数值,以利于计算;虽然每 一组中各变量值不尽相同,但计算时假设 他们相同,而且就是该组的组中值。
解:学生体重是分布均匀的连续型变量,应编制组距数列。 第一步,先将100个数据排序,找出最大值154和最小值80, 这个数列的全距R=154-80=74厘米。 第二步,根据斯特奇斯规则确定组数:n = 1 + 3.322×(lg100) = 7.64,再根据组数与组距的关系确定组距: h= R/n = 74/7.64 =9.51(斤)。根据以上的计算结果, 组数定为8组;组距定为10斤。 第三步,根据所定组数和组距确定组限。第一组下限定为 80,上限则为90(即80+10);第二组下限就是第一组上 限90,第二组上限为100;……;依此类推,第八组下限 是150,其上限则为160。 第四步,进行归组,确定频数。将各个变量值归入相应的 组中,和组限重合的变量值按照“上限不在内,相同入下 限”的原则进行归组,比如154归入第八组(150-160); 133归入第六组(130-140);……;依此类推。 第五步,把最后的结果用频数分布表显示,见表3.3。
连续变量数列
连续变量因其数学特征,在一个区间可以有无限多数 值,无法按顺序一一列举,所以只能编制组距数列。与离 散变量组距数列不同之处在于,根据连续变量的特征,此 时组距数列中相邻两组的上限和下限共有一个组限,即相 邻两组交界处的组限重合。至于恰等于某一组限的数据(如 下表中身高164厘米)归于哪一组,应该按照“上限不包括 在内、相同入下限”的原则处理。这就是说,164应归于 “164—168”这一组,而不应归于“160—l64”这一组。有 了这一规定,就不会在编制连续变量的数列时,发生违背 “穷举”与“互斥”这两个基本原则的情况了。
男青年按身高分 组(厘米) 148―156 156―164 164―168 168―172 172―176 176―180 180―188 188―196 频数 3 15 19 25 17 12 8 1 组距 8 8 4 4 4 4 8 8 频数密 折合系数 度 (取标准组距4) 3/8 15/8 19/4 25/4 17/4 12/4 8/8 1/8 1/2 1/2 1 1 1 1 1/2 1/2 标准组距频 数 1.5 7.5 19.0 25.0 17.0 12.0 4.0 0.5
2. 内容 主词——统计表所要说明的对象。 宾词——用来说明主词的标志和标志值。 如需要,主宾词可互换。 表3.4
草 率 型 离婚案件 (件) 比重(%) 85 14 外 遇 型 79 13
离婚案件构成
猜 疑 型 64 10 虐 待 型 44 7 再 婚 型 44 7 家 务 型 188 31 生 理 型 46 7 分 居 型 14 2 其 他 型 59 9 合 计 623 100

简单分组表 中国人口年龄结构状况
单位:%
年龄组 0―14岁 15―64岁 65岁以上
1953年 36.3 59.3 4.4
1964年 40.7 55.7 3.6
1982年 33.6 61.5 4.9
1990年
27.7 66.7 5.6
2000年
22.9 70.1 7.0
资料来源|:《2003中国统计年鉴》第99页。
频数分布数列
在统计资料搜集的基 础上,按分组原则,将总 体中所有单位依一定顺序 归类整理,即可得到能够 表明总体单位总数在各组 分配情况的频数(或次数) 分布数列,简称数列。频 数分布数列是统计分组工 作的产物。
变量数列
品质数列
某社团成员的构成
性别 男 女 人数 28 22 年龄 15--25 25--35 35--45 45--55 55--65 人数 3 7 12 158 165 162
157 175 182 168 176 161 171 163 176 159 171 178 172 169 158 163 166 168 160 178 170 164 160 170 166 178 171 167 162 169 165 171 165 168 176 174 163 177 164 170 161 179 177 162 149 169 166 153 177 164
合计
——
100
——
确定组距和组数
对于等距分组且为闭口组的情况,确定组距 已有某些数学公式可供参考
R h 1 3.322IgN
但最佳决定还是依据常识和数列使用的目的而 定。一般地说,组距应不小于可以忽略的数值之差。
全距(R) 组数(n) 组距(h)
注意,在资料被整理成数列时,全距可适当放大 (但不能缩小),以便组数(或组距)取整数值。

第三节 变量数列的编制
变量数列的构成要素
在社会统计学中,总体中各单位的分布特征首 先是用统计表来表示的。能够表示变量分布及其特 = 征的统计表,即变量数列。它有两个构成要素: 变量值 Xi 频数 fi 相对频数 Pi
fi Pi N
f N
i 1 i
n
P 1
i 1 i
n
离散变量数列
● 复合分组表
我国社会福利主要费用情况
项目
(一)优抚对象补助金额 国家支出 集体供给 (二)农村传统救济金额 国家支出 集体供给 (三)城乡各种福利院支出 国家支出 集体供给 合计
单位:亿元
1998
68.0 32.4 35.6 29.8 7.0 22.8 20.2 10.3 9.9 118.0
1999
第三章 社会统计资料的整理
原始资料杂乱无章,需加整理,才能为人所用。统计资料的整 理,其基础是统计分组。 所谓统计分组.就是按统计研究的目的和要求,将总体单位或 全部调查数据按一定的标志划分成若干组,使组内差异尽量小,而 组与组之间则有明显差异,从而使原本杂乱无章的资料有序化,以 便为在统计分析中提炼各种有用信息打下基础。 统计分组的原则与标准
第二节 统计表
100名男性青年的身高表
统计调查搜 集来的资料往往 是没有次序的原 始资料(参见右表 ),使原始资料有 序化,列表和作 图是两种基本方 法,得到的分别 就是统计表和统 计图。
单位:厘米
166 181 173 171 168 164 178 167 156 194 169 175 183 168 165 180 170 172 167 175 173 169 174 172 171 169 173 184 173 169 170 181 185 168 174 187 167 174 169 165
主要内容
统计表 变量数列的编制 统计图
第一节 统计分组的原则与标准
统计分组的原则
1.分组应使各类别构成之和等于总体
“穷举 “互斥 ” ” 穷举,分组穷尽总体的全部单位; 互斥,分组界限使每一数据只归属一组。 2.分组设计应能反映统计总体的分布规律性
统计分组主要是为了能很好地反映统计总体的构成状况, 即反映总体中各单位的分布特征。分组设计要适应这一要求, 必须在分组后使总体单位总数在各组的分配情况能够反映总体 的分布规律性。
离散变量所描述的对象的数量特征,可以按一定次 序列出它的整数值,相邻两变量值不会出现小数,因而 能编制出单项式和组距式两种变量数列。 单项数列 组距数列
组距(hi) =上限(ui) ―下限(li)
li ui 组中值( mi) = 2
相关主题