统计学例题-统计整理
-
-
29
例:单项式分组
育龄妇女生育子女存活数
按存活数分组(个)
0 1 2 3 4 5 合计
人数 f
7 24 35 20 10 4 100
2019/10/31
30
例:品质数列
按企业类型分组
国有企业 独资企业 合资企业 民营企业
合计
频数 f
24 35 20 10
89
2019/10/31
品质数列
31
例:组限的重叠(连续)排列
—
次数/频数
第三章 统计数据的整理
34
志值 D.总体各单位具有某一共同的品质标志或数量标志。
简单现象总体
车间名称
一车间 二车间 合计
产量(万件)
2011 f0 9 6
2012 f1 14 12
15
26
4
复杂现象总体
产品
A 产品 B 产品 C 产品 合计
产量
单位
f
吨
900
千件
160
立方米
500
-
-
5
简单现象总体(与前比较)
产 品 单位
认识统计总体:
3,调查某市的失业率,则调查对象是全市的:
A.就业人口, B.失业人口, C.总人口, D.经济活动人口(A+B)。
统计总体的同质性指:
A.总体各单位具有全部共同的品质标志或数量标志 B.总体各单位具有全部共同的品质标志属性或数量标
志值 C.总体各单位具有某一共同的品质标志属性或数量标
第三章 统计数据的整理
20
例 某企业电子元件耐用时数抽样资料
单位:小时
830 880 1 170 1 080 1 250 1 360 1 410 1170
810 1 130 1 080 1 010 1 270 1 250
1 230 1 050 1 270 1 230 1 140 1 050
1 100 1 100 1 420 1 260 1 190 1 250
700~800,800~900 900~1000,……
10~49,50~99, 100~199,……
月工资水平 800~1000,1000~1500, (元/人) 1500~1800,1800~2000
第三章 统计数据的整理
16
例:
某小组10名学生某课程的考试成 绩如下(单位:分)
65,69,74,76,78,80,80, 84,88,89
第三章 统计数据的整理
12
随机数表的应用
可以从表中的任意一个位置开始,方 向也可自由选择。
如:350882513998900927…… 对应的(两位数)学号为:35,50,
08,25,51, 13, 39,09, 27,……
10/31/2019
13
例 简单分组的平行排列
按经济成分 分组
公有经济 非公有经济
按企业规模 分组
大型企业 中型企业 小型企业
按企业登记注册类型 分组
内资企业 外商投资企业 港澳台商投资企业
注:不属于复合分组 每一组只能固定一个因素,同时又掩盖了其他因
素对差异的影响。
第三章 统计数据的整理
14
平行排列与重叠排列
平行排列
重叠排列
技术人员
技术职称
企业 总 数 高称职称 中级职称 初级职称
10/31/2019
23
1、将原始资料按其数值大小重新排列
36 82 89 90 93 96 97 99 100 104 106 107 107 108 108 109 112 112 113 114 105 115 117 119 121 121 123 125 125 129
10/31/2019
24
2、确定全距
确定全距前,要检查数据组两端有没 有极端值。
计算全距前应去掉极端值。本例有极 端值36。
全距 = 129‐82 = 47
10/31/2019
25
3、确定组距和组数
组距= 全距/组数 组距应采用整数,最好是5或10的整
倍数 组距 = 47/5 = 9.4,调整为10
10/31/2019
26
4、确定组限
如果变量值相对集中,无特大或特小的极 端值时,则采用闭口式;
反之,如果有特大或特小的极端值时,则 采用开口式。
本例可设置下限开口组,最大组的上限可 取整数130
10/31/2019
27
5、编制变量数列
注:当关注标 志值较大的各 组分布时,用 向下累计
单位:小时
频率 ( fi / ∑ fi )
0.10 0.02 0.16 0.22 0.22 0.14 0.08 0.06
合计
50
1.00
第三章 统计数据的整理
22
例
某公司下属30家连锁店的营业额如下,试编制分 布数列(单位:百万元)。 89 129 125 107 112 121 97 36 100 108 114 106 117 90 108 104 109 112 93 113 105 107 115 121 119 96 123 99 82 125
某班学生统计学考试成绩
按考试成绩分组 学生人数 f
60分以下
7
60~70
8
70~80
16
80~90
6
90分以上
3
合计
40
按上限不在内原则: 将70分归入此组
2019/10/31
32
例:组限的衔接(间断)排列
下限开口组 上限开口组
按学生年龄分组 学生人数 f
9岁以下
7
10~19岁
28
20~29岁
35
10
时间概念总体
某省国有企业科技人员统计表
年份
2001 2002 2003 2004
科技人员总数年 (人) 334 784 351 844 372 711 379 016
平均每万人中 科技人员(人)
108.4 112.1 116.8 117.1
11
随机数表
688 680 800 668 152 562 941 288 434 433 584 475 717 498 314 773 547 312 422 350 882 513 998 900 927 879 566 162 904 524 569 853 789 201 832 781 246 598 361 252 359 323 439 386 300 394 578 135 852 699 980 242 732 689 131 258
名称
男女
合 计
男
女
合 计
男
女
合 计
男
女
合 计
合计
第三章 统计数据的整理
15
例:组距式分组举例
分组形式 等距分组
异距分组
统计总体
某市所有 医院
某市所有 商业职工 某市所有 商业企业
某市所有 居民家庭
分组标志 (变量)
病床数 (张)
月工资水平 (元/人)
职工人数 (人)
各个组别 (各变量值组)
100~199,200~299 300~399,400~499
学生数 (人)
2 3 5 10
次数/频数
比重 (%)
20 30 50 100.00
频率
第三章 统计数据的整理
19
表 学生按考试成绩分组 (变量分布数列)
考试成绩 (分)
65~75 75~85 85~95
合计
学生数 (人)
3 5 2
10
比重 (%)
30 50 20
100.00
思考:表3与表4哪个组距数列较真实地反映总体内各 单位的实际分布特征?
A 产品 B 产品 C 产品
合计
吨 千件 立方米
-
产值(万元)
3 000 1 850 2 800 7 650
6
单层总体:
某小组10名学生某课程的考试成 绩如下(单位:分)
65,69,74,76,78,80,80, 84,88,89
7
多层总体
性别
男生 女生 合计
学生数(人)
40 60 100
合计
单位:小时
频数或次数 频率
( fi ) ( fi / ∑ fi )
5
0.10
1
0.02
8
0.16
11
0.22
11
0.22
7
0.14
4
0.08
3
0.06
累计 频数
5 6 14 25 36 43 47 50
累计 频率
0.10 0.12 0.28 0.50 0.72 0.86 0.94 1.00
50
1.00
1 180 1 580 1 210 1 460 1 070 1 370 1 200 1 630 1 180 1 030 870 1 150 1 380 1 510 1 010 860 1 260 1 350 930 1 420 1 160 1 320 1 380 1 310
注:等距分8组,组距为100,以800为第一组下限。
30~39岁
20
40岁以上
10
合计
100
2019/10/31
33
频率密度(或次数密度)
考试成绩 (分)
40~60 60~80 80~90 90~100
合计
学生数 (人)
4 5 7 4
20
比重 (%)
20 25 35 20
100.00
频数 密度