统计学原理与实务
100
100
由于 i 不是整数,百分位数的位置就是第 i 1个位置的数据的整数部分,则第 30 个百
分位数是第 4 个数,即华夏银行的营业收入 176.11 亿元为第 30 个百分数。
n
2
xi x
(4) s i1
=1786.559(亿元), x 1462.809亿元
n 1
zi
xi
s
x
297.15-1462.809 1786.599
QU的位置
3n 4
3 13 4
9.75
即 QU 在第 9 个数值(1295.31)和第 10 个数值(3340.37)之间 0.75 的位置上,因此
QU 1295.31 (3340.37 1295.31) 0.75 2829.105(亿元)
(3)百分位数的位置 i P 13 30 13 3.9
多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的
高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开
排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
料的位置应安排合理。如果有合计一项,一般放在最后一行或最后一列。有时,由于强调的
问题不同,行标题和列标题可以互换,但应使统计表的横竖长度比例适当,避免出现过高或
过长的表格形式。
(2)统计表一般使用“三线表”的形式,如表 3—24 所示,表的上下两端横线一般用 粗线条绘制,用细线把行标题和数字资料进行分离,统计表的左右两端不封口。这样使人看
n
xi
平均数 x= i1
4900.04 4029.37 123.04 106.84 1462.809亿元
n
13
(2) QL的位置
n 4
13 4
3.25
即 QL 在第 3 个数值(145.13)和第 4 个数值(176.11)之间 0.25 的位置上,因此
QL 145.13 (176.11145.13) 0.25 152.875(亿元)
接收 20-30 30-40 40-50 50-60 60-70 70-80 80-90 合计
频率% 5 8 6 13 10 6 2 100
累积 % 10.00 26.00 38.00 64.00 84.00 96.00 100.00
-
(3)
.
10、 (1)
(2)
.
精品文档
11、 (1) (2) (3)
-0.65
4.2 通常情况下,这种比赛对选手的打分是计算切尾均值,即同时集中平均数和中位数 两种统计量的优点,且考虑到歌手 B 的得分中存在极端高分,故用切尾均值比较合适。
首先将歌手 A 的分数按升序整理为顺序统计量,得到
x1 , x2 , x3 , x4 , x5 , x6 , x7 , x8 , x9
精品文档
思考与练习 一、 思考题 1、 分类数据的图示方法,其中包括条形图、Pareto 图、对比条形图和饼图等。顺序数据除
了上文提到的条形图、pareto 图、对比条形图、饼图之外还可以借助累积频数分布图和 环形图来进行描述。 2、 条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维 散点图、气泡图、雷达图等。 3、 数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。根据组距不同还 可以分为等距分组和不等距分组。 4、 分组和编制频数分布表的具体步骤如下:
中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示
一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系
列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分
所占的相应比例,从而有利于进行比较研究。
6、 直方图与条形图是不同的,首先,条形图是用条形的长度(横置时)表示各类别频数的
15
E
6
总计
80
(3)
成绩 A B C D E
总计
人数 8 25 26 15 6 80
累计 8 33 59 74 80 80
频率 0.1 0.4125 0.7375 0.925 1 1
(4)
精品文档
.
精品文档
2、 (1)
(2)正态分布
3、
(1)
接收
频率
49
5
59
5
69
10
79
15
89
11
99
4
合计
7:30
4
8:00
4
8:30
7
9:00
2
总计
20
(2)
精品文档
.
精品文档
7、 (1)、
(2)
.
8、 (1)
(2)
(3)
.
精品文档
精品文档
9、 (1)
接收 29 39 49 59 69 79 89
合计
(2)
Hale Waihona Puke 频率% 10 16 12 16 20 12 4 100
累积 % 10.00 26.00 38.00 64.00 84.00 96.00 100.00 -
的最大值称为上限(upper limit),组距(class width)是一个组的上限与下限的差。
组距可根据全部数据的最大值和最小值及所分的组数来确定,即,
组距=(最大值—最小值)/组数
。
5、 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或
总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。环形图
对变量或数据进行必要的解释和文字说明。 二、单项选择题
1-5 C A C C D
6-10 C B B B C
11-15C D D B C
16-20C D D B B 三、练习题
21-25BB B C B
26-30A C A B D
1、(1)属于顺序数据
(2)
计数项:成绩
成绩
汇总
.
A
8
B
25
C
26
D
100
——
接收 99 109 89 119 79 129 69 139
其他
频率 11 9 8 7 6 4 2 2 1
累积 % 22.00% 40.00% 56.00% 70.00% 82.00% 90.00% 94.00% 98.00% 100.00%
(3)
精品文档
.
精品文档
Stem-and-Leaf Plot
形应包括如下基本特性:显示数据,集中反映图形的内容,避免歪曲,数据之间可进行
有效比较,目的明确且唯一,统计描述和文字说明清晰。
10、 常见的统计表一般由 4 个主要部分组成,即表头、行标题、列标题和数据,此外, 必要时可以在统计表的下方加上表外附加说明。
11、 在具体编制统计表时,应当遵循以下几点规则: (1)统计表的结构要合理,内容要简练,形式要美观。比如行标题、列标题、数字资
Stem width: 10.00
Each leaf:
1 case(s)
5、
(1) VAR00003 Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 2.00 1.00 2.00 2.00
11 . 6 12 . 02 12 . 8 13 . 04 13 . 56
Frequency Stem & Leaf
2.00 6.00 8.00 11.00 9.00 7.00 4.00 2.00 1.00
6. 7. 8. 9. 10 . 11 . 12 . 13 . 14 .
89 233566 01123456 12224556788 002466678 2355899 4678 24 1
Stem width: 10.00
Each leaf:
1 case(s)
4、(2)
接收 69 79 89 99 109 119 129 139 149
频率% 4 12 16 18 16 14 8 4 2
累积 % 4.00 16.00 32.00 54.00 72.00 86.00 94.00 98.00 100.00
.
2.00 3.00 3.00 2.00 5.00 5.00 7.00 8.00 6.00 5.00 3.00 1.00
4 . 13 4 . 667 5 . 003 5 . 89 6 . 01144 6 . 57799 7 . 0001344 7 . 55666788 8 . 011344 8 . 57789 9 . 022 9. 7
.
精品文档
7.9, 8.1, 8.2, 8.3, 8.5, 8.6, 8.6, 8.7, 8.9
0
(2)
累积 % 10.00 20.00 40.00 70.00 92.00 100.00
-
接收 79 89 69 49 59 99 合计
频率 15 11 10 5 5 4 0
累积 % 30.00 52.00 72.00 82.00 92.00 100.00
-
(3) VAR00001 Stem-and-Leaf Plot Frequency Stem & Leaf
第 1 步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序,使
用计算机软件进行整理时此步可以忽略。
第 2 步:确定组数。一般与数据本身的特点及数据的多少有关。由于分组的目的之一是
为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,