频率分布直方图与茎叶图
极差 4.1 组数= 8.2 组距 0.5
所以将数据分成9组较合适. 第三步: 将数据分组:( 给出组的界限) [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.
第四步: 列频率分布表.
(包括分组、频数、频率、频率/组距)
组距=0.5
分组 [0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5) 合计
(2)解:如图:茎为成绩的整环数,叶为小数点后的数字
甲
乙
8
5 7
2 4 4
7
8
1 5 1 1 7 1 1 2 7 8
9
10
8
7
5
1
(2)乙成绩大致对称,甲成绩的中位数为9.05, 乙成绩的中位数为9.15,所以乙成绩较甲好,乙成绩较集中 于峰值,甲成绩分散所以乙发挥的稳定性好,甲波动大。
小结:
1.不易知一个总体的分布情况时,往往从总体中 抽取一个样本,用样本的频率分布去估计总体的 频率分布,样本容量越大,估计就越精确. 2. 目前有:频率分布表、直方图、茎叶图. 3.当总体中的个体取值很少时,用茎叶图估计总 体的分布;当总体中的个体取值较多时,将样本 数据恰当分组,用各组的频率分布描述总体的分 布,方法是用频率分布表或频率分布直方图。
当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距
月均用 水量/t
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
思考
1.对于任何一个总体,它的密度曲线是不是一定存在?它 的密度曲线是否可以被非常准确地画出来? 2.图中阴影部分的面积表示什么?
1.实际上,尽管有些总体密度曲线是客观存在 的,但一般很难想函数图象那样准确地画出来, 我们只能用样本的频率分布对它进行估计,一 般来说,样本容量越大,这种估计就越精确
二、茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一 个有效数字,两边的数字表示个位数,即第二个有效数字,它 的中间部分像植物的茎,两边部分像植物茎上长出来的叶子, 因此通常把这样的图叫做茎叶图
频率分布直方图如下:
频率 组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 0.5 月均用水量 /t 4.5
1 1.5 2 2.5 3
3.5 4
思考:上例的样本容量为100,如果增至1000,其频率分布直方
图的情况会有什么变化(组距和组数)?假如增至10000呢?
茎 叶 0 8 1 345 2 36 8 3 389 4 5 1
阅读70页最后一段,说出茎叶图的 优缺点?
茎叶图的特征:
两个优点: 一是:没有原始数据信息的损失; 二是:茎叶图中的数据可以随时记录,随时添 加,方便记录与表示。 三个局限: 一是:只便于表示两位有效数字的数据; 二是:茎叶图只方便记录两组的数据; 三是:数据量不能太大
思考:从频率分布直方图中,你能得到任意 区间(a,b)的频率?有什么困难?
一、频率分布折线图与概率密度曲线
频率/组距 (取组距中点, 并连线 )
0.6
0.5
0.4
0.44
0.5
0.3
0.2
0.16
0.3
0.3
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频数 4 8 15 22 25 15 5 4 2 100
频率
0.04
0.08 0.15 0.22 0.25 0.15 0.05 0.04 0.02 1
频率/组距 0.08
0.16
0.3 0.44 0.5 0.3
0.1 0.08 0.04 2.00
第 五 步: 画 出 频 率 分 布 直 方 图.
频率/组距 (组距=0.5)
甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好, 另,乙的叶较甲的更集中,所以乙较甲发挥更稳定。
画茎叶图要注意什么:
1.将每个数据分为茎(高位)和叶(低位) 两部分,在此例中,茎为十位上的数字, 叶为个位上的数字; 2.将最小茎和最大茎之间的数按大小 次序排成一列,写在左(右)侧; 3.将各个数据的叶按大小次序 写在其茎右(左)侧.
总体密度曲线:
在样本频率分布直方图中,当样本容量增加,作图时所 分的组数增加,组距减少,相应的频率折线图会越来越 接近于一条光滑曲线,统计中称这条光滑曲线为总体密 度曲线. 它能够精确地反映了总体在各个范围内取值的 百分比,它能给我们提供更加精细的信息. 频率
组距
0
a
b
月均用水量/t
总体密度曲线
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表: 分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67] 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
合作探究 :茎叶图
(一种被用来表示数据的图)
例: 甲乙两人比赛得分记录如下: 甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,说明哪一个成绩好.
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
理论迁移
2
频率 组距
某校共有5000名学生,该校 0.036 学生每月课外读物方面的支 出总体上在20—60元之间其 0.024 频率分布直方图如右图所示 0.01 ,为具体了解同学们购买课 外读物的具体情况,按支出 的情况进行分层抽样,抽出 一个容量为100的样本进行分 析,其中支出在 [50,60 ) 元的同学应抽取 30 人。
频数 2 11 13 4 茎 10 11 12 13 叶 7, 8 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 4, 2, 3, 0
练习2:
某次运动会甲乙两名射击运动员的成绩(环数) 如下: 甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7, 7.2,7.8,10.8 乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2, 10.1,9.1 (1)用茎叶图表示甲乙的成绩 (2)根据茎叶图分析甲乙的成绩
0.6
0.5 0.5请大家阅读第 0.44 67页,直方图有 0.4 哪些优点和缺 0.3 0.3 0.3 点?
小长方形的面 月均用水量最 多的在哪个区 积总和 积=?=? 间?
0.2
0.16
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布 的总体趋势。 从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据信 息就被抹掉了。
练习1:
下表一组数据是某车间30名工人加工零件的个数, 设计一个 茎叶图表示这组数据,并说明这一车间的生产情况.
134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112
用样本的频率分布估计总体分布
衡阳县六中高一年级 刘碧华
用样本的频率分布估计总体分布 一 频率分布图和频率分布直方图
二 频率分布折线图 和总体密度曲线
三
莖叶图
理论迁移
1
某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比 例约是多少.
甲
8 4, 6, 3 3, 6, 8 3, 8, 9 1 0 1 2 3 4 5
乙
2, 5, 1, 4, 0
5 4 6, 1, 6, 7, 9 9
叶
茎
叶
甲 8 4 6 3 3 6 8 0 1 2 2 5
乙
5 4
3 8 9
3
4
1 6 1 6 7 9
4 0 9
1
5
主要从对称性,中位数(体现成绩好坏), 稳定性(即集中程度)来分析 分析:甲得分除51分外大致对称,乙基本上也对称。
频率
组距
0
a
b
月均用水量/t