当前位置:文档之家› 2.2.1(1)用样本的频率分布估计总体分布

2.2.1(1)用样本的频率分布估计总体分布

[15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5 ] 4
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?
频率/ 组距
0.020 0.053 0.060 0.073 0.067 0.033 0.027
0.070 0.060 0.050 0.040 0.030 0.020 0.010
组距
数据落在[15.5,
的百分比是56%
12.5 15.5 18.5 21.5 24.5 27.5 30.5 33.5
24.5)
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
利用样本频率分布对总体分布进行相应估 计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
(2)样本容量越大,这种估计越精确。
(3)当样本容量无限增大,组距无限缩小, 那么频率分布折线图就会无限接近于一条光滑
解 (1)频率分布直方图是以面积的形式反映了数据落在各小组内 的频率大小的,因此第二小组的频率为2+4+17+4 15+9+3=0.08.
第二小组的频数 又因为第二小组的频率= 样本容量 , 所以样本容量=第第二二小小组组的的频频数率=01.028=150. (2) 由 直 方 图 可 估 计 该 校 高 一 年 级 学 生 的 达 标 率 为 2+147++117+5+195++39+3×100%=88%.
创新设计 P42
【变式3】(2012·盐城高一检测)为了了解高一年级学生的体能
情况,某校抽取部分学生进行一分钟跳绳次数测试,将所
得数据整理后,画出频率分布直方图(如图所示),图中从
左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第
二小组的频数为12.
创新设计 P42
(1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,则该校全体高一年 级学生的达标率是多少?
100 1.00
5. 画频率分布直方图:
频率/组距
0.50
注意 纵坐标是 频率/组距
0.40
0.30
0.20
0.10
用水量
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
请所小计有矩算小每形矩个形的小的面矩面积形积=的的组面和距积是×,多它频少代?表率什=1 么频?率为什么? 组距
频率/组距
寿命(h) ( 4 ) 电 子 元 件 寿 命 在
0 100 200300400 500 600
400h以上的频率为0.35
小结
步骤 频率分布直方图
1.求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图
检测
1. 右图是容量为100的
频率
样本的频率分布直方图, 0.09 组距 试根据图中的数据填空: 0.08
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?
通过抽样,我们获得了100位居民某年的月平均用水量 (单位:t) ,如下表:
这些数字告诉我们什么信息?
1.求极差(即一组数据中最大值与最小值的差)
4.3 - 0.2 = 4.1
曲线,统计中称这条光滑曲线为总体密度曲 线。
总体密度曲线
频率 组距
月均用 水量/t
ab
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布折线图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
7
0.0875
7/(80×0.19)
5
0.0625
4
0.05
80 1.00
5/(80×0.19) 4/(80×0.19)
5. 画频率分布直方图:
频率/组距
注意 纵坐标是 频率/组距
4/(80× 0.19)
尺寸/cm
O 362.7 362.51
362.89 363.08 363.27 363.46 363.65 363.84 364.02 364.22 364.41
频率分布折线图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
(1)样本数据落在范围
[6,10)内的频率为0__.3_2_;
0.03
(2)样本数据落在范围 0.02
[10,14)内的频数为_3_6__;
O
样本 数据
2 6 10 14 18
(3)总体在范围[2,6)内的
概率约为__0_._0_8__;
2.一个容量为35的样本,分组后,组距与频数如下: [5,10)5,[10,15)12,[15,20)7,[20,25)5,[25,30)4,
(1Байду номын сангаас分)
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,
则(x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%.
(12分)
【题后反思】 (1)用样本的频率分布估计总体的分布,是 列频率分布表和画频率分布直方图的主要目的,频率分布 表比较准确地反映样本的频率分布,而频率分布直方图则 能直观地反映样本的频率分布. (2)频率分布直方图反映了样本在各个范围内取值的可能 性,由抽样的代表性利用样本在某一范围内的频率,可近 似地估计总体在这一范围内的可能性.
组”,“频数累计”
(可省),“频数”,
“频率”, “频率/组
距””五列,最后一行
是频合率计=
频数 样本容量
注意频数的合计应 是样本容量,频率 合计应是1
频率/组距
4 0.04 0.08
8 0.08 0.16 15 0.15 0.30 22 0.22 0.44 25 0.25 0.50 14 0.14 0.28 6 0.06 0.12 4 0.04 0.08 2 0.02 0.04
P71 第1题
P71 第1题
1.求极差(即一组数据中最大值与最小值的差)
364.41 – 362.51 = 1.9
2.决定组距与组数
组数=
极差 =
组距
1.9 0.19
=
10
组距=0.19
3.将数据分组(左闭右开)
[362.51,362.7 ),[362.7,362.89 ),…, [364.22,364.41]
现在随机抽取其中的
200辆汽车进行车速分 0.04
析,则估计在这一时段
内通过该站的汽车中速 0.02
度不小于90km/h的约
有( C)
0.01
O
车速
60 70 80 90 100 110
A100辆
B200辆
C300辆
D400辆
5.有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3
2.决定组距与组数
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,
组数=
极差 =
组距
4.1 0.5
=
8.2
组距:0.5 组数:9
3.将数据分组(左闭右开)
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分
优点:从频率分布直方图可以清楚地看出数据分布的总体趋势
缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直 方图后,原有的具体数据就被抹掉了
0.04 0.12
0.27 0.49
0.74 0.88
0.94 0.98
1.00
频率/组距
0.50 0.40 0.30
0.20 0.10
用水量
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 /t
解:组距为3
分组
频数
[12.5, 15.5) 3 [15.5, 18.5) 8
[18.5, 21.5) 9 [21.5, 24.5) 11
[24.5, 27.5) 10
[27.5, 30.5) 5 [30.5, 33.5] 4
合计
频率
50
频率
0.06 0.16 0.18 0.22 0.20 0.10 0.08 1
如果当地政府希望85%以上的居民每月的用水量不超出 标准,根据频率分布表和频率分布直方图,你能对制定 月用水量提出建议吗?
88%的居民月用水量在3t以下,可建议取a=3.
思考:在实际中,取a=3t一定能保证85%以上 的居民用水不超标吗?哪些环节可能会导致 结论出现偏差?
相关主题