当前位置:
文档之家› 2.2.2用样本的数字特征估计总体的数字特征(优质课)
2.2.2用样本的数字特征估计总体的数字特征(优质课)
x b,方差仍为
s
2
.
(2)新数据 ax1 , ax2 , , axn的平均数为 a x , 方差为 a 2 s 2 . (3)新数据 ax1 b, ax2 b, , axn b 的平均数为 ax b,方差为a 2 s 2 .
2、样本中位数不受少数极端值的影响,这 在某些情况下是一个优点,但它对极端值 的不敏感有时也会成为缺点。你能举例说 明吗? 答:优点:对极端数据不敏感的方法能够 有效地预防错误数据的影响。
对极端值不敏感有利的例子:例如当样本数据质 量比较差,即存在一些错误数据(如数据录入错 误、测量错误等)时,用抗极端数据强的中位数 表示数据的中心值更准确。
甲.乙两名射击队员,在进行的十次射击中成绩分别是: 甲: 10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5
乙: 9; 9; 8,5; 9; 9; 9.5; 9.5; 8.5; 8.5; 9.5
试问二人谁发挥的水平较稳定?
分析:甲的平均成绩是9环.乙的平均成绩也是9环.
情境二:
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率 组距
如何在频率分布直方图中估计中位数
0.6 0.5 0.4 0.3 0.2 0.1 0
前四个小矩形的 面积和=0.49
后四个小矩形的 面积和=0.26
0.25
0.22
0.15 0.08 0.04 0.5 1 1.5 2 2.5
极差体现了数据的离散程度
为了对两人射击水平的稳定程度,玉米生长的 高度差异以及钢筋质量优劣做个合理的评价,这 里我们引入了一个新的概念,方差和标准差.
设一组样本数据 x1,x2,…,xn ,其平均数为 x ,则
s
2
1 n
[( x 1 x ) ( x 2 x )
2
2
( xn x ) ]
如何在频率分布直方图中估计平均数
( x 1 x 2 x 100 )
x 1 4 8 100
1 100
( x 1 x 4 ) ( x 5 x 12 ) ( x 99
2 x 99 100
4 4 .5 2
因为 x 甲 小于 x 乙 ,所以甲水稻的产量比
较稳定。
三.当堂反馈
1、在一次歌手大奖赛上,七位评委为歌手打出的分 数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去 掉一个最高分和一个最低分后,所剩数据的平均值和 方差分别为_________________;
9.5,0.016
思考一下:
1、2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中原因吗? 答:2.02这个中位数的估计值,与样本的中 位数值2.0不一样,这是因为样本数据的 频率分布直方图,只是直观地表明分布的 形状,但是从直方图本身得不出原始的数 据内容,直方图已经损失一些样本信息。 所以由频率分布直方图得到的中位数估计 值往往与样本的实际中位数值不一致.
选择平均数更好:因为,此时的众数20万比中位数25万还小, 所以众数代表的是局部的数。中位数代表的虽然是大多数公路 投资的数额,但由于其不受极端值的影响,不能代表全体,因 而此时成了它的缺点。选择平均数较好,能比较好的代表整体 水平,但缺点是仍不能显示出具体的数字特征
(二)
一.实例引入 情境一;
在样本中中位数的左右各有50%的样本数, 条形面积各为0.5,所以反映在直方图中位数 左右的面积相等.
0 . 04 0 . 08 0 . 15 0 . 22 0 . 49
x 0 . 02
中位数
2 0 . 02 2 . 02
可将中位数看作整个直方图面积的“中心”
思考讨论以下问题:
问题1:众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质? 众数:反映的往往是局部较集中的数据信息
中位数:是位置型数,反映处于中间部位的 数据信息
平均数:反映所有数据的平均水平
1、求下列各组数据的众数
(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8 (2)、1 ,2,3,3,3,5,5,8,8,9,9 众数是:3 2、求下列各组数据的中位数
2
x乙
s乙
2
1 ( 9 . 4 10 . 3 10 . 8 9 . 7 9 . 8 ) 10 5
2 2 2 2 2
[( 9 . 4 10 ) (10 . 3 10 ) (10 . 8 10 ) ( 9 . 7 10 ) ( 9 . 8 10 ) ] 5 0 . 24
1
1.90
1
分别求这些运动员成绩的众数,中位数与平均数 。 解:在17个数据中,1.75出现了4次,出现的次数最多, 即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排 列的,其中第9个数据1.70是最中间的一个数据,即这组 数据的中位数是1.70; 这组数据的平均数是
x 1 17 (1 .5 0 2 1 .6 0 3 ... 1 .9 0 1) 1 .6 9 米
某农场种植了甲、乙两种玉米苗,从中各抽取 了10株,分别测得它们的株高如下:(单位cm)
甲: 31
乙: 53
32
16
35 37 33 30 32 31 30 29
54 13 66 16 13 11 16 62
哪种玉米苗长得高? 问: 哪种玉米苗长得齐?
x甲 =32
x乙 =32
怎 么 办 呢 ?
甲: 31 乙: 53 甲
32 16
35 54
37 13
33 66
30 16
32 13
31 11
30 16
29 62
29 32
37
乙
11 32 66
甲 乙
37(最大值) 66(最大值)
29(最小值) 11(最小值)
8 55
极 差
极差: 一组数据的最大值与最小值的差
极差越大,数据越分散,越不稳定 极差越小,数据越集中,越稳定
和中位数作为参考指标,选择平均工资较高且 中位数较大的公司就业.
三、 众数、中位数、平均数的简单应用
例1、下表是七位评委给某参赛选手的打分,总分为10分, 你认为如何计算这位选手的最后得分才较为合理?
评委 1号 打分 9.6
2号 9.3
3号 9.3
4号 9.6
5号 6号 9.9 9.3
7号 9.4
课堂练习: 1、假设你是一名交通部门的工作人员。你打算向市长报告国 家对本市26条公路项目投资的平均资金数额,其中一条新公 路的建设投资为2 200万元人民币,另外25个项目的投资在 20万与100万.中位数是25万,平均数是100万,众数是20万 元。你会选择哪一种数字特征来表示每一个项目的国家投资? 你选择这种数字特征的缺点是什么?
答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米)。
二、众数、中位数、平均数与频率 分布直方图的关系
如何在频率分布直方图中估计众数
频率 组距
众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
0.5 0.4 0.3 0.2 0.1
O
0.5
x 100 )
x 5 12
0 .5 1 2
100
0 . 04
0 0 .5 2
平均数的估计值等于频率分 布直方图中每个小矩形的面 积乘以小矩形底边中点的横 坐标之和。
0 . 08
0 . 02
=2.02
可将平均数看作整个直方图面积的“重心”
思考讨论以下问题:
(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
3、在一次中学生田径运动会上,参加男子跳高的17名 运动员的成绩如下表所示:
成绩(米)
人数
1.50 1.60
2 3
1.65
2
1.70
3
1.75
4
1.80
1
1.85
a3 2、已知数据 a 1 , a 2 ,的方差为 2,则求数据 的方差。
2 a1 , 2 a 2 , 2 a 3
方差的运算性质: 如果数据 x1 , x2 , , xn 的平均数为 x , 2 方差为 s ,则 (1)新数据 x1 b, x2 b, , xn b 的平均数为
缺点:(1)出现错误的数据也不知道; (2)对极端值不敏感有弊的例子:某人具 有初级计算机专业技术水平,想找一份收 入好的工作。这时如果采用各个公司计算 机专业技术人员收入的中位数作为选择工 作的参考指标就会冒这样的风险:
很可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极小的数 据不敏感。这里更好的方法是同时用平均工资
例1.计算数据89,93,88,91,94,90,88,87的 方差和标准差。(标准差结果精确到0.1)
解:x
90
1 8
( 1 3 2 1 4 0 2 3) 9 0
.
所以这组数据的方差为5.5,标准差为2.3 . 见课本76-77页
练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
0.14 0.06 0.04 3 3.5 4 0.02
4.5
2.02
月均用水量/t
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3,, 3.5) [3.5, 4) [4,) 4.5]