当前位置:
文档之家› 众数、中位数、平均数(1)标准差、方差
众数、中位数、平均数(1)标准差、方差
系,必须从样本的各组中按月收入再用分层抽样方
法抽出100人作进一步分析,则月收入在[1 500, 2 000)的这段应抽多少人? (3)试估计样本数据的中位数. 解 (1)∵月收入在[1 000,1 500)的概率为
0.000 8×500=0.4,且有4 000人, 4 000 ∴样本的容量n= =10 000; 0 .4 月收入在[1 500,2 000)的频率为0.000 4×500
11.下图是某市有关部门根据该市干部的月收入情
况,作抽样调查后画出的样本频率分布直方图,
已知图中第一组的频数为4 000,请根据该图提供 的信息解答下列问题:(图中每组包括左端点, 不包 括右端点,如第一组表示收入在[1 000,1 500))
(1)求样本中月收入在[2 500,3 500)的人数; (2)为了分析干部的收入与年龄、职业等方面的关
(3)
O
1 2 3 4 5 6 7 8
(4)
2.已知一组数据按从小到大的顺序排列,得到-1,0, 4,x,7,14,中位数为5,则这组数据的平均数和
方差分别为
( A )
1 2 A.5,24 B.5,24 3 3 2 1 C.4,25 D.4,25 3 3 4 x 解析 ∵中位数为5,∴5= ,∴x=6. 2 1 0 4 6 7 14 x 5, 6 1 s2= [( 5+1 ) 2+ ( 5-0 ) 2+ ( 5-4 ) 2+ ( 5-6 ) 2+ 6 2 2 2 (5-7) +(5-14) ]=24 . 3
4、标准差是反映样本的分散程度。
显然,标准差越大,则a越大,数据的离散程 度越大;标准差越小,数据的离散程度越小.
特点:
众 数
0.5 0.4
0.3 0.2 0.1 O 0.5 1 1.5 2 2.5 3
众数体现了样本数据的最 大集中点,但它对其它数 据信息的忽视使得无法客 观地反映总体特征.
3.5
4
4.5
月平均用水量(t)
频率
中位数: 左边和右边的直方图的面积应 该相等,由此可以估计中位数的值。 2.02这个中位数的估计值,与样本的中 位数值2.0不一样,为什么?
连接频率分布直方图中各小长方形上端的中点 , 得到频率分布折线图
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.
画茎叶图的步骤:
(1)将每个数据分为茎(高位)和叶(低位)两部分; (2)将最小茎和最大茎之间的数按大小次序排成一列, 写在一侧; (3)将各个数据的叶按大小次序写在其茎的另一侧.
0.4+0.2=0.6>0.5, ∴样本数据的中位数为 0.5 0.4 1 500+ =1 500+250=1 750(元). 0.000 4
三种数字特征的优缺点
1、众数体现了样本数据的最大集中点,但它对其它 数据信息的忽视使得无法客观地反映总体特征. 2、中位数它不受少数几个极端值的影响,这在某些 情况下是优点,但它对极端值的不敏感有时也会成为 缺点。 3、由于平均数与每一个样本的数据有关,所以任何 一个样本数据的改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因如此 ,与众数、 中位数比较起来,平均数可以反映出更多的关于样本 数据全体的信息,但平均数受数据中的极端值的影响 较大,使平均数在估计时可靠性降低。
=0.2;
月收入在[2 000,2 500)的频率为0.000 3×500=
0.15;
月收入在[3 500,4 000)的频率为0.000 1×500= 0.05. ∴月收入在[2 500,3 500)的频率为 1-(0.4+0.2+0.15+0.05)=0.2.
∴样本中月收入在[2 500,3 500)的人数为
例题分析
例1 画出下列四组样本数据的条形图, 说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5; (2) 4,4,4,5,5,5,6,6,6;
频率 1.0 0ห้องสมุดไป่ตู้8 0.6 0.4 0.2
O
x = 5 s= 0
1.0 0.8 0.6 0.4 0.2
频率
x= 5 s = 0.82
1 2 3 4 5 6 7 8
(2)平均数、方差的公式推广
①若数据x1,x2,„,xn的平均数为x ,那么 mx1+a,mx2+a,mx3+a,„,mxn+a的平均数是 mx . a ②数据x1,x2,„,xn的方差为s2. 1 2 2 2 2 a.s2= [( x1 x2 xn ) n x ]; n 2 b.数据x1+a,x2+a,„,xn+a的方差为 s c.数据ax1,ax2,„,axn的方差为 a2 s2 .
1、中位数易计算,能较好地表现数据信息 因为样本数据的频率分布直 2、中位数不受少数几个极端值的影响 方图,只是直观地表明分布 的形状,但是从直方图本身 3、常用于计算数据质量较差时 得不出原始的数据内容,所 以由频率分布直方图得到的 中位数估计值往往与样本的 实际中位数值不一致.
组距
0.5 0.4 0.3
0.5 0.4 0.3 0.2 0.1
O
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
练习:
有两位射击运动员在一次射击测试中各射靶10 次,每次命中的环数如下:
甲:7 乙:9 8 5 7 7 9 8 5 7 4 6 9 8 10 6 7 7 4 7
如果你是教练,你应当如何对这次射击作出评价 ? 如果看两人本次射击的平均成绩,由于x甲 7,x乙 7 两人射击 的平均成绩是一样的.那么两个人的 水平就没有什么差异吗?
0.2×10 000=2 000. (2)∵月收入在[1 500,2 000)的人数为
0.2×10 000=2 000,
∴再从10 000人中用分层抽样方法抽出100人,则月
2 000 收入在[1 500,2 000)的这段应抽取100× 10 000 =20(人).
(3)由(1)知月收入在[1 000,2 000)的频率为
练习: 在一次中学生田径运动会上,参加 男子跳高的17名运动员的成绩如下表所 示:
成绩 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 (米 ) 3 2 3 4 1 1 1 人数 2
分别求这些运动员成绩的众数,中位数与 平均数
众数、中位数、平均数的概念
众数:在一组数据中,出现次数最多的数据叫 做这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数. 平均数: 一组数据的算术平均数,即
9.(2009·福建)某校开展“爱我海西、爱我家乡”摄 影比赛,9位评委为参赛作品A给出的分数如茎叶图所 示.记分员在去掉一个最高分和一个最低分后,算得 平均分为91,复核员在复核时,发现有一个数字(茎 叶图中的 x)无法看清,若记分员计算无误,则数字 x 应该是 1 .
89 89 92 93 92 91 94 640 91, 7 7 解析 当x89 ≥4 时, 89 92 93 92 91 x 90 7 ∴x<4,则 =91,∴x=1.
;
知识补充 1.标准差的平方s2称为方差,有时用方差代 替标准差测量样本数据的离散度.方差与标 准差的测量效果是一致的,在实际应用中一 般多采用标准差. 2.现实中的总体所包含的个体数往往很多, 总体的平均数与标准差是未知的,我们通 常用样本的平均数和标准差去估计总体的 平均数与标准差,但要求样本有较好的代 表性.
标准差
考察样本数据的分散程度的大小,
标准差是样本数据到平均数的一种平均距离, 一般用s表示. 所谓“平均距离”,其含义可作如下理解:
假设样本数据是x1 , x2 ,...xn , x 表示这组数据的平均数, xi到 x的距离是 : |
xi x | (i 1, 2,, n).
于是, 样本数据x1 , x2 , xn到 x 的“平均距离”是:
1 x= ( x1 x 2 x n ) n
二、众数、中位数、平均数与频率分布 直方图的关系
例如,在上一节调查的100位居民的月均用 水量的问题中,从这些样本数据的频率分 布直方图可以看出众数、中位数、平均数 为多少?
频率 组距
众数 在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
( 1)
O 1 2 3 4 5 6 7 8 (2)
(3) 3,3,4,4,5,6,6,7,7; (4) 2,2,2,2,5,8,8,8,8.
频率
频率
x = 5
1.0 0.8 0.6 0.4 0.2
x= 5
1.0 0.8 0.6 0.4 0.2
s = 1.49
s = 2.83
O
1 2 3 4 5 6 7 8
0.2
0.1 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
平均数 是频率分布直方图的“重心”,等于频 率分布直方图中每个小矩形的面积乘以小矩形底 边中点横坐标之和
频率 组距
1、平均数与每一个样本的数据有关,所以任何 一个样本数据的改变都会引起平均数的改变 2、平均数可以反映出更多的关于 样本数据全体的信息 3、平均数受数据中的极端 值的影响较大,使平均数在 估计时可靠性降低。
例4 在去年的足球甲A联赛中,甲队每场比赛 平均失球数是1.5,全年比赛失球个数的标准 差为1.1;乙队每场比赛平均失球数是2.1, 全年比赛失球个数的标准差为0.4.你认为下 列说法是否正确,为什么? (1) 平均来说甲队比乙队防守技术好; (2)乙队比甲队技术水平更稳定; (3)甲队有时表现很差,有时表现又非常 好; (4)乙队很少不失球.