必修三第二章统计小结
2.3 总体特征数的估计
a1 a2 1.平均数 a n
an
2.方差,标准差
设一组样本数据 x1 , x2 ,
s
2
, xn ,
,其平均数为 x ,则称
s 1 n 2 ( x x ) i n i 1
1 n
2 ( x x ) i i 1
n
为这个样本的方差,其算术平方根
0.026
频率/组距
0.50
0.022
0.018 0.36
0.5 0.0025 0.014
0.010 0.006
0.04 0.05 0.05
[230,250] 5 0.05 0.0025
合计 100
0.002
1
150 170 190 210 230 250 万元
例子: 2009年义乌小商品博览会共设国际标准展位 5000个。为了解展览期间成交状况,现从中抽取若干展 位的成交额(万元),制成如下频率分布表和频率分布 直方图: 试通过直方图估计: 频率/组距 0.50 0.026 (1)众数; 220万元 最高矩形区间中点 212万元 (2)中位数; 面积相等(概率0.5)
的个体个 过程中 数较少 每个个 将总体平均分 在起始部 总体中 体被抽 的 个体 到的可 成几部分,按事 分抽样时, 先确定的规则分 采用 简 单随 个数较多 能性相 同 别在各部分中抽 机抽样 取
将总体分成几 各层抽样时 总体由
分层 抽样
层,按各层个体 采用简单随 数之比抽取 机抽样或系 统抽样
0.022
0.018 0.014 0.36
(3)平均数; 209.4万元 0.010 区间中点与相应概率 之积的和
0.006
0.002 0.04 0.05 0.05
150 170 190 210 230 250 万元
小结:
频率 1.频率直方图中矩形条的面积= 组距 组距=频率;
2.频率分布表 频率直方图 后者更直观 形象地反映样本的分布规律.
为样本的标准差,分别简称样本方差、样本标准差.
小结:1.方差,标准差是用来刻画样本的稳定性;
2.比较的标准——越小越好。
2.4线性相关关系: ˆ bx a 能用直线方程 y 近似表示的相关关系叫做线性相关关系.
线性回归方程: 一般地,设有n个观察数据如下:
x x1 x2 x3
y y1 y2 y3
第8行
(3)从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过 去不读,遇到已经读过的数也跳过去,便可依次得到
12,07,44,39,38,33,21,34,29,42
这10个号码,就是所要抽取的10个样本个体的号码.
小结:
1.抽样无放回; 2.抽样公平性; 3.抽签法,随机数表法—简单的随机抽样.
到大依次分成
50 段,每段 10 人;
定首号 S3:在第一段1~10号中用的 简单随机抽样 的方法
抽取一个号码,比如3;
取余号 S4:依次抽取 3,13,23,33,
„„这50个Βιβλιοθήκη 码。这样就得到了一个容量为50的样本。
2.1 抽样方法
(2).随机数表法:
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
例子:
下面我们用随机数表法求解本节开头的问题. (1)对50个同学进行编号,编号分别为01,02,03,…,50; (2)在随机数表中随机地确定一个数作为开始,如第8行第29列的 数7开始.为便于说明,我们将附表中的第6行至第10行摘录如下: 第29列
第二章 统计小结
本章回顾(知识结构) 总体 抽样 分析 分 层 抽 样 样 本 分 布 样 本 特 征 数
估计 总 体 分 布
总 体 特 征 数
简 单 随 机 抽 样
系 统 抽 样
2.1 抽样方法 1.简单随机抽样
(1)抽签法 1.将总体中的所有个体编号(号码可以从1到 N); 2.将1到N 这N 个号码写在形状、大小相同的号签上 (号签可以用小球、卡片、纸条等制作); 3.将号签放在同一箱中,并搅拌均匀; 4.从箱中每次抽出1个号签,并记录其编号,连续抽 取k次; 5.从总体中将与抽到的签的编号相一致的个体取出.
3.某校有行政人员、教学人员和教辅 人员共200人,其中教学人员与教辅 人员的比为101,行政人员有24人, 现采取分层抽样容量为50的样本,那 么行政人员应抽取的人数为 ( C ) A3 B4 C6 D8
教学人员和教辅人员应抽取的人数 40 和_____. 4 分别为_____
用样本估计总体
说明: 1.抽样公平性原则—等概率—随机性;
2.抽签法适用与总体中个数N不大的情形.
例题 1 系统抽样(等距抽样) 例子—— . 为了解高一年级 500名同学的视力情况,试用系 统抽样从中抽取50名同学进行检查。 编号 分段
S1:把500人从1到500编号;
500 S2:计算分段间隔为 k= 50 =10 人。把编号从小
1.作样本频率分布直方图的步骤:
(1)求极差; (2)决定组距与组数; (组数=极差/组距) (3)将数据分组;
(4)列频率分布表(分组,频数,频率);
(5)画频率分布直方图。
例子: 2009年义乌小商品博览会共设国际标准展位 5000个。为了解展览期间成交状况,现从中抽取100展 位的成交额(万元),制成如下频率分布表和频率分布 直方图: 频 频率 频率/ 数 组距 [150,170) 4 0.4 0.002 [170,190) 5 [190,210) 36 0.36 0.018 [210,230) 50 0.50 0.025 分组
… …
xn
yn
当a,b使
ˆ bx a 为拟合 取得最小值时,就称 y 这n对数据的线性回归方程,该方程所表 示的直线称为回归直线
.
Q ( y1 bx1 a)2 ( y2 bx2 a)2 ... ( yn bxn a)2
1.已 知 回 归 方 程 y 0.5x 0.81 , 则x 25
说明:
1.适用与总体中个体有明显的层次差异,层次 分明的特点; 2.总体中个体数 N较大时,系统抽样,分层抽样 二者选其一.
以上我们学习了三种抽样方法,这些抽样方法 的特点及适用范围可归纳如下:
类别 特 点 相互联系 适用范围 共同点
总体中 抽样
简单随 从总体中逐个 机抽样 抽取
系统 抽样
2.系统抽样:
系统抽样的步骤为: (1)采用随机的方式将总体中的个体编号; (2)将整个的编号按一定的间隔(设为k)分段, N 当 n (N为总体中的个体数,n为样本容量)是整数 N N 时,k= n ;当 n 不是整数时,从总体中剔除一些个 体,使剩下的总体中个体的个数N′能被n 整除,这 N 时k= ,并将剩下的总体重新编号; n (3)在第一段中用简单随机抽样确定起始的个体编 号l ; (4)将编号为l , l +k,l +2k,…, l +(n-1)k的个 体抽出.
^
11.69 时 ,y的 估 计 值 为 ______.
2.用 最 小 二 乘 法 求 回 归 数 系
n n n x i y i xi yi i 1 i 1 i 1 2 n n 2 n x i xi i 1 1 i _______, __________ a
16 22 77 94 39 84 42 17 53 31 63 01 63 78 59 33 21 12 34 29 57 60 86 32 44 49 54 43 54 82 57 24 55 06 88 16 95 55 67 19 78 64 56 07 82 09 47 27 96 54 17 37 93 23 78 77 04 74 47 67 98 10 50 71 75 52 42 07 44 38 49 17 46 09 62 87 35 20 96 43 21 76 33 50 25 12 86 73 58 07 15 51 00 13 42 90 52 84 77 27 84 26 34 91 64 83 92 12 06 76 44 39 52 38 79 99 66 02 79 54 08 02 73 43 28
2.要从已编号(1~60)的60枚最新 研制的某型导弹中随机抽取6枚来进 行发射试验, 用每部分选取的号码间 隔一样的系统抽样方法确定所选取 的6枚导弹的编号可能是 ( B) A.5,10,15,20,25,30 B.3,13,23,33,43,53 C.1,2,3,4,5,6 D.2,8,14,20,26,32
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是: