概率与统计初步复习
(2)步骤: 第一步,将总体的N个个体编号. 第二步,确定分段间隔k,对编号进行分段. 第三步,在第1段用简单随机抽样确定起始个 体编号. 第四步,按照一定的规则抽取样本.
3. 分层抽样 (1)思想:若总体由差异明显的几部分组成,抽 样时,先将总体分成互不交叉的层,然后按照一 定的比例,从各层独立地抽取一定数量的个体, 再将各层取出的个体合在一起作为样本. (2)步骤: 第一步,计算样本容量与总体的个体数之比. 第二步,将总体分成互不交叉的层,按比例确定 各层要抽取的个体数. 第三步,用简单随机抽样或系统抽样在各层中抽 取相应数量的个体. 第四步,将各层抽取的个体合在一起,就得到所 取样本.
6. 频率分布折线图
在频率分布直方图中,依次连接各小长方形 上端中点得到的一条折线,称为频率分布折线图.
画出频率分布折线图. 频率/组距 (取组距中点, 并连线 )
0.6 0.5 0.4 0.3 0.2
0.16 0.1 0.08 0.04 0.3 0.44 0.3 0.5
0.1 0.08 0
0.5
三种抽样方法的比较如下表:
类别
共同点
相互联系
适用范围
各自特点
简单随 机抽样
(1)抽样过 程中每个个 体被抽到的 机会相等 (2)抽样过 程都是不放 回的抽样 在起始部 分抽样时 采用简单 随机抽样 每层抽样 时采用简 单随机抽 样或系统 抽样
总体中的 个数较少
从总体中 逐个抽取 将总体均 分成几部 分,按事 先确定的 规则在各 部分抽取
1 A. 999
B.
1 1000
C.
999 1000
1 D. 2
2、某种彩票中奖几率为0.1%,某 人连续买1000张彩票,下列说法 正确的是:( ) A、此人一定会中奖 B、此人一定不会中奖 C、每张彩票中奖的可能性都相等 D、最后买的几张彩票中奖的可能性 大些
4. 频率分布表
(1)含义:表示样本数据分布规律的表 格.
(2)作法: 第一步,求极差. 第二步,决定组距与组数(强调取整). 第三步,确定分点,将数据分组. 第四步,统计频数,计算频率,制成表 格.
5. 频率分布直方图 (1)含义:表示样本数据分布规律的图 形.
(2)作法: 第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点, 在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与组 距的商为高,分别画出各组对应的小长 方形.
将总体分 成几层, 按一定的 比例进行 抽取
系统抽样
总体中的 个数较多
分层抽样
总体由差 异明显的 几部分组 成
用样本估计总体:一般分成两种 (1)是用样本的频率分布估计总体的分布; (2)是用样本的数字特征(如平均数、标准差等) 估计总体的数字特征.
所谓第一种就是利用样本的频率分布表和频 率分布直方图对总体情况作出估计,有时也 利用频率分布折线图和茎叶图对总体估计
简单随机抽样
随机抽样
系统抽样
分层抽样
统计 用样本估计总体
用样本的频率分 布估计总体分布 用样本 的数字 特征 估计总体数字特征
1. 随机事件与样本空间 (1)随机事件:随机实验中每种可 能的结果。随机事件也简称事件。 不能再分的最简单的随机事件称为 基本事件。 (2)样本空间:全体基本事件构成 的集合叫做随机事件的样本空间。 随机事件是样本空间的子集。
1 1.5
2
2.5
3
3.5 4
4.5 月均用水量/t
7. 茎叶图
作法: 第一步,将每个数据分为“茎”(高位) 和“叶”(低位)两部分; 第二步,将最小的茎和最大的茎之间的 数按大小次序排成一列,写在左(右) 侧; 第三步,将各个数据的叶按大小次序写 在茎右(左)侧.
茎叶图 (一种被用来表示数据的图) 例: 甲乙两人比赛得分记录如下: 甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,说明哪一个成绩好. 甲 8 6, 4, 3 8, 6, 3 9, 8, 3 1 0 1 2 3 4 5 乙
概率的基本性质
0≤P(A)≤1
古典概型
1)两个特征:
(1) 有限性。 试验中所有可能出现的基本事件只有 有限个; (2)等可能性。每个基本事件出现的可能性相等。
2)古典概型计算任何事件的概率计算公式为:
A所包含的基本事件的个数 P(A)= 基本事件的总数
练习: 1. 抛掷一枚质地均匀的硬币,如果连续 抛掷1000次,那么第999次出现正面朝上 的概率是( )
随机数表法: 第一步,将总体中的所有个体编号. 第二步,在随机数表中任选一个数作为 起始数. 第三步,从选定的数开始依次向右(向 左、向上、向下)读,将编号范围内的 数取出,编号范围外的数去掉,直到取 满n个号码为止,就得到一个容量为n的 样本.
2. 系统抽样
(1)思想:将总体分成均衡的n个部分,再 按照预先定出的规则,从每一部分中抽取1个 个体,即得到容量为n的样本.
x 表示;
标准差:是反映样本数据分散程度大小的最常用统计量,其 1 计算公式如下: s [( x1 x )2 ( x2 x )2 ( xn x )2 ]. n 方差:标准差的平方
注意:中位数和众数不同,中位数不一定在这组数据中。而众数 必定在该组数据)例:2、3、4、5、6、7 中位数:中间的两个数 相加后除2=(4+5)/2=4.5
频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布 的总体趋势。 从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据信 息就被抹掉了。
频率分布表与频率分布直方图的区别: 频率分布表列出的是在各个不同区间内取值的频率。 频率分布直方图是用小长方形面积的大小来表示在各个区 间内取值的频率。
梳理要点
1. 简单随机抽样
(1)思想:设一个总体有N个个体, 从 中逐个不放回地抽取n个个体作为样本, 如果每次抽取时总体内的各个个体被抽 到的机会都相等,Leabharlann 则这种抽样方法叫做 简单随机抽样.
(2)步骤: 抽签法: 第一步,将总体中的所有个体编号,并 把号码写在形状、大小相同的号签上. 第二步,将号签放在一个容器中,并搅 拌均匀. 第三步,每次从中抽取一个号签,连续 抽取n次,就得到一个容量为n的样本.
第二种就是为了从整体上更好地把握总体的 规律,可以通过样本数据的众数、中位数、平均 数和标准差等数字特征对总体的数字特征作 出估计
几个概念:
众数:样本数据中出现最多的数据;
中位数:把样本数据分成相同数目的两部分,其中一部分 比这个数小,另一部分比这个数大的那个数; 中位数是 一组数据的中间水平。 平均数:所有样本数据的平均值,用
5, 5, 9, 4, 0
2 4 7, 6, 6, 1, 1 9
叶
茎
叶
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图 上没有原始数据信息的损失,所有数据信息都可以从 茎叶图中得到;二是茎叶图中的数据可以随时记录, 随时添加,方便记录与表示。 (2)茎叶图只便于表示两位有效数字的数据,而且 茎叶图只方便记录两组的数据,两个以上的数据虽然 能够记录,但是没有表示两个记录那么直观,清晰。
概率知识点:
1、频率与概率的意义 2、事件的关系和运算
3、古典概型 4、几何概型
频率与概率的意义:
1、频率本身是随机的,在试验前不能确定。做 同样次数的重复试验得到事件的频率会不同。 2、概率是一个确定的数,与每次试验无关。是 用来度量事件发生可能性大小的量。
3、频率是概率的近似值,随着试验次数的增加, 频率会越来越接近概率。