概率统计及统计案例知识点汇总
知识点一随机抽样
(一)、1.定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫作简单随机抽样.
2.最常用的简单随机抽样的方法:抽签法和随机数法.
3.应用范围:总体中的个体数较少.
(二)、系统抽样
1.定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样.
2.系统抽样的操作步骤
第一步编号:先将总体的N个个体编号;
第二步分段:确定分段间隔k,对编号进行分段,当N
n(n是样本容量)是整数时,
取k=N n;
第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
3.应用范围:总体中的个体数较多.
(三)、分层抽样
1.定义:在抽样时,将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法叫作分层抽样,有时也称为类型抽样.
2.应用范围:当总体是由差异明显的若干类型组成时,往往选用分层抽样.
知识点二用样本估计总体
(一)、用样本的频率分布估计总体分布
1.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
①求极差(即一组数据中最大值与最小值的差);
②定组距与组数;③将数据分组;④列频率分布表;
⑤画频率分布直方图.
2.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
3.茎叶图
①茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
②对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶,样本数据为小数时做类似处理.
(二)、用样本的数字特征估计总体的数字特征
1.众数
在一组数据中,出现次数最多的数据叫作这组数据的众数.体现了样本数据的最大集中点,不受极端值的影响而且不唯一.
2.中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.它不受极端值的影响,仅利用了排在中间数据的信息,只有一个,且在频率分布直方图中,中位数左边和右边的直方图的面积相等.
3.平均数:样本数据的算术平均数,即x=1
n(x1+x2+…+x n),它与每一个样本
数据有关,仅有一个.
4.极差:一组数值中最大值与最小值的差,它反映一组数据的波动情况,但极差只考虑两个极端值,可靠性极差.
5.标准差:①考查样本数据的分散程度的大小,最常用的统计量是标准差,标准差是样本数据到平均数的一种平均距离,一般用s表示:
s =
1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. ②标准差的平方s 2叫作方差:
s 2=1
n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].
知识点三 变量间的相关关系及统计案例
(一)、回归直线方程:
a x
b y
ˆˆˆ+=,其中),(,),,(),,(2211n n y x y x y x 为样本点,线性回归方程a x b y ˆˆˆ+=中系数计算公式:
则∑∑====n
i i n
i i y n y x n x 1
1
1,
1
相关系数1
2222
11n
i i
i n
n
i i i i x y nx y
r x nx y ny ===-=
⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑
(二)、相关系数
当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强.
r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.
(三)、独立性检验
1.设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;
变量B :B 1,B 2=B 1. 2×2列联表
构造一个随机变量χ2=(a +b )(c +d )(a +c )(b +d )
,其中n =a +b +c +d 为样本容
量.
2.独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验.3.当数据量较大时,在统计中,用以下结果对变量的独立性进行判断
①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B 是没有关联的;
②当χ2>2.706时,有90%的把握判定变量A,B有关联;
③当χ2>3.841时,有95%的把握判定变量A,B有关联;
④当χ2>6.635时,有99%的把握判定变量A,B有关联.
知识点四随机事件的概率
(一)、事件的分类
(二)、频率与概率
1.在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中
事件A出现的次数n A为事件A出现的频数,称事件A出现的比例f n(A)=n A
n为事
件A出现的频率.
2.在相同的条件下,大量重复进行同一试验时,随机事件A发生的频率会在某个常数附近摆动,即随机事件A发生的频率具有稳定性.这时我们把这个常数叫作随机事件A的概率,记作P(A).
(三)、事件的关系与运算
和事件(并事件)若某事件发生当且仅当事件A发生或事件B
发生,称此事件为事件A与事件B的和事件
(或并事件)
A+B
(或A∪B)
交事件(积事件)若某事件发生当且仅当事件A发生且事件B
发生,则称此事件为事件A与事件B的交事
件(或积事件)
A∩B(或AB)
互斥事件若A∩B为不可能事件,则称事件A与事件B
互斥
A∩B=∅
对立事件若A∩B为不可能事件,A+B为必然事件,
那么称事件A与事件B互为对立事件
A∩B=∅
P(A+B)=
P(A)+P(B)=1
(四)、概率的几个基本性质
1.概率的取值范围:0≤P(A)≤1.
2.必然事件的概率P(E)=1.
3.不可能事件的概率P(F)=0.
4.互斥事件概率的加法公式①如果事件A与事件B互斥,则P(A+B)=P(A)+P(B).
②若事件B与事件A互为对立事件,则P(A)=1-P(B).
知识点五古典概型与几何概型
(一)、基本事件的特点
1.任何两个基本事件是互斥的.(2)任何事件(除不可能事件)都可以表示成基本事件的和.
(二)、古典概型
1.定义:具有以下两个特征的概率模型称为古典的概率模型,简称古典概型.
①试验的所有可能结果只有有限个,每次试验只出现其中的一个结果.
②每一个试验结果出现的可能性相同.
2.概率公式:P(A)=事件A包含的可能结果数试验的所有可能结果数
.
(三)、几何概型
向平面上有限区域(集合)G内随机地投掷点M,若点M落在子区域G1G的概
率与G1的面积成正比,而与G的形状、位置无关,即P(点M落在G1)=G1的面积G的面积,
则称这种模型为几何概型.
(四)、几何概型中,事件A的概率计算公式的扩展
P(A)=
构成事件A的区域长度(面积或体积)
试验的全部结果所构成的区域长度(面积或体积)
.
(五)、几何概型试验的两个基本特点
1.无限性:在一次试验中,可能出现的结果有无限多个;2.等可能性:每个结果的发生具有等可能性.。