当前位置:文档之家› 概率、期望与方差的计算和性质

概率、期望与方差的计算和性质

概率与统计知识点一:常见的概率类型与概率计算公式; 类型一:古典概型;1、 古典概型的基本特点:(1) 基本事件数有限多个;(2) 每个基本事件之间互斥且等可能; 2、 概率计算公式:A 事件发生的概率()A P A =事件所包含的基本事件数总的基本事件数;类型二:几何概型;1、 几何概型的基本特点:(1) 基本事件数有无限多个;(2) 每个基本事件之间互斥且等可能; 2、 概率计算公式:A 事件发生的概率()A P A =构成事件的区域长度(或面积或体积或角度)总的区域长度(或面积或体积或角度);注意:(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的; 例如:等腰ABC ∆中,角C=23π,则: (1) 若点M 是线段AB 上一点,求使得AM AC ≤的概率; (2) 若射线CA 绕着点C 向射线CB 旋转,且射线CA 与线段AB 始终相交且交点是M ,求使得AM AC ≤的概率;解析:第一问中明确M 为AB 上动点,即点M 是在AB 上均匀分布,所以这一问应该是长度之比,所求概率:13P =; 而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:2755==1208P ︒; 知识点二:常见的概率计算性质; 类型一:事件间的关系与运算; A+B (和事件):表示A 、B 两个事件至少有一个发生;A B •(积事件):表示A 、B 两个事件同时发生; A (对立事件):表示事件A 的对立事件;类型二:复杂事件的概率计算公式; 1、 和事件的概率:()=()()()P A B P A P B P A B ++-•(1)特别的,若A 与B 为互斥事件,则:()=()()P A B P A P B ++(2)对立事件的概率公式:()1()P A P A =-2、 积事件的概率:(1)若事件12n A A A 、、、相互独立,则:1212()()()()n n P A A A P A P A P A •••=•••(2)n 次独立重复的贝努利实验中,某事件A 在每一次实验中发生的概率都为p ,则在n 次试验中事件A 发生k 次的概率:()(1)k k k n kn n P A C p p -=- 类型三:条件概率;1、 条件概率的定义:我们把在事件A 发生的条件下事件B 发生的概率记为:(|)P B A ;且()(|)()P A B P B A P A •=2、 三个常见公式:(1) 乘法公式:()()(|)P A B P A P B A •=•(2) 全概率公式:设123,,,,n A A A A 是一组互斥的事件且1nk k A ==Ω∑,则对于任何一个事件B 都有:11()()()(|)nnki i k k P B P AB P A P B A ===•=•∑∑(3) 贝叶斯公式:设123,,,,n A A A A 是一组互斥的事件且1nk k A ==Ω∑则对于任何一个事件B 都有:1()(|)(|)()(|)j j j niik P A P B A P A B P A P B A =•=•∑知识点三:求解一般概率问题的步骤;第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n 次独立重复实验等; 第二步:确定事件的运算:和事件、积事件、条件概率等;第三步:运用相应公式,算出结果;知识点三:常见的统计学数字特征量及其计算; 特征量一:平均数(数学期望) 计算公式一:1231()n x x x x x n=++++;计算公式二:1()nx iik E x P x x ==•=∑;计算公式三:(若随机变量x 是连续型随机变量,且函数()f x 是它的密度函数)()Ex xf x dx +∞-∞=⎰特征量二:中位数将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。

特征量三:众数将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。

一列数的众数可以有多个,也可以没有。

特征量四:方差方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。

计算公式一:211[()]n x k k D x x n ==-∑;计算公式二:211[()()]n x k k x k D P x x x E n ===•-∑;计算公式三:22()x D Ex Ex =-;注:期望和方差的性质: 性质1:()E c c =;性质2:()E ax b aEx b +=+; 性质3:1212()n n E x x x Ex Ex Ex +++=+++;性质4:若,x y 相互独立,则:()()()E x y Ex Ey •=•; 性质5:222()(())()(())D x E x E x E x E x =-=-;性质6:()0D c =;性质7:2()()D ax b a D x +=;性质8:若,x y 为两个随机变量则:()()()2[(())(())]D x y D x D y x E x y E y +=+--•-; 性质9:若12,,,n x x x 是相互独立的随机变量,则: 1212()()()()n n D x x x D x D x D x +++=+++;知识点四:简单的统计学知识;问题一:统计学中的简单的抽样方法; 方法一:简单随机抽样; 1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。

2、 具体做法:①随机数字法 ; ② 抽签法; 3、 优缺点分析:优点:基本原理比较简单;当总体容量不大时比较方便; 抽样误差的计算较方便;缺点:对所有观察单位编号,当数量大时,有难度; 方法二:系统抽样;1、 基本原理:先将总体的观察单位按某顺序号等分成n 个部分再从第一部分随机抽第k 号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本; 2、 优缺点分析:优点:抽样方法简便,特别是容量比较大的时候;易得到一个按比例分配的样本,抽样误差较小; 缺点:仍需对每个观察单位编号;当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;方法三:分层抽样;1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。

2、 具体做法:第一步:计算每一层个体数与总体容量的比值;第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数; 第三步:用简单随机抽样的方法产生样本; 3、 优缺点分析:优点:在一定程度上控制了抽样误差,尤其是最优分配法;缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大; 总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;知识点五:常用的几个统计学图表;图表一:频率分布直方图与频率分布折线图; 1、 说明几个基本概念:(1) 频数:符合某一条件的个体个数;(2) 频率:频率=频数总数;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)2、 认识频率分布直方图:(1) 横标是分组的情况;(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1; 3、 画频率分布直方图:第一步:求极差;第二步:分组,确定组距; 第三步:列频率分布表; 第四步:作图; 4、 画频率分布折线图:将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图; 5、 利用频率分布直方图估计样本的统计学数字特征量:(1) 中位数:取图中方框面积和达到12时的横坐标; (2) 众数:取最高的那个方框的中点横坐标;(3) 平均数:1()()nkk k E x xP x x ==•=∑;其中k x 表示第k 组的中点横坐标,()k P x x =表示第k 组的频率;(4) 方差:21()[()]nkk D x xE x ==-∑;图表二:茎叶图;定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;知识点六:变量间的相互关系与统计案例; 1、相关关系的分类:从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。

2、线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。

3.最小二乘法求回归方程:(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据: (x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,其中,b 是回归方程的斜率,a 是在y 轴上的截距. 4.样本相关系数:r =,用它来衡量两个变量间的线性相关关系.(1)当r >0时,表明两个变量正相关;(2)当r <0时,表明两个变量负相关;(3)r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系. 6.独立性检验:(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:2()()()()()n ad bc K a b a c c d b d -=++++ (其中n =a +b +c +d 为样本容量),可利用独立性检验判断表来判断“x 与y 的关系”.这种利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 附表:注意:(1)2K 越大相关性越强,反之越弱;(2)附表中P (K 2≥k )是两个统计学变量无关的概率;知识点七:常见的概率分布及期望、方差; 类型一:离散型随机变量的概率分布; 1、 两点分布(贝努利分布或0、1分布):(1) 特点:随机变量x 只能取两个值0、1;分布列如下:(2) 期望:()E x q =;方差:2()=D x q q pq =-;2、 二项分布:(1) 特点:在n 次独立重复的贝努利实验中,每次实验中A 事件发生的概率都是p ;每次试验只有两个结果A 或A ;随机变量x 表示n 次试验中A 事件发生的次数; 即:()(1)kk n knP x k p p C -==-;则称随机变量x 服从二项分布;记为: (,)x B n p ;(2) 期望:()E x np =;(有两种不同的证明方法,这里就省略了。

相关主题