当前位置:文档之家› 高考数学专题8之统计

高考数学专题8之统计

壹高考数学专题八之统计【知识概要】一、抽样方法●1. 简单随机抽样——设一个总体的总数为N ,若通过逐个抽取的方法从总体中抽取一个样本,且每次抽取时,各个个体被抽到的概率相等,这样的抽样方法叫简单随机抽样。

特点:不放回抽样;逐个抽取;被抽取的样本的总数是有限的。

主要方法:抽签法;随机数表法。

●2. 系统抽样——将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方法叫简单系统抽样。

特点:等概率抽样;等距离(或按预先定出的规则)抽样;不放回抽样。

系统抽样的步骤:①采用随机的方式将总体中的个体编号;②将整个的编号按一定的间隔(设为k ),当N n(N 为总体中的个体数,n 为样本容量)是整数时,;N k n= 当N n不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数1N 能被n 整除,这时1N k n=,并将剩下的总体重新编号;③在第一段中用简单随机抽样确定起始的个体标号l ; ④将编号为,,2,,(1)l l k l k l n k +++-L 的个体抽出。

●3. 分层抽样——当总体由差异明显的几个部分组成时,将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这样的抽样方法叫分层抽样。

特点:每层抽取的样本数=⨯每层的个数所要抽取的总体数总体样本个数;等概率抽样;不放回抽样。

分层抽样的步骤:①将总体按一定标准分层;②计算各层的个数与总体的个数的比;③按各层个数占总体的个数的比确定各层应抽取的样本容量; ④在每一层进行抽样(可用简单随机抽样或系统抽样)。

二、总体分布的估计和总体特征数的估计 ●1. 频率分布表的有关概念(1)频数: 在一组数据中,某范围内的数据出现的次数; (2)频率: 频数除以数据的总个数; (3)全距: 数据中最大与最小值的差;(4)组距=全距组数;(5)分组要求:通常对组内数值所在区间取左开右闭区间,最后一组取闭区间,并且使分点比数据多一位小数。

贰●2. 频率分布直方图 具体做法如下:(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图:① 横轴表示样本数据,纵轴表示频率与组距的比值;② 以每个组距为底,以各频率除以组距的商为高,分别画成矩形; ③ 图中每个矩形的面积等于相应组的频率,即:⨯=频率组距频率组距;④ 各组频率的和等于1,即各小矩形的面积的和等于1。

●3. 频率分布折线图:将频率分布直方图中,取各相邻矩形的上底边中点顺次连接,再将矩形的边去掉,就得到频率分布折线图。

●4. 密度曲线:当样本容量取得足够大,分组的组距取得足够小,则这条折线就越接近于一条光滑的曲线,这条光滑的曲线称为总体密度曲线。

●5. 中位数:将数据按从小到大或从大到小排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数。

●6. 众数:在一组数据中出现次数最多的数叫做这组数据的众数;众数不一定是唯一的。

●7. 平均数计算的方法:(1)简单平均数12nx x x x n+++=L ;(2)离散型平均数计算:12,,,n x x x L 所发生的频率分别为12,,,n p p p L ,则平均数为1122n n x p x p x p +++L ;(3)区间型平均数计算:12231[,),[,),,[,]n n a a a a a a +L 所发生的频率分别为12,,,n p p p L ,则平均数为2311212 (222)n n n a a a a a a P P P +++++++ ●8. 方差:2211()ni i s x x n ==-∑●9.标准差:s 三、统计案例叁●1. 回归分析回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。

对具有相关关系的两个变量进行统计分析的方法叫回归分析。

线性回归方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:ˆya bx =+,我们称这个方程为y 对x 的线性回归方程。

(1)设两个具有线性相关的一组数据为:()()()1122,,,,,n n x y x y x y L则线性回归方程为:ˆy bx a =+其中1112211nn n i i i i i i i n ni i i i n x y x y b n x x =====⎛⎫⎛⎫- ⎪⎪⎝⎭⎝⎭=⎛⎫- ⎪⎝⎭∑∑∑∑∑,a y bx =- ,x y 分别为12,,,n x x x L ,12,,,n y y y L 的算术平均数。

(2)特点:线性回归方程过点(,)x y ; ●2. 相关系数对于变量y 与x 的一组观测值,把()()nniii i x x y y x y nx yr ---∑∑叫做变量y 与x 之间的样本相关系数,简称相关系数,用它衡量两个变量之间的线性相关程度。

相关系数的性质:||r ≤1,且||r 越接近1,相关程度越大;||r 越接近0,相关程度越小。

●3独立性检验独立性检验是对两种分类变量之间是否有关系进行检验。

① 独立性检验的必要性:2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用肆于总体。

③ 独立性检验的步骤第一步:提出假设检验问题;第二步:选择检验的指标(卡方检验);22()()()()()n ad bc x a b c d a c b d -=++++(它越小,原假设“H 0:成立的可能性越大”;它越大,备择假设“H 1:成立的可能性越大”。

3.841x > 6.635x >握说两事件有关;如果2 2.706x ≤,没有充分的证据显示两事件有关。

四、计数原理与二项式定理 ●1. 两个原理.1. 乘法原理、加法原理.2. 可以有重复元素.......的排列. 从m 个不同元素中,每次取出n 个元素,元素可以重复出现,按照一定的顺序排成一排,那么第一、第二……第n 位上选取元素的方法都是m 个,所以从m 个不同元素中,每次取出n 个元素可重复排列数m ·m ·… m = m n .. 例如:n 件物品放入m 个抽屉中,不限放法,共有多少种不同放法? (解:n m 种) ●2.排列.1. ⑴对排列定义的理解.定义:从n 个不同的元素中任取m(m ≤n )个元素,按照一定顺序......排成一列,叫做从n 个不同元素中取出m 个元素的一个排列. ⑵相同排列.如果;两个排列相同,不仅这两个排列的元素必须完全相同,而且排列的顺序也必须完全相同.伍⑶排列数.从n 个不同元素中取出m (m ≤n )个元素排成一列,称为从n 个不同元素中取出m个元素的一个排列. 从n 个不同元素中取出m 个元素的一个排列数,用符号m n A 表示.⑷排列数公式:),,()!(!)1()1(N m n n m m n n m n n n A m ∈≤-=+--=Λ 注意:!)!1(!n n n n -+=⋅ 规定0! = 1111--++=⋅+=m nm n m n m m m n m n mA A C A A A 11--=m n m n nA A 规定10==n n n C C 2. 含有可重元素......的排列问题. 对含有相同元素求排列个数的方法是:设重集S 有k 个不同元素a 1,a 2,…...a n其中限重复数为n 1、n 2……n k ,且n = n 1+n 2+……n k , 则S 的排列个数等于!!...!!21k n n n n n =.例如:已知数字3、2、2,求其排列个数3!2!1)!21(=+=n 又例如:数字5、5、5、求其排列个数?其排列个数1!3!3==n .●3.组合.1. ⑴组合:从n 个不同的元素中任取m (m ≤n )个元素并成一组,叫做从n 个不同元素中取出m 个元素的一个组合.⑵组合数公式:)!(!!!)1()1(m n m n C m m n n n AA C m n m mm nmn -=+--==Λ ⑶两个公式:①;m n n m n C C -= ②mn m n m n C C C 11+-=+①从n 个不同元素中取出m 个元素后就剩下n-m 个元素,因此从n 个不同元素中取出 n-m 个元素的方法是一一对应的,因此是一样多的就是说从n 个不同元素中取出n-m 个元素的唯一的一个组合.。

(或者从n+1个编号不同的小球中,n 个白球一个红球,任取m 个不同小球其不同选法,分二类,一类是含红球选法有1m n 111m n C C C --=⋅一类是不含红球的选法有m n C )②根据组合定义与加法原理得;在确定n+1个不同元素中取m 个元素方法时,对于某一元素,只存在取与不取两种可能,如果取这一元素,则需从剩下的n 个元素中再取m-1个元素,所以有C 1-m n ,如果不取这一元素,则需从剩余n 个元素中取出m 个元素,所以共有C m n 种,依分类原理有m n m n m n C C C 11+-=+.⑷排列与组合的联系与区别.联系:都是从n 个不同元素中取出m 个元素.陆区别:前者是“排成一排”,后者是“并成一组”,前者有顺序关系,后者无顺序关系.⑸①几个常用组合数公式 nn n n n n C C C 2210=+++Λλ 11111121153142011112++--++++++-+=+==++=+++=+++k n k n k n kn m n m m n m m m m m m n n n n n n n n C n C k nCkC C C C C C C C C C C C ΛΛΛ②常用的证明组合等式方法例. i. 裂项求和法. 如:)!1(11)!1(!43!32!21+-=++++n n n Λ(利用!1)!1(1!1n n n n --=-) ii. 导数法. iii. 数学归纳法. iv. 倒序求和法.v. 递推法(即用m n m n m n C C C 11+-=+递推)如:413353433+=+++n n C C C C C Λ.vi. 构造二项式. 如:n n n n n n C C C C 222120)()()(=+++Λ证明:这里构造二项式n n n x x x 2)1()1()1(+=++其中n x 的系数,左边为22120022110)()()(n n n n n n n n n n n n n n n n C C C C C C C C C C C +++=⋅++⋅+⋅+⋅--ΛΛ,而右边nn C 2= ●4.排列、组合综合.1. I. 排列、组合问题几大解题方法及题型: ①直接法. ②排除法.③捆绑法:在特定要求的条件下,将几个相关元素当作一个元素来考虑,待整体排好之后再考虑它们“局部”的排列.它主要用于解决“元素相邻问题”,例如,一般地,n 个不同元素排成一列,要求其中某)(n m m ≤个元素必相邻的排列有m m m n m n A A ⋅+-+-11个.其中11+-+-m n m n A 是一个“整体排列”,而m m A 则是“局部排列”. 又例如①有n 个不同座位,A 、B 两个不能相邻,则有排列法种数为-2n A 2211A A n ⋅-. ②有n 件不同商品,若其中A 、B 排在一起有2211A A n n ⋅--. ③有n 件不同商品,若其中有二件要排在一起有112--⋅n n n A A . 注:①③区别在于①是确定的座位,有22A 种;而③的商品地位相同,是从n 件不同商品任取的2个,有不确定性.④插空法:先把一般元素排列好,然后把待定元素插排在它们之间或两端的空档中,此法主要解决“元素不相邻问题”.例如:n 个元素全排列,其中m 个元素互不相邻,不同的排法种数为多少?mm n m n m n A A 1+---⋅(插空法),当n – m+1≥m, 即m ≤21+n 时有意义.柒⑤占位法:从元素的特殊性上讲,对问题中的特殊元素应优先排列,然后再排其他一般元素;从位置的特殊性上讲,对问题中的特殊位置应优先考虑,然后再排其他剩余位置.即采用“先特殊后一般”的解题原则.⑥调序法:当某些元素次序一定时,可用此法.解题方法是:先将n 个元素进行全排列有n n A 种,)(n m m π个元素的全排列有mm A 种,由于要求m 个元素次序一定,因此只能取其中的某一种排法,可以利用除法起到去调序的作用,即若n 个元素排成一列,其中m 个元素次序一定,共有m mn n A A 种排列方法.例如:n 个元素全排列,其中m 个元素顺序不变,共有多少种不同的排法?解法一:(逐步插空法)(m+1)(m+2)…n = n !/ m !;解法二:(比例分配法)m m n n A A /.⑦平均法:若把kn 个不同元素平均分成k 组,每组n 个,共有k knnn n k n kn A C C C Λ)1(-⋅.例如:从1,2,3,4中任取2个元素将其平均分成2组有几种分法?有3!224=C (平均分组就用不着管组与组之间的顺序问题了)又例如将200名运动员平均分成两组,其中两名种子选手必在一组的概率是多少? (!2/102022818C C C P =)注意:分组与插空综合. 例如:n 个元素全排列,其中某m 个元素互不相邻且顺序不变,共有多少种排法?有mmm m n m n m n A A A /1+---⋅,当n – m+1 ≥m, 即m ≤21+n 时有意义.⑧隔板法:常用于解正整数解组数的问题.例如:124321=+++x x x x 的正整数解的组数就可建立组合模型将12个完全相同的球排成一列,在它们之间形成11个空隙中任选三个插入3块摸板,把球分成4个组.每一种方法所得球的数目依次为4321,,,x x x x 显然124321=+++x x x x ,故(4321,,,x x x x )是方程的一组解.反之,方程的任何一组解),,,(4321y y y y ,对应着惟一的一种在12个球之间插入隔板的方式(如图所示)故方程的解和插板的方法一一对应. 即方程的解的组数等于插隔板的方法数311C .注意:若为非负数解的x 个数,即用na a a ,...,21中i a 等于1+i x ,有A a a a A x x x x n n =-+-+-⇒=+++1...11...21321,进而转化为求a 的正整数解的个数为1-+n n A C .⑨定位问题:从n 个不同元素中每次取出k 个不同元素作排列规定某r 个元素都包含在内,并且都排在某r 个指定位置则有rk r n r r A A --.2x 4捌例如:从n 个不同元素中,每次取出m 个元素的排列,其中某个元素必须固定在(或不固定在)某一位置上,共有多少种排法?固定在某一位置上:11--m n A ;不在某一位置上:11---m n m n A A 或11111----⋅+m n m m n A A A (一类是不取出特殊元素a ,有m n A 1-,一类是取特殊元素a ,有从m-1个位置取一个位置,然后再从n-1个元素中取m-1,这与用插空法解决是一样的)⑩指定元素排列组合问题.i. 从n 个不同元素中每次取出k 个不同的元素作排列(或组合),规定某r 个元素都包含在内 。

相关主题