当前位置:文档之家› 数量方法笔记整理

数量方法笔记整理

数量方法笔记第一章数据的整理和描述通过本章的学习,考生应当理解和掌握如何对数据进行整理、分组、制表和画图,能够适当地选择和解释数据的各种综合指标,以便能够突出地显示数据的本技和统计含义,从而更有效地交流数据和使用数据。

第一节数据的类型●不同分类型数据描述的是事物的品质特征●度量●尺度数量型●截面数据——不同单位同一时间●时间的关系时间序列数据——同一单位不同时间●平行数据——不同单位不同时间第二节数据的整理与图表显示一、数据的分组与频率直方图分组的标志及方法频数与布表1.整理——分组分几个组单变量值分组——离散型的变量(数出来的不能再分割)如人口数2.分组的方法数量表现比较小组距分组——条件:离散型变量但数量比较多所有连续变量只能用组距分组组距,组数m是根据实际情况而定的组数最小值最大值组中值=二、图形显示:饼形图、条形图、柱形图、散点图、折线图、曲线图、茎叶图。

1.饼图的作用:反映各个部分的构成各频率的总合是100%。

2.条形图和柱形图:信息的比较条形图:不同单位,不同信息的比较柱形图:同一单位不同时间信息的比较。

3.折线图:同柱形图作用相似,对同一的数据折线图具有唯一性(两点间有且只有一条直线)。

4.曲线图:同折线图作用相似也是表示不同时间信息的比较,但不具有唯一性。

5.散点图:表示两个变量之间的相互关系。

(两个变量的任何一对取值都在平面直角坐标系上代表一个点)。

6.茎叶图:把每一个数据分解成两部分——茎与叶它的优点在于它既保留了所有的原始数据又直观地显示出了数据的分布情况(与条形图有相似)第三节数据集中趋势的度量一、平均数1.简单平均= (没有分组的数据)2.加权算术平均:(对于分组的数据)是频数也叫权数例如:求下列平均数:X频数vX.V34567343213×34×45×36×27×1平均数 =利用距中数计算的平均数不是精确的而是近似的。

二、中位数——先排队——中间位置——数值若n为奇数,则位于正中间的那个数据就是中位数,即就是中位数。

若n为偶数则中位数为就是中值数。

例如:1.2、4、5、7、8 中5是中位数,4、5、2、7、8要先排序:2、4、5、7、8,中位数还是5。

套公式 = 那么数是5,n表示数的位置2.4、5、7、8、10 n为5,n+1位是7三、众数众数是出现次数最多的不受极端值的影响。

众数的主要缺点是一个数据集可能没有众数,或众数可能不唯一,而数据集的平均数和中位数都是存在且唯一的。

四、平均数,中位数和众数的关系:1.数据分布是对称分部时:众数=中位数=平均数2.数据分布不是对称分部时:左偏分布时:众数<中位数<平均数右偏分布时:众数>中位数>平均数第四节数据离散趋势的度量一、极差:所有数据的最大值减去最小值的差,极差R=最太值-最小值极差容易受极端值的影响有时是无效的二、四分位点和四分位极差四分位极差先排队再等分为4份,见课本P26图1.19,其中对应Q1,中位数为Q2,的对应Q3,n为总个数。

Q3-Q1=四分位级差,这两个点上的数值叫四分位点。

如果四分位点不是一个整数则将前后两位数相加除以2便是。

三、方差和标准差(课本P26)方差()的计算公式为:四、变异系数(课本P29)变异系数是标准差与平均数的比值,即:第二章随机事件及其概率(课本P33)本章主要介绍随机试验和事件,事件间的关系及其运算,事件的概率与古典概型,最后是条件概率与事件的独立性。

第一节随机试验与随机事件一、随机试验1.试验2.随机试验①可以在相同条件下重复进行。

②每次试验的结果可能不止一个,但所有可能出现的结果事先知道。

③试验结束之前,无法确定该次试验的确切结果。

二、随机事件随机试验中各种可能出现的结果,称随机事件。

随机事件分:1、基本事件(只出现一个结果)。

2、复合事件(由若干个基本事件组成)。

3、必然事件(把所有可能出现的结果都放在一起形成一个集合)。

4、不可能事件(一定不会发现的事件)。

三、样本空间(课本P35)1.所有基本事件的全体所组成的集合称为样本空间,它是必然事件,因此我们也常常用表示。

2.样本空间中的每一个基本事件也称为一个样本点。

3.由若干个样本点组成的集合,即随机事件是样本空间的子集。

4.不包含任何样本点的随机事件就是不可能事件。

四、样本空间与随机事件的表示方法1.例举法2.描述法第二节事件间的关系与运算(课本P37)1、包含关系:或(见课本图2.1)。

2、相等关系:A=B,A与B完全重合。

3、事件的并:A∪B例:C=A∪B表示A或B至少一个发生,或C=A+B。

4、事件的交:A∩B或A,B表示A和B同时发生。

5、互斥事件:表示A发生时B不会发生。

6、对立事件:首先A与B是互斥的,同时2者形成整个样本空间。

7、事件之差:表示事件A发生时B不发生。

第三节事件的概率与古典概率(课本P42)一、频率与概率频率:是某个变量在数据中出现的次数(是用%表示的)。

概率:经过试验,稳定的频率是概率二、概率的性质:1.任何事件的概率都不会是负的,非负性;2.规范性;3.完全可加性,必需是AB互斥时才成立;4.不可能事件概率为零,;5.两个事件差的概率;6.对立事件概率,;7.广义加法公式:。

三、古典概型与计算(一)古典概型试验条件:1、它的样本空间只包含有限个样本点2、每个样本点的发生是等可能的。

(二)古典概率的计算N为样本空间的点数例:有100个产品,其中6个次品,94个正品,抽一个产品抽到次品的概率。

排列组合的有关知道1.两个基本原理(1)加法原理;(2)乘法原理。

2.排列数。

从n个不同的元素中任取m(m≤n)个元素,按照一定的顺序排成一列,叫做从n个不同的元素中取m个元素的一个排列。

3.组合数。

从n个不同的元素中,任取m(m≤n)个元素成为一组,称为从n个不同的元素中取出m个元素的一个组合。

第四节条件概率与事件的独立性一、条件概率:1、,B条件下A发生的概率2、二、概率的乘法公式(B发生的概率×B发生条件下A也同时发生的概率)三、事件的独立性:若P(AB)=P(B)×P(A)则A、B两事件之间为独立性若AB之间是独立的,则P(AB)=P(A)×P(B)四、贝叶斯(Bayes)公式与全概率公式全概率公式:贝叶斯公:第三章随机变量及分布为了更好地理解随机试验的客观统计规律性,深入研究不同随机试验的特性,我们在这一章里介绍随机变量的概念,常用随机变量及其分布,随机变量的数字特性以及它们的应用。

第一节随机变量按照随机变量的取值情况,一般把随机变量分为两类,即离散型(可以列举出来的)随机变量和连续型(算出来的)随机变量。

第二节离散型随机变量一、离散型随机变量及其分布列举随机变量的所有取值每个概率元素1、0≤P≤1;2、所有概率元素之和为1,∑P=1。

二、离散型随机变量的数学期望期望值:例:若,求,的期望值。

三、离散型随机变量的方差第一节随机变量按照随机变量的取值情况,一般把随机变量分为两类,即离散型(可以列举出来的)随机变量和连续型(算出来的)随机变量。

第二节离散型随机变量一、离散型随机变量及其分布列举随机变量的所有取值每个概率元素1、0≤P≤1;2、所有概率元素之和为1,∑P=1。

二、离散型随机变量的数学期望期望值:例:X取1、2、3它的概率分别为0.5、0.3、0.2。

求X的期望值,X2的期望值。

三、离散型随机变量的方差随机变量函数的方差计量a+bx方差的计算D(a+bx)=b2D(X)D(x)=3求D(3-2x) E(X)=3=4×3=12 =(-3+X)=0所有变量值减这组变量值的平均数,它的期望值结果为0E(X)=3 D(X)=4 求 =0 =1四、常用离散型随机变量1.两点分布或(0-1)分布两点颁布特征值:E(X)=P P(X)=P(1-P)数学期望值为P,方差为P(1-P)。

2.二项分布例:次品率为0.05①从中抽取10个1个为次品,其余为正品②10个中有1个正品,第2个为次品,其余为正品的概率P(概率)③10个中有2个次品 [次品位置固定时前两个为 ]X=K 表示做几次试验,有K次出现的概率为多少。

二项颁布率为X~B(n、p)二项颁布期望值E(X)= np 方差D(X)= np(1-p)3.泊松公布:X~P()单位时间内某事件出现的次数e为自然数=2.71828当n很大并且P很小时,可以利用泊松分布来近似地计算二项分布。

泊松分布特征值:E(X)= (期望值) 标准差 D(X)=课本P73(例3.14)3.泊松公布当n很大并且P很小时,可以利用泊松分布来近似地计算二项分布。

泊松分布特征值:E(X)= (期望值) 标准差 D(X)=第三节连续型随机变量一、连续型随机变量及其概率密度函数连续型随机变量的分布函数:F(X) F表示累积概率F(a)≤a的概率 F(a)=p(x=a)P(xFa)=1-F(a);P(a≤x≤b)=F(b)-F(a);P(x=a)=0 x=a的概率为0 二、连续型随机变量的数学期望值和方差若已知E(x),计算E(a+bx)=a+bE(x)方差:若已知D(x),计算D(a+bx) = b2D(X)所有变量值减去期望值为0。

X除以标准差的方差为1。

三、常用的连续型随机变量1.均匀分布:例50-60 60-70 70-80 40-50 2.指数分布(P80)3.正态分布(参照课本图型P82-83)X~N(μ,σ2)方差为1,均值为0。

标准正志分布在-1到+1之间的概率为0.6827在-2到+2之间的概率为0.9545-1.96到+1.96之间的概率为0.95-3到+3之间的概率为0.99733.正态分布(参照课本图型P82-83)X~N(μ,σ2)方差为1,均值为0。

标准正志分布在-1到+1之间的概率为0.6827在-2到+2之间的概率为0.9545-1.96到+1.96之间的概率为0.95-3到+3之间的概率为0.9973① p(x<-1)=1-p(x<1)② p(-1<x<1)=1-2p(x<1)例:X~N(5,9),求p(4<x<6),x股从期望值0.33的标准正态分布为0.6293X~N(10,4)哪一个概率大P(8≤X≤12)(概率最大);P(7≤X≤11);P(9≤X≤13);P(9≤X≤11) 第四节二元随机变量一、二元离散型随机变量二、二元离散型随机变量的联合分布:P(x=xi,y=yj)=Pij两个关系:1.0<Pij≤1; 2.∑PiJ=1。

三、边缘分布:P(x= xi)=Pi(不考虑y的聚会或X的取值)所有数值相加,P(y=yJ)=PJ四、x与y的相互关系如果P(x=xi,y=yj)=P(x=xi)×P(y=yj)五、期望值E(x)=∑XiPiE(y)=∑yJpJE(x×y)=∑(xi,yi)×P(x=xi,y=yj)E(x+y)=E(x)+E(y)E(ax+by)=aE(x)+bE(y)六、协方差:cov为x,y两个变量的协方差Cov(x,y)>0为正相关(x与y之间)。

相关主题