当前位置：文档之家› 统计学原理-计算公式

统计学原理-计算公式

位值平均数计算公式1、众数：是一组数据中出现次数最多的变量值组距式分组下限公式：2110m m d L M ⋅∆+∆∆+= 0m L ：代表众数组下限； 1100--=∆m m f f ：代表众数组频数—众数组前一组频数0m d ：代表组距； 1200+-=∆m m f f ：代表众数组频数—众数组后一组频数2、中位数：是一组数据按顺序排序后，处于中间位置上的变量值。

中位数位置21+=n 分组向上累计公式：e ee em m m m e d f S fL M ⋅-∑+=-12e m L 代表中位数组下限；1-e m S ：代表中位数所在组之前各组的累计频数；e mf 代表中位数组频数； em d 代表组距3、四分位数：也称四分位点，它是通过三个点将全部数据等分为四部分，其中每部分包含25%，处在25%和75%分位点上的数值就是四分位数。

其公式为：411+=n Q 212+=n Q （中位数） 4)1(33+=n Q实例数据总量: 7, 15, 36, 39, 40, 41 一共6项Q1 的位置=（6+1）/4=1.75 Q2 的位置=（6+1）/2=3.5 Q3的位置=3（6+1）/4=5.25Q1 = 7+（15-7）×（1.75-1）=13， Q2 = 36+（39-36）×（3.5-3）=37.5，Q3 = 40+（41-40）×（5.25-5）=40.25数值平均数计算公式1、简单算术平均数：是将总体单位的某一数量标志值之和除以总体单位。

其公式为：n x n x x x X n ∑=⋯⋯++=212、加权算术平均数：受各组组中值及各组变量值出现的频数（即权数f ）大小的影响，其公式为：fxff f f f x f x f x X i i i ∑∑=⋯⋯++⋯⋯++=2122113、加权算术平均数的频率：其公式为：ffX f f X f f X f f X X n ∑⋅∑=∑∑⋯⋯+∑+∑=22114、调和平均数：由于只掌握每组某个标志的数值总和（M ）而缺少总体单位数（f ）的资料，不能直接采用加权算术平均数法计算平均数，则应采用加权调和平均数。

其公式为：xm m H ∑∑=5、简单几何平均数：就是n 个变量值（Xn ）连乘积的n 次方根：其公式为：n n nX X X X X G ∏=⋯⋯⋅⋅=3216、加权几何平均数：如果变量值较多，其出现的次数不同，则应采用加权几何平均数，其公式为：fff f f f nf f XX X X G nn∑⋯⋯++∏=⋯⋯⋅=212121标志变异绝对指标及成数计算公式一、标志变异绝对指标：1、异众比率（又称离异比率或变差比，它是指非众数组的频数占总频数的比率）：公式即，imi m i r f f f f f V ∑-=∑-∑=12、极差（也称全距，它是一组数据的最大值与最小值这差公式即：min max X X R-=3、平均差（总体各单位标志值对算数平均数的绝对离差的算术平均数，平均差是反映各标志值对平均数的平均距离，平均差越大，说明总体各标志值越分散，平均差越小，说明各标志值越集中），公式即为：（未分组情况）nx x D A -∑=. （分组情况）：ff x x DA ∑-∑=·.4、方差和标准差：方差（是各变量值与其均值离差平方的平均数），公式即为：（未分组情况）nx x 22)(-∑=σ （分组情况）：ff x x ∑-∑=·)(22σ标准差（方差的平方根），公式即为：（未分组情况）n x x 2)(-∑=σ （分组情况）：ff x x ∑-∑=·)(2σ方差的数学性质：变量的方差等于变量平方的平均数减去变量平均数的平方。

方差的简便算法：方差=平方的平均数-平均数的平方平方的平均数表示为：n x 2∑ 平均数的平方表示为：2⎪⎭⎫⎝⎛∑n x 方差简便算法的公式即为：222)(x x -=σ二、是非标志的平均数、方差、标准差：是非标志：将总体分成具有某种性质和不具有某种性质的两部分，我们所关心的标志表现称为“是”，另一标志标现称为“非”。

例如：产品分为合格与不合格品。

成数：总体中，是非标志只有两种表现，我们把具有某种表现和不具有某种表现的单位占全部总体单位的比重称为成数。

具有某种性质的成数用（p ）表示，不具有某种性质的用（q ）表示。

p+q=1。

[成数的平均数（均值）就是成数本身]成数方差：)1(2p p -=σ 成数标准差：p p -=1(σ 抽样平均误差、极限误差计算公式1、抽样平均误差：反映所有的样本平均数与总体平均数的平均误差，用x σ表示。

平均数公式：重置抽样公式为：nM x x σμσ=-∑=2)(其中σ表示总体标准差，n 表示样本容量，M 为样本个数。

不重抽样公式为：1·)(2--=-∑=N nN n M x x σμσ 其中N 为总体单位数。

成数公式：重置抽样公式为：n P P P )1(-=σ不重置抽样公式为：1)1(--⋅-=N nN n P P Pσ2、极限误差：样本统计量与被估计的总体参数的离差的绝对值所容许的最大值，又称边际误差，用∆来表示。

x X x ∆≤- p P p ∆≤-xz σ∆=，用文字表述为：概度率=抽样极限误差÷抽样平均误差。

概率保证程度用()z F 表示，又叫置信度或置信水平，它是z 的函数。

3、计算题步骤：第一套：()z F 求∆1、抽样计算区间估计⇒x ()x x S σ⇒2、根据：()z F 查表 z3、计算：x z σ⋅=∆，写出x ：()∆+∆-x ，x4、成数计算步骤：第一套：()z F 求∆1、抽样计算区间估计⇒P ()p x S σ⇒2、根据：()z F 查表 z3、计算：p p z σ⋅=∆写出（P p ，PP ∆+∆-）样本容量、相关系数、估计标准误差一、样本容量的确定1、平均数：重复抽样下样本容量222∆=σz n ；不重复抽样下样本容量22222)1(σσz N Nz n +∆-= 2、成数：重复抽样下样本容量22)1(pp p z n ∆-⋅=；第二套：∆求()z F1、抽样计算区间估计⇒x ()x x S σ⇒2、根据：xz σ∆=查表 ()z F3、由x 和∆，写出()∆+∆-x ，x第二套：∆求()z F1、抽样计算区间估计⇒P ()p x S σ⇒2、根据：PPz σ∆=查表 ()z F3、由P 和p ∆，写出（P p ，P P ∆+∆-）不重复抽样下样本容量)1()1()1(222p p z N p p Nz n p -⋅+∆--⋅=二、相关系数：在线性条件下说明两个变量之间相关关系密切程度的统计分析指标。

公式1：2222)()())(()()())((y y x x y y x x y y x x y y x x r -∑⋅-∑--∑=-∑⋅-∑--∑=公式2：()()2222y y n x x n y x xy n r ∑-∑⋅∑-∑∑⋅∑-∑=公式3：yx yx xy r σσ⋅⋅-=三、一元线性回归分析：只涉及一个自变量时称为一元回归。

1、估计回归方程可表示为：x b b y 10+=，其中0b 是估计的回归直线在y 轴上的截距，是当x =0时的期望值；1b 是直线的斜率，称为回归系数，表示当x 每变动一个单位时y 的值平均变动。

2、最小二乘法（残差平方和最小）221)())((x x n y x xy n b ∑-∑∑∑-∑= x b y b 10-=2221)()())((x x n y x xy n x x y y x x b ∑-∑∑⋅∑-∑=-∑--∑= n x b n y b ∑-∑=10三、回归直线的似合程度1、判定系数（可决系数）：等于相关系数的平方。

2222212)()(y y n x x n b r ∑-∑∑-∑⋅=2、估计标准误差：实际观察值与回归估计值离差平方和的均方根反映实际观察值在回归直线周围的分散状况从另一个角度说明了回归直线的拟合程度计算公式为22)ˆ(1022-∑-∑-∑=--∑=n xy b y b y n yy S y四、利用回归方程式进行估计1、点估计：对于自变量 x 的一个给定值x 0 ，根据回归方程得到因变量 y 的一个估计值根据回归方程：x b b y 10+=得出y 的估计值。

时间序列的分析指标1、绝对数时间序列的计算：（用算术平均数计算） ①、时期序列的序时平均数：n y y y y y n /21∑=⋯⋯++=②、时点序列的序时平均数：连续时点：连续每天资料不同：n y y /∑= 持续天内资料不变：t yt y ∑∑=/间断时点：间隔时间相等序时平均数的计算(首末折半)：12121121-++⋯⋯++=-n y y y y y nn间断时点：间隔不相等序时平均数的计算：tt y y t y y t y y y n n n ∑++⋯⋯++++=--11232121)2()2()2(2、绝对数或平均数时间序列的序时平均数：应先分别求出构成相对数或平均数的分子和分母的平均数，而后再进行对比（先平均，再对比）：b a y /=3、增长量：增长量=报告期水平-基期水平。

逐期增长量：是报告期水平与前一期水平之差，表示本期比前一期增长的绝对数量累积增长量：是报告期水平与某一固定时期水平之差，说明报告期与某一固定期增长的绝逐期增长量与累积增长量之间存在一定的关系：各逐期增长量的和等于相应时期的累积增长量；两相邻时期累积增长量之差等相应时期的逐期增长量。

4、平均增长量：ny y n y y y n i i 01)(-=-∑=∆-(n 为逐期增长量个数，它是观察数量的个数减1)平均增长量=逐期增长量之和/逐期增长量个数=累积增长量/观察期数。

5、发展速度：发展速度=报告期水平/基期水平环比发展速度：是报告期发展水平与前一水平之比，说明现象逐期发展变化的程度定基发展速度：是报告期发展水平与某一固定时期水平之比，说明现象整个观察期内总的发展变化程度。

以上两种发展速度之间存在着一定的数量：各个环比发展速度的连乘积等于最末期的定基发展速度；两个相邻的定基发展速度之比等于相应的各期环比发展速度。

6、增长速度：增长速度=增长量/基期水平=报告期水平-基期水平/基期水平=发展速度-1 环比增长速度：1//111-=-=---i i i i i i y y y y y G （i=1,2…n ）定基增长速度：1//000-=-=y y y y y G i i i （i=1,2…n ）环比增长速度与定基增长速度之间没有直接关系：若由环比增长速度推算定基增长速度，可先将各环比增长速度加1后连乘，再将结果减1，即得定期增长速度。

e商务文档

统计学原理-计算公式

相关文档推荐：