统计学公式汇总 文档编制序号:[KKIDT-LLE0828-LLETD298-POI08] 统计学公式汇总 (1) αβδμσνπρυt u F X s
2
(2) 均数(mean):nXn
XXXXn21 式中X表示样本均数,X1,X2,
Xn为各观察值。 (3) 几何均数(geometric mean, G):
)lg(lg)lglglg(lg121121nXnXXXXXXGnnn•式中G表示
几何均数,X1,X2,Xn为各观察值。
(4) 中位数(median, M) n为奇数时,)21(nXM
n为偶数时,2/][)12()2(nnXXM 式中n为观察值的总个数。 (5) 百分位数 )%(LxxfxnfiLP 式中L为Px所在组段的下限,fx为其频
数,i为其组距,Lf为小于L各组段的累计频数。
(6) 四分位数(quartile, Q) 第25百分位数P25,表示全部观察值中有25%(四分之
一)的观察值比它小,为下四分位数,记作QL;第75百分位数P75,表示全部观
察值中有25%(四分之一)的观察值比它大,为上四分位数,记作QU。 (7) 四分位数间距 等于上、下四分位数之差。
(8) 总体方差 N
X22)(
(9) 总体标准差 N
X2)( (10)样本标准差 1/)(1)(222nnXXn
XXs
(11)变异系数(coefficient of variation, CV) %100
X
sCV
(12)样本均数的标准误 理论值nX 估计值n
ssX 式中σ为总体标准差,s为
样本标准差,n为样本含量。 (13)样本率的标准误 理论值np)1( 估计值n
ppsp)1( 式中π为总体率,
p为样本率,n为样本含量。 (14)总体率的估计:正态分布法,(nppupnppup/)1(,/)1() 式中p为样本均数,s为样本标准差,n为样本含量。
(15)总体均数的估计t分布法:(nstXn
stX,,,) 式中X为样本均数,s
为样本标准差,n为样本含量,ν为自由度。 (16)总体均数的估计u分布法:
总体标准差σ未知但较大时,(nsuXn
suX,) 式中X为样本均
数,s为样本标准差,n为样本含量。 总体标准差σ已知时,(nuXnuX,) 式中X为样本均数,σ为总
体标准差,n为样本含量。 (17)样本均数与总体均数比较的t检验:nsXt/0
1n 式中X为样本均数,
0为欲比较的总体均数,s为样本标准差,n为样本含量,ν为自由度。 (18)样本均数与总体均数比较的u检验: nsXu/0
式中X为样本均数,0为欲比
较的总体均数,s为样本标准差,n为样本含量。 (19)样本均数与总体均数比较的u检验:nXu/0
式中X为样本均数,0为欲比
较的总体均数,σ为总体标准差,n为样本含量。 (20)配对设计差值的符号秩和检验正态近似法公式:48)(24)12)(1(4/)1(3jjttnnn
nnTu
式中T为秩和,求秩和方法:差值d=(X-μ0);依差值的绝对值从小到大编秩;
差值为0者,舍去不计;如果差值相等,取平均秩次;分别求出正、负秩次之和T(+)、T(-);T为二者绝对值较小者;n为样本含量,但不包括差值等于0者;tj(=1,2,···)为第j个相同差值的个数。
(21)配对设计两样本均数比较的t检验:nsdtd/
0 1n
式中d为差值d的均
数,sd为差值d的标准差,n为样本含量(即样本对子数),差值d=各对子数据之
差(含正负号!),ν为自由度。 (22)成组设计两样本均数比较的t检验:
)11(2/)(/)(21212222212121212211nnnnnXXnXXXXsXXtXX
221nn 式中1X和2X分别为两个样本均数, n1和n2为两个样本含量,ν
为自由度。 (23)样本率与总体率的比较:未校正的正态近似法)1(000n
nXu 或
npu/)1(000式中X为样本阳性数,π0为欲比较的总体率,p为样本率, n
为样本含量。 (24)样本率与总体率的比较:校正的正态近似法)1(5.0||000n
nXu 或
nnpu/)1(2/1||000式中X为样本阳性数,π0为欲比较的总体率,p为样本率, n
为样本含量。 (25)样本率与总体率的比较:直接计算概率法:首先按照二项分布的原理计算从0到
n各个X的概率值P(X)=XXnXnXn00)1()!(!!。左单侧:PL表示从0到Xs
的累计概率;右单侧:PR 表示从Xs到n的累计概率;单侧概率P=MIN(PL,
PR);双侧概率P的计算方法有三种:A,单侧概率乘2;B,当X大于nπ0时,双侧概率=P(≥X)+P(≤(2 nπ0-X));当X小于nπ0时,双侧概率=P(≤X)
+P(≥(2 nπ0-X));C,将P(X)≤P(Xs)的各个概率值相加,即得双侧累计概率,即P=∑P(X),X满足条件P(X)≤P(Xs)。式中X为样本阳性数,π
0为欲比较的总体率,Xs为样本阳性数, n为样本含量。 (26)两个样本率的比较:正态近似法222111212221
)1()1(21nppnppppssppupp
式中p
1
和p2分别为两个样本率, n1和n2为两个样本含量。
(27)两个样本率的比较:正态近似法213211
2121
,)11)(1(nnpnpnpnnppppuccc 式中
p1和p2分别为两个样本率, n1和n2为两个样本含量。 (28)四格表2检验:TTA22)( ν=(行数-1)(列数-1)式中A为实际
频数(actual frequency),T为理论频数(theoretical frequency),n
nnTCRRC 式
中TRC表示R行(row)C列(column)的理论频数,nR为相应行的合计值,nC
为相应列的合计值,n为总例数,ν为自由度。
(29)四格表2检验专用公式:))()()(()(22dbcadcbanbcad ν=(行数-1)(列
数-1)式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。 (30)四格表2值的校正公式:))()()(()2/|(|22dbcadcbannbcad ν=(行数-1)(列
数-1) 式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。 (31)行×列表2检验公式:)1(22CRnnAn ν=(R-1)(C-1)式中A为实
际频数(actual frequency),nR为相应行的合计值,nC为相应列的合计值,n为
总例数,,R为行数,C为列数,ν为自由度。 (32)行×列表2检验公式:)1(112RiCjjiijmnAn ν=(R-1)(C-1)式中Aij为
实际频数(actual frequency),ni为相应行的合计值,mj为相应列的合计值,n为
总例数,R为行数,C为列数,ν为自由度。 (33)四格表的确切概率法:!!!!!)!()!()!()!(ndcba
dbcadcbaP 式中a,b,c,d为四格
表的四个实际频数,n为总例数。取表原则可分为“差数极端法”和“概率极端法”。多数情况下,二者所得结果一致,但个别情况下,所得结果不同。一般认为,“概率极端法”最准确。