若n为奇数,则Md为第「个数2X n X n1 若n 为偶数,则Md 2-2b.有重复数据b1.重复数没有位于数列中间方法与无重复数一样b2.重复数位于数列中间若重复数的个数为奇数若重复个数为偶数先将数据从小到大(从大到小)排列三、众数a.皮尔逊经验公式:分布近似正态探M。
:3Md -2X算术平均数、中位数、众数三者的关系探在正态分布中:X=Md=M O 四分位差:a未分组数据Q =Q^ Q12b分组数据2f——XiQi = 1* --------- j------ X i二•平均差—1. 原始数据计算公式:氷D _》X_XnIf Xc-乂2. 次数分布表计算公式:AD = -----------------n 三.方差和标准差的定义式:探S2原始数据导出公式、算术平均数1.原始数据计算公式探X in1X Xn2.简捷公式1——X = AM x' n、中位数(中数)1.原始数据计算法探a.无重复数据一.全距R (又称极差):探R = Xmax —XminP百分位数的计算方法:IPp为所求的第P个百分位数Lb为百分位数所在组的精确下限f为百分位数所在组的次数Fb为小于Lb的各组次数的和N为总次数i为组距百分等级:P R -10°F b f(x一Lb)R n [ bi 」在负偏态分布中:X ::: Md ::: M O四、其它集中量数1. 加权平均数(Mw)探W t X, + Xj + - + W,X n2. 几何平均数(Mg)探M g 7 X i X2 X n3、调和平均数(MH)____________ 1丄(丄+丄』N V X1X2X3X4 'X iS21X 2次数分布表计算公式S2、fg-X)2n导出公式、2 If X c2代f X c f> = -n i n 丿If Xf(X ci-X)2n2在正偏态分布中: X Md MO总标准差的合成:$2 in S? +m(X T —X32Tn i ——2 S T =m S +0i(X T —Xi )四•相对差异量探S差异系数CV 100%X标准分数(基分数或Z分数)X —卩项分布X X n_X b(x, n, p)二C n p qn!X! n-X第六章概率分布后验概率:w/ A先验概率概率的加法定理P(A B) P A P Bp A^2 护A) 二P A I P A2 P A概率的乘法定理探R AB)二P A P BP(A, A2^A n)二P A P A2 :"正态分布曲线函数(概率密度函数)公式:Ny/ f (x)=—i一ey=概率密度,即正态分布的纵坐标J =理论平均数-.?=理论方差-=3.1415926; e = 2.71828 (自然对数)x =随机变量的取值(-::< x< -)标准正态分布将正态分布转化成标准正态分布的公式探X - 1 Z ~ N (0,1)CJ次数分布是否为正态分布的检验方法皮尔逊偏态量数法SK = 或SK = (M -M。
)sT分数麦克尔创建T=10Z+50二项分布的平均数为探J = np二项分布的标准差为探▽= Tnpqt分布※X - Jt — ~t( n-1)-nn2分布、、(X j-Xf 22 _」_________ _ ns此时2分布的自由度df = n-1F分布L UF 二----V V2第七章参数估计平均数区间估计的计算①总体正态,(T已知(不管样本容量大小),或总体非正态,6已知,大样本探平均数离差的的抽样分布呈正态,平均数的置信区间为:—x - Z a 丁v 卩v X + Z a 丁空.n 三一n②总体正态,6未知(不管样本容量大小),或总体非正态,6未知,大样本平均数离差的抽样分布为t分布,平均数的置信区间为:③总体正态,6未知,大样本平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:—SX -z —— X2 ■. n④ 总体非正态,小样本可不能进行参数估计,即不能根据样本分布对总体平均数进行估计。
标准差分布的标准差:二、方差的区间估计 根据x 2分布: 2 ' (Xi-X)2 (n -1)s 霍 得出总体方差0.95与0.99置信区间 2 (n -1)s爲272 (1V )/2 二2 、两总体方差之比的区间估计 根据F 分布,可估计二总体方差之比的置信区间 :::F-./21s : j; 122 ' . 2 F :/2 S n21 -'2 2S n1』 -2__ S n2 d第八章假设检验探 双侧检验与单侧检验(假设的形式)探双侧Z 检验统计决断规则探1Z 1与临界值比较 P 值 显著性 检验结果1 Z lv 1.96P > 0.05不显著 保留H0,拒绝H1显著*在0.05显著性水平拒绝1.96 <1 Z lv2.580.05 > P > 0.01H0,接受H1非常显著*在0.01显著性水平拒绝l Z l > 2.58P < 0.01* H0,接受H1l t l 与临界值比较 P 值 显著性 检验结果l t l v t(df)0.05P > 0.05不显著 保留H0,拒绝H1t(df)0.05 < l t l v t(df)0.01 0.05 > P > 0.01显著*在0.05显著性水平 拒绝H0,接受H1l t l > t(df)0.01P < 0.01非常显著**在0.01显著性水平 拒绝H0,接受H1平均数差异的显著性检验两个总体都是正态分布、两个总体方差都已知总体标准差已知条件下,平均数之差的抽样分布 服从正态分布, 为:Z 二X 1 -X 22 2二 1-2-2 r-^-2⑵两样本独立X i - X 2⑴相关样本的平均数差异检验 u1=u2 (或uD=O );备选假设: u1X i —X 2Z =,-----时;鳥-2 丁―彳 n以Z 作为检验统计量,计算公式X X 2SEX⑴两样本相关建立假设:虚无假设: 选择检验统计量并计算Z 分布确定检验形式 双侧u2 (或 uD 0);单侧进行统计推断一查表寻找相应的临界值比较Z与Z ,2)独立样本平均数差异的显著性检验检验步骤:建立假设:虚无假设:u仁u2 (或uD=0 );备选假设: 选择检验统计量并计算Z分布r X1 - X2n2 从而确定该样本的u1u-2 (或uDP是否为小概率,即是否PV0.05。
进行统计推断一查表寻找相应的临界值比较2.两总体正态,两总体方差未知⑴两样本相关t检验检验步骤:建立假设虚无假设u1=u2 (或uD=0 );备选假设:选择检验统计量并计算T分布X1 —X2t = | -- 二S2S2^ - 2 r S1S2 V ^1确定检验形式Z'与Z,u^:u1从而确定该样本的(或0=uD);X1 - X22 2Id _ (?d ) / nn(n — 1)双侧or单侧进行统计推断一查表寻找相应的临界值比较「与T,从而确定该样本的方差齐性检验分布形态F :建立假设:虚无假设:备选假设:自由度:二2 :•门;二1 :F分布df2=n2-1df=n-2(相关样本,查独立样本T分布※1= ------------------仏斗+n选* / n; +n; J m + 斑一2 I»n,P是否为小概率,即是否P是否为小概率,即是否T 表)PV0.05。
PV0.05。
抽样分布的标准误:柯克兰-柯克斯t检X 1S i2X 2S22t ;近似临界值的计算t. _ SE X1 t df! SE X2 t df2 :.t:二2SE; SE;a•等级差数法S1/ n1」:.S12/ n1 -1 S; / n2 -1两总体非正态,X1 -X2Z 二SE D_Xn1和n2大于30 (或50)⑴两样本相关X1 -X2Z 二 ---------------------二;V —2 r G G⑵两样本独立X1 - X22 2S1 S2 2 r S1 S2X1 -X2X i —X2第五章相关量数协方差公式(COV积差相关系数公式rI戈(X - X【Y- Y)r :n S X S Y积差相关系数的原始数据计算公式HXY _ (E X 倉丫丫n2 GMn 二丫n^XY-次匕丫r n3X2— iX 2nZY2— ZY 2r 161 R xi - R Yi「R = I 2-N N2-1b.等级序数法3 41R X R Yr R_ N-1.[N(N 1)—2彳6FD=1 ~N(N -1)(N 1)]肯德尔等级相关Ri:代表评价对象获得的K个等级之和N:代表被等级评定的对象的数目K:代表等级评定者的数目肯德尔U系数u=N(N—1) • K(K-1)+1N为被评价事物的数目,K为评价者的数目;rij为对偶比较记录表中点二列相关二列相关四分相关rpb =r br ti>j(或ivj)格中的择优分数。
X P- X q 飞―•- PqS teosber t180 0ad①相关系数计算公式探ad 一bea be d a eb d列联表相关SSA -1) MSASSE MSE -F(k-1,n-k)查表求理论F值进行统计推断一查表寻找相应的临界值比较F与F,从而确定该样本的P是否为小概率,即是否P<0.05。
方差分析的目的是要分析观测变量的变异是否主要是由控制因素造成还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的。
当F值较大时,说明由控制因素造成的变异显著大于随机因素造成的,也就是说不同水平下的各总体均值有显著差异方差分析中的方差齐性检验,常用哈特莱(Hartley)所提出的最大F值检验法,其计算公式为F max S2max SWin各组容量不等时,用最大的n计算自由度:df 二n -1方差分析的基本步骤:探建立假设:虚无假设:u1 =u1 ...... =uk ;备选假设:至少两个总体的平均数不相等;计算平方和探总平方和:kSS八j=1f ki=1x2IP组间平方和2——丿£N组内平方和(nj详k n k 送X i ! 2丿SS W= SS T- SS B=送Z 2 pXjj L -jmjzd i =1n j 计算自由度探dfb =K-1dfw =N-K计算均方探MSb= SSb /(K-1)MSw = SSw /(N-K) 计算F值:探F= MSb / MSw 随机区组设计的方差分析将变异来源分解为组间变异、区组变异和误差变异三部分:SST = + +SS E随机区组设计方差分析的计算公式探分解平方和》总平方和SS T 二组间平方和SS B -ZXXn区组平方和SS R匸k误差平方和SS E-SS T------ 22 UX2nk2 )(龙龙X )nk2 2R_ 二R< nk-SS B-SS R分解自由度总自由度可以分解为组间、区组和误差自由度df r = df B df R df E总自由度组间自由度区组自由度误差自由度df T = nk -1df B 二k - 1dfR df E df T - df B计算方差组间方差MS B 二聖df B区组方差MS R二坐df R误差方差SS EMS EEdf计算F值组间方差与误差方差的F比值F 二MS BMS EMS R 区组方差与误差方差的F比值 F 二一df R完全随机设计的q检验X a -X bMS W2 為帀MS E 公式中MSW为组内均方,na、nb为两个样本的容量随机区组设计的q检验两因素方差分析的步骤X 2分布建立假设:假设一: 假设二: a1 b1假设三:计算离差平方和H SS b八2 cr如果正态总体的平均数未知,需要用样本平均数作为总体平均数的估计值,这时公式变为:—22 2 X 一X_ 2此时,X 2分布的自由度为X 2检验的计算公式※^2f e_ 2 CF df = n—1。