()()()()()扁平尖峰分布;,3s *n 组数*X-分组峰态系数正值,右偏分布越大偏斜越大,,该组的中值;s*n 组数*X -SK 分组s*2-n 1-n X-n SK 未分组偏态系数04.%99/%95/%68个标准差3/2/1经验法则:.03,越大,离散系数越大X s小)离散系数(衡量差异大-离散程度标准差/数值型数据:方差顺序数据:四分位差总频数(众数频数)f -1V 分类数据:异众比率离散程度02.x几何平均X 加权平均数.01443333s mr n<>===±====∑∑∑∏∑∑ii i i iii M K SK M M X V G W X W PS :()0.3P x μ-≤=1919x P n σ⎛⎫-≤≤ ⎪⎝⎭双侧:H 0≠A无显著差异,同α/2比较左单侧:希望数值越大越好H 0 μ ≥A右单侧:希望数值越小越好 H 0 μ ≤A ;同α比较 P 值检验方法,求出Z ,若x >μ,计算P (Z>Z 值)值 双侧:P<α/2 拒绝原假设 单侧P<α 拒绝原假设 运用置信区上下限比较nZ σα2(边际误差)=∇(单侧为α)n总体标准差抽样标准误差=若∇>0-x μ,则拒绝H 若σ未知,用s 代替,使用t 分布()()遇小数点向前进一)()1(定估计比例时样本量的确.22(边际误差):定一个估计时样本量的确.211-n 自由度s )1n (s )1n (总体方差.13)1(总量)的区间估计(样本样本比率.12)1(方差未知,小样本,总体正态)2(置信区间为。
即,该样本平均或:未知/大样本且方差已知)1(计一个总体均值的区间估.1122222222222/12222/2222EP P Z n n Z E E Z n nP P Z P P nS n t X nSZ X -⋅=⎪⎪⎭⎫⎝⎛==-≤≤--±÷-±∂±-αααααααασσλλσλσ()()(),则不拒绝1-n 1-n 1总体方差的检验:.33)1(:总体比例检验统计量321自由度,/:未知小样本,,/已知小样本,,/或:大样本一个参数的假设检验.3122/222/1222ααλλλσλπππμσσμσσμ≤≤-=--=-=-=-=-=-S n nP Z n nS X t nX Z nS X Z()()()()()()()()()()()⎪⎪⎭⎫ ⎝⎛=≤≤-+-±--±±-⎪⎪⎭⎫ ⎝⎛+-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛+±-≠≠⎪⎪⎭⎫ ⎝⎛+-+±-=≠-+-+-=⎪⎪⎭⎫⎝⎛+-+±-=+±-≥--212/212/12/1222122212/2221222111221d 2d22222212121222212122212122121212221212122121212122221122122122121222121212121n ,n 1n ,n s /s /s /s 两个总体方差比.13)1()1(:两个总体比例之差.12ns )1(d 小样本2ns d 大样本1的总平均数为每一组对应样本之差d 本)的估计,两个总体之差(匹配样).5(1s 1s s s v s s )v (,未知,正态,,小样本)4(s s )2(,未知,正态,,小样本)3(2s 1s 1s 11s )2(,未知正态,,小样本)2(s s 可以互换/未知/已知,),30,(大样本)1(:独立样本)的区间估计(两个总体均值之差.11ααααααααααασσσσσσσσσσσF F F F n p p n p p Z p pn t Z n n n n n n n n t X Xn n n n n n t X X n n n n n nn n n n t X Xn n Z X X S n n pp()()()()()()()()222121221122211121021212121222121212121212122121212221212121222112221222212221总体方差的相似性:.33)1()1(d)0(多设为d 、样本比例11)1(、:两个总体比率之差32)比较1n (t 同,n s ˆ匹配样本:计算)4(值自由度同左,s s X小样本,)3()2(自由度,11X小样本,)2(,XZ 大样本)1(两个参数的假设检验.31边际误差)1()1(p 5.0;21定估计比例时样本量的确.22n n :量的确定两个估计均值差时样本21ππππσμμσσμμσσσσμμσσαα=++=⎪⎪⎭⎫⎝⎛-+---==-⎪⎪⎭⎫⎝⎛+--==-=⎪⎪⎭⎫ ⎝⎛+---=≠-+⎪⎪⎭⎫⎝⎛+---==+---=-⋅-====+==S S F n n p n p n p n p p n p p p p Z B n n p p p p Z A V n n X t n n n n S X t n n X E Ep p p Z n p p n n EZ p连列分析连列表:条件频数/行百分数/列百分数/总百分数 期望值:行百分数x 条件总值方差分析:检验各个总体的均值是否相等,判断分类自变量对数值因变量的影响()()()()()()()()()()1-c ,1-r min *n 相关系数.5nc 列联相关系数.4越大,相关程度越大,cd ab排列:d b c a d c b a bc-ad n相关系数.3比较df 同)总数列总和行总和(依赖关系)独立性检验(是否存在.2,拒绝原假设df 比较,若df 同)1-)(列数1-(行数自由度:两数之间相关程度.1期望值频数)观察值频数(2222222222220λλλϕλϕλλλλλλααα=+=+++++==+=-=>=-=∑∑V CTRT f f f ff f f f f e e e e e e 1.单因素方差分析关系是比较每两组数据间的,拒绝,有显著差异-X ,k -n 自由度为11最小显著差异.3占总的自变量对因变量的影响,关系量强度.2,拒绝若,统计量.1k-n SSE组内均方_;1-k SSA 组间均方MSA 1-n 自由度;的误差)的平方的总和x :(每一个观测值与k-n 自由度的总和)的平方)的误差x 均值:(每组内频数与组平1-k 自由度和的误差)的平方))总x ((各组间平均值与*(组内频数:组的个数k 总数,n 个值,:其中第个条件;:第总平均数x 一个条件组的平均数;x ,组内误差,,组间误差总平方和(总误差)j i j i222LSD LSD X n n MSE t LSD R SSESSAR F F MSEMSAF MSE SST SSE SSA j j i i SSE SSA SST >⎪⎪⎭⎫⎝⎛+==>===αα2.双因素方差分析 A.独立双因素22i j 的影响占总的这两个自变量对因变量,关系量强度.2,拒绝,即差异显著若))1k )(1r (,1-r (~列因素显著性))1k )(1r (,1-k (~行因素显著性.1同理、,1)1k )(1r (;随机误差平方和)1-r ( df ,列因素误差和),1-k (df ,行因素误差和1-kr :df ,自由度总平方和(总误差)为总平均数x ;x ,每行平均i ,因素k 行数;x ,每列平均值j ,因素r 列数R SSTSSCSSR R F F F MSEMSCF F MSE MSRF MSE MSC K SSRMSR SSESSC SSR SST df SSE SSC SSR SST C R +=>--=--=-=++=--α B.交互作用双因素K,个行因素;m ,行因素数值的行数 R,个列因素;n ,观察值总数误差来源 平方和 自由度 均方 F 值 行因素 SSR K-1 MSR MSR/MSE 列因素 SSC R-1 MSC MSC/MSE 交互左右 SSRC (K-1)(R-1) MSRC/MSE 误差 SSE KR(M-1) 总和 SST N-1()()()()()()()()y预测y ˆ,y ˆ-y 标准化残差y ˆ-y e 残差.56x x x x n1**)1(y y 时,得到的置信区间估计,取值y .55n 1,t 回归系数1-k -n 自由度;自由度2-n ,1~线性关系线性关系显著性检验.54估计标准误差:越大拟合越好,拟合优度.53强度的线性关系r 拒绝,即存在,,t 若)2-n (~r-12-n rt2右偏分布r 较大,负值,左偏r 较大,正值,总体相关系数1的显著性检验,r ,无关0负线性相关;,0,正线性相关;0度,两个关系间的关系强r 相关系数.52,:和截距估计的回归方程的斜率:程估计的简单线性回归方一元线性回归模型.5100ei 002i20200022ˆˆ222122ee II ee iiiii S Z S n t X X X S S S AB SSE K SSR F MSEMSRF MSES SSTSSRR t t x b y A nx x ny x y x B Bx A y ==--+-±-=-====>==<>-=--=+=∑∑∑∑∑∑∑∑αββααρ()),拒绝,即存在1-k -n (若均数,各个自变量之间相关系多重共线性判定.64)1-k -n (~S t 回归系数:)1,(~)1/(/显著性检验:线性关系.63估计标准误差:k ,自变量数量n 样本数量1k 111修正的多重判定::多重判定系数拟合优度.62:之间的关系,,:多元回归方程:多元线性回归模型.612iii 22222110ααββεββββt t k n k F k n SSE KSSR F MSES n n R R SSTSSRR SSESSR SST SSE SSR SST x x x y e a p p >=----==---⋅--==+=++⋅⋅⋅+++=71.时间序列平稳序列非平稳序列(趋势T/季节性S/周期性C/随机性I )平均增长率=环比增长率的几何平均值-1()季节性顺序.75修正指数曲线指数曲线线性趋势趋势型预测.74-F 指数平滑:个值作为一期的平均数选择F 移动平均:Yt1F 简单平均法平稳序列的预测.73和求平均每一个误差平方后的总均方误差和求平均全部误差取绝对值后总平均绝对误差所有预测误差的平均数平均误差,预测值个观测值i 第预测方法评估.72t t t 1t 1t ti1t ii F Y F K MSE MAD ME F Y α+======+++∑回归分析的一些数据P1:MR :相关系数;RS 判定系数,ARS 调整的判定系数;标准误差s ,观测值nP2:df 自由度;总平方和SS ;均方MS ;线性关系F (Ps:回归R,残差E,总计T)P3,:INTER,截距;XV,斜率;t-stat 回归系数P值检验,P >α,不拒绝;<α,拒绝。