当前位置:文档之家› 统计学各章计算题公式及解题方法

统计学各章计算题公式及解题方法

统计学各章计算题公式及解题方法第四章数据的概括性度量1.组距式数值型数据众数的计算:确定众数组后代入公式计算:下限公式:M0=M+?1?1+?2×M;上限公式:M0=M−?2?1+?2×M,其中,L为众数所在组下限,U为众数所在组上限,?1为众数所在组次数与前一组次数之差,?2为众数所在组次数与后一组次数之差,d为众数所在组组距2.中位数位置的确定:未分组数据为M+12;组距分组数据为M23.未分组数据中位数计算公式:M M={M(M+12),n为奇数12(M M2+M M2+1),n为偶数4.单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)5.组距式数列的中位数计算公式:下限公式:M M=M+M2−M M−1M M×M;上限公式:M M=M−M2+M M+1M M×M,其中,M M为中位数所在组的频数,M M−1为中位数所在组前一组的累积频数,M M+1为中位数所在组后一组的累积频数6.四分位数位置的确定:未分组数据:{下四分位数:M M=M+14上四分位数:M M=3(M+1)4;组距分组数据:{下四分位数:M M=M4上四分位数:M M=3M47.简单均值:M̅̅̅=M1+M2+⋯+M MM =∑M MMM=1M8. 加权均值:M ̅̅̅=M 1M 1+M 2M 2+⋯+M M M MM 1+M 2+⋯+M M=∑M M M MM M =1M=∑M MM M =1M M M,其中,M 1,M 2…M M 为各组组中值9. 几何均值(用于计算平均发展速度):M ̅̅̅=√M 1×M 2×…×M M M =√∏M M M M =1M10. 四分位差(用于衡量中位数的代表性):M M =M M −M M 11. 异众比率(用于衡量众数的代表性):M M =∑M M −M M ∑M M=1−M M ∑M M12. 极差:未分组数据:R =MMM (M M )−MMM (M M );组距分组数据:R =最高组上限−最低组下限13. 平均差(离散程度):未分组数据:M M =∑|M M −M̅̅̅|M M =1M;组距分组数据:M M =∑|M M −M̅̅̅|M M =1?M M M14. 总体方差:未分组数据:σ2=∑(M M −M )2M M =1M;分组数据:σ2=∑(M M −M )2M M =1?M MM15. 总体标准差:未分组数据:σ=√∑(M M −M )2M M =1M;分组数据:σ=√∑(M M −M )2M M =1?M MM16. 样本方差:未分组数据:M M −12=∑(M −M̅̅̅)2M M =1M −1;分组数据:M M −12=∑(M M −M̅̅̅)2?M M M M =1M −117. 样本标准差:未分组数据:M M −1=√∑(M −M̅̅̅)2M M =1M −1;分组数据:M M −1=√∑(M M −M̅̅̅)2?M M M M =1M −118. 标准分数:M M =M M −M ̅̅̅M19. 离散系数:M M =M M̅̅̅第七章 参数估计1. M M 2的估计值:2. 不同情况下总体均值的区间估计:其中,M M 2查p448 ,查找时需查n-1的数值3. 大样本总体比例的区间估计:M ±M M 2√M (1−M )M4. 总体方差M 2在1−α置信水平下的置信区间为:(M −1)M 2M M /22≤M 2≤(M −1)M 2M 1−M /225. 估计总体均值的样本量:n =(M M /2)2M 2M 2,其中,E 为估计误差6. 重复抽样或无限总体抽样条件下的样本量:n =(M M /2)2M (1−M )M 2,其中π为总体比例第八章 假设检验1. 总体均值的检验(M 2已知或M 2未知的大样本)[总体服从正态分布,不服从正态分布的用正态分布近似]2. 总体均值检验(M 2未知,小样本,总体正态分布)注:σ已知的拒绝域同大样本3.一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)(其中M0为假设的总体比例)4.总体方差的检验(M2检验)5. z统计量的参考数值第九章 列联分析1. 期望频数的分布(假定行变量和列变量是独立的)一个实际频数 f MM 的期望频数 e MM ,是总频数的个数M 乘以该实际频数 f MM 落入第M 行 和第j 列的概率,即:M MM =M ·(M M M)?(M M M)=M M M MM2. M 2统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的相关程度χ2=∑∑(M MM −M MM )2M MMMM =1M M =1,自由度为(M −1)(M −1),M MM 为列联表中第i 行 第j 列的实际频数,M MM 为列联表中第i 行 第j 列的期望频数1) 检验多个比例是否相等检验的步骤提出假设H 0:?1 = ?2 = … = ?j ;H 1: ? 1 , ?2 , …,?j 不全相等;计算检验的统计量;进行决策:根据显着性水平?和自由度(r -1)(c -1)查出临界值??2,若?2>??2,拒绝H 0;若?2<??2,不拒绝H 02) 利用样本数据检验总体比例是否等于某个数值检验的步骤提出假设H 0:?1 = ,?2 = ,… ;H 1:原假设的等式中至少有一个不成立;计算检验的统计量;进行决:根据显着性水平?和自由度(r -1)(c -1)查出临界值??2;若?2>??2,拒绝H;若?2<??2,不拒绝H3)检验列联表中的行变量与列变量之间是否独立检验的步骤提出假设H0:行变量与列变量独立;H1:行变量与列变量不独立;计算检验的统计量;进行决策:根据显着性水平?和自由度(r-1)(c-1)查出临界值??2,若?2???2,拒绝H0;若?2<??2,不拒绝H3.?相关系数:测度2?2列联表中数据相关程度;对于2?2 列联表,?系数的值在0~1之间φ=√M2M,其中,n为实际频数总个数,即样本容量4.列联相关系数(C系数)用于测度大于2?2列联表中数据的相关程度M=√M2M2+M,其中,C的取值范围是 0≤C<1;C = 0表明列联表中的两个变量独立;C的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大;根据不同行和列的列联表计算的列联系数不便于比较5.V相关系数V=√MM MMM[(M−1),(M−1)],其中,V 的取值范围是 0≤V≤1; V = 0表明列联表中的两个变量独立;V=1表明列联表中的两个变量完全相关;不同行和列的列联表计算的列联系数不便于比较;当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=φ第十章方差分析1.单因素方差分析的要点:1)建立假设的表述方法:M0:M1=M2=⋯=M M ,自变量对因变量没有显着影响M1:M1,M2,…,M M不全相等,自变量对因变量有显着影响2)决策:i.根据给定的显着性水平α,在F分布表中查找与第一自由度df1=k−1、第二自由df2=n−k相应的临界值F Mii.若F>F M,则拒绝原假设H0,表明均值之间的差异是显着的,所检验的因素对观察值有显着影响iii.若F<F M,则不拒绝原假设H0,不能认为所检验的因素对观察值有显着影响3)单因素方差分析表的结构:2.方差分析中的多重比较(步骤):采用Fisher提出的最小显着差异方法,简写为LSD1)提出假设:M0:M M=M M(第M个总体的均值等于第M个总体的均值)M0:M M≠M M(第M个总体的均值不等于第M个总体的均值)2)计算检验统计量:M̅̅̅M−M̅̅̅M3)计算LSD:LSD=M M2√MMM(1M M+1M M)4)决策:若|M̅̅̅M−M̅̅̅M|>MMM,则拒绝M0;若|M̅̅̅M−M̅̅̅M|<MMM,则不拒绝M0 3.双因素方差分析:1)无交互作用的双因素方差分析表结构:2)有交互作用的双因素方差分析表结构:4. 关系强度测量:变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映,根据M 2平方根R 进行判断M 2=MMM (组间平方和)MMM (总平方和)第十一章 一元线性回归1. 样本的相关系数:r =∑(M −M ̅̅̅)(M −M ̅̅̅)√∑(M −M̅̅̅)?∑(M −M̅̅̅)=M ∑MM −∑M ∑M√M ∑M −(∑M )?√M ∑M −(∑M )2. 相关系数的显着性检验步骤:1) 提出假设:M 0:ρ=0;M 1:ρ≠0 2) 计算检验统计量:t =|M |√M −21−M 2~M (M −2)3) 确定α并决策:|M |>M M 2,拒绝M 0;|M |<M M 2,不拒绝M 03. 一元回归模型:y =M 0+M 1M +?4. 一元线性回归方程形式:M (M )=M 0+M 1M ,其中M 0是直线方程在y 轴上的截距,是当M =0时,y 的期望值;M 1是直线的斜率,称为回归系数,表示当M 每变动一个单位时y 的平均变动值5. 一元线性回归中,估计的回归方程:M ̂=M ̂0+M ̂1M ,其中M ̂0是估计的回归直线在y 轴上的截距,M ̂1是直线的斜率,它表示对于一个给定的M 的值,M ̂是y 的估计值,表示当M 每变动一个单位时y 的平均变动值 6. 根据最小二乘法求M ̂0以及M ̂1的公式:{M ̂1=M ∑M M M M −(∑M M M M =1)(∑M M MM =1)M M =1M ∑M M M M =1(∑M M M M =1)M ̂0=M ̅̅̅−M 1M ̅̅̅7. 误差平方和之间的关系:∑(M M −M ̅̅̅)2=M M =1∑(M ̂M −M ̅̅̅)2+∑(M M −M M =1M M =1M ̂M )2,即:SST (总平方和)=SSR (回归平方和)+SSE(残差平方和)8. 判定系数(回归平方和占离差平方和的比例):M 2=MMM MMM=∑(M ̂M −M ̅̅̅)2M M =1∑(M M −M̅̅̅)2MM =1=1−∑(M M −M ̂M )2M M =1∑(M̂M −M ̅̅̅)2M M =19. 估计标准误差(实际观察值与回归估计值离差平方和的均方根):M M =√∑(M M −M̂M )2M M =1M −2=√MMM M −2=√MMM10. 线性关系的显着性检验:1) 提出假设:M 0:β1=0,线性关系不显着;M 1:β1≠0,有线性关系 2) 计算检验统计量:F =MMM 1⁄MMM M −2⁄=MMM MMM~M (1,M −2)3) 确定显着性水平α,并根据分子自由度1和分母自由度n-2找出临界值M M 4) 决策:若F >M M ,拒绝M 0;F <M M ,不拒绝M 0 11. 回归系数的显着性检验:1) 提出假设:M 0:β1=0,线性关系不显着;M 1:β1≠0,有线性关系 2) 计算检验统计量:t =M ̂1M M ̂1~M (M −2)3) 确定显着性水平α并决策:若|M |>M M 2⁄,拒绝M 0;|M |<M M 2⁄,不拒绝M 012. 置信区间估计:E (M 0)在1−α置信水平下的置信区间:M ̂0±M M 2⁄(M −2)M M √1M +(M 0−M ̅̅̅)2∑(M M −M̅̅̅)2MM =1 其中,M M 为估计标准误差,(n −2)为M M 2⁄的自由度13. 预测区间估计:M 0在1−α置信水平下的预测区间:M ̂0±M M 2⁄(M −2)M M √M +1M+(M 0−M ̅̅̅)2∑(M M −M̅̅̅)2M M =114. 回归分析表的结构: 15. 几点说明:1) 判定系数M 2测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上,残差平方和SSE=0,M 2=1,拟合是完全的2) 在一元线性回归中,相关系数r 实际上是判定系数M 2的平方根 3) 相关系数r 与回归系数M ̂1是同号的第十三章 时间序列预测和分析1. 环比增长率:报告期增长率与前一期水平之比减1:M M =M MM M −1−1 (i =1,2,Λ,n )2. 定基增长率:报告期水平与某一固定时期水平之比减1M M =M M M 0−1 (i =1,2,Λ,n ),其中, M 0表示用于对比的固定基期的观察值3. 平均增长率:序列中各逐期环比值(也称环比发展速度) 的几何平均数减1后的结果(描述现象在整个观察期内平均增长变化的程度)G ̅=√M 1M 0×M 2M 1×Λ×M MM M −1M −1=√MM M 0M−1,G ̅表示平均增长率,n 为环比值的个数1) 当时间序列中的观察值出现0或负数时,不宜计算增长率2) 在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对水平的结合分析4. 时间序列预测的步骤:1) 确定时间序列所包含的成分,也就是确定时间序列的类型 2) 找出适合此类时间序列的预测方法3) 对可能的预测方法进行评估,以确定最佳预测方案 4) 利用最佳预测方案进行预测5. 均方误差:通过平方消去正负号后计算的平均误差,用MSE 表示MSE=∑(M M−M M)2MM=1M,其中M M为观测值,M M为预测值6.简单平均法:根据过去已有的t期观察值来预测下一期数值。

相关主题