非参数统计分析实验指导书朱宁编2012.3.12实验二单样本符号检验一.实验目的1.了解Excel、Minitab程序结构及其使用方法;2.会用Excel、Minitab对数据进行预处理;3.会用符号检验法来解决中位数的检验问题。
二.实验要求1. 会用Excel、Minitab软件对建立的数据集进行分析;2. 掌握中位数检验问题的符号检验法及其步骤。
三.实验原理1.基本原理在对总体分布不做任何假设的前提下,当原假设错误!未找到引用源。
:(已知)为真时,大于错误!未找到引用源。
的数据个数S+与小于错误!未找到引用源。
的数据个数S-应该很接近;若两者相差太大,就有理由拒绝原假设。
2.单样本中位数符号检验的适用范围1)在数据呈偏态分布的情况下,我们可能对总体的中位数更感兴趣,希望对总体的中位数做出推断,这时可以使用符号检验(sign test)的方法。
2)在非正态总体小样本的情况下,如果要对总体分布的位置进行推断,由于t检验不适用,也可使用符号检验的方法。
3.符号检验的基本思想每个数据都减去零假设中的中位数,记录其差值的符号。
计算正、负符号的个数(差值为0的不计算在任何一个中),当原假设为真时二者应该很接近;若两者相差太远,就有理由拒绝原假设。
4.符号检验问题的原假设和备择假设该假设检验有三种情况:原假设错误!未找到引用源。
为:错误!未找到引用源。
,其中错误!未找到引用源。
是给定的常数.备择假设错误!未找到引用源。
分别是:错误!未找到引用源。
、错误!未找到引用源。
和错误!未找到引用源。
.5.符号检验的检验统计量检验统计量:错误!未找到引用源。
记号“#”表示计数,即S+是集合G中的元素,其中G是使得错误!未找到引用源。
成立的错误!未找到引用源。
(错误!未找到引用源。
)构成的集合。
错误!未找到引用源。
1)在原假设成立的条件下,检验统计量错误!未找到引用源。
服从二项分布。
2)按照这个概率可以根据二项分布计算得到P值,从而得出检验的结论。
四.应用实例【例1】某市劳动和社会保障部门的资料说明,1998年高级技术师的年收入的中位数为21700元.该市某个行业有一个由50名高级技师组成的样本.这些高级技师的年收入如下表:用符号检验法来解决中位数的检验问题的步骤如下:①给出原假设和备择假设。
针对该问题,经计算,这50名高级技师年收入的中位数为23276,超过了全市高级技师年收入的中位数21700.因此,这个假设检验问题的原假设和备择假设分别为:错误!未找到引用源。
②用统计软件Minitab进行符号检验的步骤:a)将表1高级技师的年收入数据放在Excel里面做成一列;b)输入数据:将Excel表中50个高级技师的年收入数据输入到C1列;c)选择Stat(统计)下拉菜单;图1 Stat下拉菜单对话框d)选择Nonparametric(非参数)选项;e)在Nonparametric的下拉菜单中选择1-Sample Sign(单样本符号)选项;图2 Nonparametric下拉菜单对话框f)在对话框的Variable(变量)方框内键入C1;选择Test median(检验中位数)并在Test median栏中键入欲检验的中位数错误!未找到引用源。
的值,本例是21700;还要在Alternative(备择)的下拉菜单的3个选项(小于,不等于和大于)中选择一项,本例是选大于。
图3 单样本符号对话框g)单击OK(确定).输出结果如下图:图4 输出的检验结果图从输出的结果可以看出,对于给定的α=0.05的检验水平,从得出的p值=0.0325<α,我们可以得出结论:拒绝原假设错误!未找到引用源。
,从而认为总体中该行业高级技师的年收入的中位数错误!未找到引用源。
>21700.【例2】以上述50名高级技师年收入数据为例,来说明Excel在单样本场合符号检验中的应用。
具体步骤如下:同例1,首先给出假设问题的原假设和备择假设:错误!未找到引用源。
①输入数据。
如图5所示,A2:A51输入年收入数据,A1输入列标志“年收入”。
②计算S+。
在C2单元格输入公式“=COUNTIF(A2:A51,">21700")”即可,该函数表示统计A2:A51单元格中大于21700的数据点的个数。
③计算S-。
在C3单元格输入公式“=COUNTIF(A2:A51,"<21700")”,该函数表示统计A2:A51单元格中小于21700的数据点的个数。
④计算n。
在C4单元格输入公式“=C2+C3”。
⑤由Excel计算P值。
如果在Excel中输入“=binomdist(k,n,p,1)“,就可以求得累积概率P(b(n,p)<=k)的值;如果在Excel中输入” =binomdist (k,n,p,0)“,则求得概率P(b(n,p)=k)的值.所以在Excel中输入”“,就可以得到符号检验的P值,即P(b(n,1/2)>= 1-binomdist(S+-1,n,0.5,1)S+)的值。
此例中n=50,S+=32,由Excel算的检验的P值为P(b(n,1/2)>= 32)=0.32454.结果如图5所示。
⑥判断。
根据以上计算出的数据可进行判断。
图5 Excel算的结果通过Excel计算得到的结果可知:对于给定的α=0.05的检验水平,由于P 值比较小,即P=0.032454<0.05,因此我们认为在总体中该行业高级技师的年收入的中位数me比全市高级技师年收入的中位数21700元要高.倘若要根据观测值算的S+拒绝原假设,那么P值也可以用来度量犯第一类错误的概率.此例的P值为0.032454.它表示,若要根据S+=32拒绝原假设,那么犯第一类错误的概率只有0.032454.注1:此例是针对备择假设为:错误!未找到引用源。
情况,计算得到的P值;如果是对于错误!未找到引用源。
情况,由Excel算P值,应在Excel中键入“=binomdist(S+,n,0.5,1)“,就可以求得P(b(n,1/2)<=S+)的值;如果是对于错误!未找到引用源。
情况,由Excel算P值:S+>=n/2时输入”2(1-binomdist(S+-1,n,0.5,1))“;S+<=n/2时输入”2(binomdist(S+,n,0.5,1))“,即可求得P值。
至于选择哪种情况,要视具体问题来选择。
注2:n为S++S-而不是题中的数据总数。
五.(本次课)实验内容某地区从事管理工作的职员的月收入的中位数是6500元.现有一个该地区从事管理工作的40个妇女组成的样本.她们的月收入数据如下表。
使用该样本数据检验:该地区从事管理工作的妇女的月收入的中位数是否低于6500元?要求:分别用Minitab和Excel来完成。
表2 职员的月收入数据六.课后练习(注:一班做练习4,二班做练习5,其它练习选做)【练习1】质量监督部门对商店里出售的某厂家的西洋参片进行抽查。
对于25包写明净重为100g的西洋参片的承重结果为:99.05 100.25 102.56 99.15 104.89 101.86 96.37 96.79 99.3796.90 93.94 92.97 108.28 96.86 93.94 98.27 98.36 100.8192.99 103.72 90.66 98.24 97.87 99.21 101.79检验厂家包装的西洋参片分量是否足够。
由于不了解总体分布,因此对其进行符号检验。
原假设和备择假设为:错误!未找到引用源。
【练习2】假设某地16座预出售的楼盘均价,单位(百元/平方米),数据如下所示:36 32 31 25 28 36 40 3241 26 35 35 32 87 33 35问:该地区平均楼盘价格是否与媒体公布的3700元/平方米的说法一致?原假设和备择假设为:错误!未找到引用源。
【练习3】某城镇去年居民家庭平均每人每月生活费收入275元。
根据抽样调查,今年该城镇50户居民家庭平均每人每月生活费收入如下:367 322 294 273 237 398 327 298 276 246311 355 240 275 296 324 382 229 264 288235 271 291 319 360 226 262 286 309 352337 222 260 284 304 343 217 259 283 303200 253 281 301 329 212 257 281 303 332试问该城镇居民家庭平均每人每月生活费收入今年与去年比较是否明显提高(α=0.05)?原假设和备择假设为: H0:μ=275;H1:μ>275。
【练习4】如果一个矩形的宽度w与长度l的比11)0.6182wl=≈,这样的矩使用符号检验法检验假设0:0.618Hμ= vs1:0.618Hμ≠。
【练习5】下表为不同季节20个实验动物体重变化情况。
A 组表示冬季, B 组表。