当前位置:文档之家› R语言实验

R语言实验

实验8 假设检验(二)一、实验目的:1.掌握若干重要的非参数检验方法( 2检验——列联表独立性检验,Mcnemar检验——对一个样本两种研究方法是否有差异的检验,符号检验,Wilcoxon符号秩检验,Wilcoxon秩和检验);2.掌握另外两个相关检验:Spearman秩相关检验,Kendall秩相关检验。

二、实验内容:练习:要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。

④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。

如文件名为“1305543109张立1”,表示学号为1305543109的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。

最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。

截图方法:法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“Pr Scrn”等字符),即完成截图。

再粘贴到word文档的相应位置即可。

法2:利用QQ输入法的截屏工具。

点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。

)1.自行完成教材第五章的例题。

2.(习题5.11)为研究分娩过程中使用胎儿电子监测仪对剖腹产率有无影响,对5824例分娩的经产妇进行回顾性调查,结果如下表所示,试进行分析。

剖腹产胎儿电子监测仪合计使用未使用是358 229 587否2492 2745 5237合计2850 2974 5824解:提出假设:H0:分娩过程中使用胎儿电子监测仪对剖腹产率无影响H1:分娩过程中使用胎儿电子监测仪对剖腹产率有影响源代码及运行结果:(复制到此处,不需要截图)> x<-c(358,2492,229,2745)> dim(x)<-c(2,2)> chisq.test(x)Pearson's Chi-squared test with Yates' continuity correctiondata: xX-squared = 37.414, df = 1, p-value = 9.552e-10结论:P= 9.552e-10<0.05,拒绝原假设,分娩过程中使用胎儿电子监测仪对剖腹产率有影响3.(习题5.12)在高中一年级男生中抽取300名考察其两个属性:B是1500米长跑,C是每天平均锻炼时间,得到4 ×3列联表,如下表所示。

试对 = 0.05,检验B与C 是否独立。

解:提出假设:H0:B与C独立。

H1:B与C不独立。

源代码及运行结果:(复制到此处,不需要截图)> x<-c(45,46,28,11,12,20,23,12,10,28,30,35)> dim(x)<-c(4,3)> chisq.test(x)Pearson's Chi-squared testdata: xX-squared = 40.401, df = 6, p-value = 3.799e-07结论:P=3.799e-07<0.05,拒绝原假设,B与C不独立,有关系。

4.(习题5.13)为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,其结果如下表所示。

试进行分析。

两种工艺下产品质量的抽查结果解:提出假设:H0:两种工艺对产品的质量没影响H1:两种工艺对产品的质量有影响源代码及运行结果:(复制到此处,不需要截图)> x<-c(3,6,4,4)> dim(x)<-c(2,2)> fisher.test(x)Fisher's Exact Test for Count Datadata: xp-value = 0.6372alternative hypothesis: true odds ratio is not equal to 195 percent confidence interval:0.04624382 5.13272210sample estimates:odds ratio0.521271结论:P=0.6372>0.05,接受原假设,两种工艺对产品的质量没影响5.(习题5.14)应用核素法和对比法检测147例冠心病患者心脏收缩运动的符合情况,其结果如下表所示。

试分析这两种方法测定结果是否相同。

两法检查室壁收缩运动的符合情况解:提出假设:H0:这两种方法测定结果不相同H1:这两种方法测定结果相同源代码及运行结果:(复制到此处,不需要截图)> x<-c(58,1,8,2,42,9,3,7,17)> dim(x)<-c(3,3)> mcnemar.test(x)McNemar's Chi-squared testdata: xMcNemar's chi-squared = 2.8561, df = 3, p-value = 0.4144结论:P=0.4144>0.05,因此,不能认为这两种方法测定结果不相同6.(习题5.15)在某养鱼塘中,根据过去经验,鱼的长度的中位数为14.6cm,现对鱼塘中鱼的长度进行一次估测,随机地从鱼塘中取出10条鱼长度如下:13.32 13.06 14.02 11.86 13.58 13.77 13.51 14.42 14.44 15.43将它们作为一个样本进行检验。

试分析,该鱼塘中鱼的长度是在中位数之上,还是在中位数之下。

(1)用符号检验分析;(2)用Wilcoxon符号秩检验分析。

解:(1)用符号检验分析提出假设:H0:M>=14.6H1:M<14.6源代码及运行结果:(复制到此处,不需要截图)> x<-c(13.32 , 13.06 , 14.02 , 11.86 , 13.58 , 13.77 , 13.51 , 14.42 , 14.44 , 15.43)> binom.test(sum(x>14.6),length(x),al="l")Exact binomial testdata: sum(x > 14.6) and length(x)number of successes = 1, number of trials = 10, p-value = 0.01074alternative hypothesis: true probability of success is less than 0.595 percent confidence interval:0.0000000 0.3941633sample estimates:probability of success0.1(2)用Wilcoxon符号秩检验分析提出假设:H0:M>=14.6H1:M<14.6源代码及运行结果:(复制到此处,不需要截图)x<-c(13.32 , 13.06 , 14.02 , 11.86 , 13.58 , 13.77 , 13.51 , 14.42 , 14.44 , 15.43)> wilcox.test(x,mu=14.6,al="l",exact=F)Wilcoxon signed rank test with continuity correctiondata: xV = 4.5, p-value = 0.01087alternative hypothesis: true location is less than 14.6结论:两种方法的P都是小于0.05,拒绝原假设,中位数小于14.67.(习题5.16)用两种不同的测定方法,测定同一种中草药的有效成分,共重复20次,得到实验结果如下表所示。

(2)试用Wilcoxon符号秩检验法检验两测定有无显著差异;(3)试用Wilcoxon秩和检验法检验两测定有无显著差异;(4)对数据作正态性和方差齐性检验,该数据是否能作t检验,如果能,请作t检验;(5)分析各种的检验方法,试说明哪种检验法效果最好。

解:(1)符号检验法提出假设:H0:两测定无显著差异H1:两测定有显著差异源代码及运行结果:(复制到此处,不需要截图)>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0 ,11.0,22.3)> binom.test(sum(x>y),length(x))Exact binomial testdata: sum(x > y) and length(x)number of successes = 14, number of trials = 20, p-value = 0.1153alternative hypothesis: true probability of success is not equal to 0.595 percent confidence interval:0.4572108 0.8810684sample estimates:probability of success0.7结论:P=0.1153>0.05,接受原假设,两测定无显著差异(2)Wilcoxon符号秩检验法提出假设:H0:两测定无显著差异H1:两测定有显著差异源代码及运行结果:(复制到此处,不需要截图)>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,2 0.0,21.0,46.1)>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0 ,11.0,22.3)> wilcox.test(x,y,paired=T,exact=F)Wilcoxon signed rank test with continuity correctiondata: x and yV = 136, p-value = 0.005191alternative hypothesis: true location shift is not equal to 0结论:P= 0.005191<0.05,拒绝原假设,两测定有显著差异(3)Wilcoxon秩和检验法提出假设:H0:两测定无显著差异H1:两测定有显著差异源代码及运行结果:(复制到此处,不需要截图)>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,2 0.0,21.0,46.1)>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0 ,11.0,22.3)> wilcox.test(x,y,exact=F)Wilcoxon rank sum test with continuity correctiondata: x and yW = 274.5, p-value = 0.04524alternative hypothesis: true location shift is not equal to 0结论:P=0.04524<0.05,拒绝原假设,两测定有显著差异(4)两独立样本t检验,要求判断独立性、正态性和方差齐性①正态性检验提出假设:H0:两组数据服从正态分布H1:两组数据不服从正态分布源代码及运行结果:(复制到此处,不需要截图)>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,2 0.0,21.0,46.1)>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0 ,11.0,22.3)> ks.test(x,pnorm,mean(x),sd(x))One-sample Kolmogorov-Smirnov testdata: xD = 0.14067, p-value = 0.8235alternative hypothesis: two-sidedWarning message:In ks.test(x, pnorm, mean(x), sd(x)) :Kolmogorov - Smirnov检验里不应该有连结> ks.test(y,pnorm,mean(y),sd(y))One-sample Kolmogorov-Smirnov testdata: yD = 0.10142, p-value = 0.973alternative hypothesis: two-sided结论:两组数据P值都大于0.05,接受原假设,两组数据服从正态分布②方差齐性检验提出假设:H0:两组数据方差相同H1:两组数据方差不相同源代码及运行结果:(复制到此处,不需要截图)>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,2 0.0,21.0,46.1)>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0 ,11.0,22.3)> var.test(x,y)F test to compare two variancesdata: x and yF = 1.1406, num df = 19, denom df = 19, p-value = 0.7772alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:0.4514788 2.8817689sample estimates:ratio of variances1.140639结论:P=0.7772>0.05,接受原假设,两组数据方差相同③能否作t检验?如果能,请按照前面各题的格式、内容写出作t检验的过程综上,能作t检验提出假设:H0:两测定无显著差异H1:两测定有显著差异源代码及运行结果:(复制到此处,不需要截图)>x<-c(48.0,33.0,37.5,48.0,42.5,40.0,42.0,36.0,11.3,22.0,36.0,27.3,14.2,32.1,52.0,38.0,17.3,20.0,21.0,46.1)>y<-c(37.0,41.0,23.4,17.0,31.5,40.0,31.0,36.0,5.7,11.5,21.0,6.1,26.5,21.3,44.5,28.0,22.6,20.0 ,11.0,22.3)> t.test(x,y,var.equal=T)Two Sample t-testdata: x and yt = 2.2428, df = 38, p-value = 0.03082alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:0.8125529 15.8774471sample estimates:mean of x mean of y33.215 24.870结论:P=0.03082<0.05,拒绝原假设,两测定有显著差异(5)分析各种的检验方法,试说明哪种检验法效果最好。

相关主题