当前位置:文档之家› 非参数统计十道题

非参数统计十道题

非参数统计----十道题09统计学 王若曦 114一、 Wilcoxon 符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。

数据来源:《非参数统计(第二版)》 吴喜之手算: %建立假设组:01H :M=8H :M>8T 2467891046T 5319n=10+-=++++++==++=查表得P=<α=,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。

》SPSS :操作:Analyze ——Nonparametric Tests ——2-Related Sample TestTest Statistics bc - xZ-1.886aAsymp. Sig. (2-tailed).059Exact Sig. (2-tailed)!.064Exact Sig. (1-tailed).032Point Probability.008a. Based on positive ranks.b. Wilcoxon Signed Ranks Test由输出结果可知,单侧精确显著性概率P=<α=,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。

与手算结果相同。

R语言:…> x=c,,,,,,,,,> (x-8,alt="greater")Wilcoxon signed rank testdata: x - 8V = 46, p-value =alternative hypothesis: true location is greater than 0由输出结果可知,P=<α=,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。

与以上结果一致。

|二、 Mann-Whitney-Wilcoxon 检验下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。

检验亚洲国家和欧美国家的人均国民收入是否有显著差异(α=)。

@手算:设亚洲国家为X ,欧美国家为Y 建立假设组:0x y 1x yH :M =M H :M M ≠x y x T 12346891548T 5710111213141688N m n 16m n 8U T m(m 1)/212=+++++++==+++++++==+====-+=,,查表得,T x =48的右尾概率的2倍为*2=< α=,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。

SPSS:操作:Data——Sort CasesAnalyze——Nonparametric Tests——2-Independent SamplesRanks分组N Mean Rank Sum of Ranks…收入亚洲国家8欧美国家8Total16Test Statistics b收入Mann-Whitney U¥Wilcoxon WZAsymp. Sig. (2-tailed).036 Exact Sig. [2*(1-tailed Sig.)].038a Exact Sig. (2-tailed).038 Exact Sig. (1-tailed).019 Point Probability.005a. Not corrected for ties.b. Grouping Variable: 分组由输出结果可知,精确双尾概率P=< =,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。

与手算结果一致。

R语言:,> x<-c(1740,38980,1280,4960,2750,27490,15830,720)> y<-c(43740,32600,34580,37600,34810,30010,7310,3460)> (x,y,exact=F,cor=F)Wilcoxon rank sum testdata: x and yW = 12, p-value =alternative hypothesis: true location shift is not equal to 0。

由输出结果可知,P=< α=,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。

与以上结果一致。

三、 两样本的Kolmogorov-Smirnov 检验下面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。

》 吴喜之手算:建立假设组:012112H :F (x)=F (x)H :F (x)F (x)≠D=max D=0769231mnD=130().,查表得,当mnD=130时,双侧检验的概率P<,所以P< =,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。

SPSS:操作:Analyze——Nonparametric Tests——2-Independent Samples。

由输出结果可知,双侧精确显著性概率Pα=,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。

与手算结果一致。

四、Cochran Q检验下面是某村村民对四个候选人(A,B,C,D)的赞同与否的调查(“1”代表同意,“0”代表不同意);最后一列为行总和,最后一行为列总和,全部“1”的总和为42。

试分析4数据来源:《非参数统计(第二版)》 吴喜之手算:建立假设组:01H 4H 4:位候选人在村民眼中没有差异:位候选人在村民眼中有差异k k 22j j 22222j=1j=1n n 2222i i i=1i=1k-1k x -x (41)[4(161196)42]Q =9.35294(42)(518273)k y -y df 413⎡⎤⎢⎥-+++-⎣⎦==-⨯+⨯+⨯=-=∑∑∑∑()() 查表得20.057.82Q 9.3529χ=<=,因此在5%的显著性水平上拒绝原假设,即认为4位候选人在村民眼中有显著差异。

SPSS :操作:Analyze ——Nonparametric Tests ——K Related Samples@FrequenciesValue1A 416 B@911 C 11 9 D146Test Statistics。

N20 Cochran's Q df 3 Asymp. Sig. .025 Exact Sig..025 …Point Probability.006a. 0 is treated as a success.由输出结果可知,Q=,精确的显著性概率P=< α=,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。

与手算结果一致。

R 语言: > x=("f:/")> n=apply(x,2,sum) > N=sum(n)> L=apply(x,1,sum) )> k=dim(x)[2]> Q=(k*(k-1)*sum((n-mean(n))^2))/(k*N-sum(L^2)) > Q [1]> pvalue=pchisq(Q,k-1,low=F) > pvalue [1]由输出结果可知,Q=, P=< α=,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。

与以上结果一致。

五、 \ 六、 Friedman 检验一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。

三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶。

对一组商店在一段时间的调查结果列再下表中(单手算:建立假设组:01H H :三种销售方式无差异:三种销售方式有差异k22222rjj=11212R 3n(k 1)(101424)38(31)13nk(k 1)83(31)df 312χ=-+=++-⨯+=+⨯+=-=∑ >查表得220.05r 5.9913χχ=<=,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。

SPSS :操作:Analyze ——Nonparametric Tests ——K Related SamplesTest Statistics aN 8 Chi-Square df!2Asymp. Sig. .002 Exact Sig. .000 Point Probability .000a. Friedman Test由输出结果可知,22r 0.0513 5.99χχ=>=,精确的显著性概率P<,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。

与手算结果一致。

;R 语言: > d=("f:/") > (d))Friedman rank sum testdata: (d)Friedman chi-squared = 13, df = 2, p-value =由输出结果可知,213χ=, P=<α=,因此拒绝原假设,即认为三种销售方式有显著差异。

与以上结果一致。

%七、 K 个样本的卡方检验在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商数据来源:《非参数统计》 王星手算: ,建立假设组:01H H :人们去三个商场的概率相同:人们去三个商场的概率不同()2rkij ij i=1j=1ijf -e Q==0.685+2.274+15.691=18.651e df=(k-1)(r-1)=4∑∑查表得20.05=9.49χ,因为Q=>20.05=9.49χ,因此拒绝原假设,即认为人们去三个商场的概率不同。

$SPSS :操作:Data ——Weight Cases由输出结果可知,卡方统计量为,精确双尾检验概率P=<=,因此拒绝原假设,即认为人们去三个商场的概率不同。

与手算结果一致。

八、 Kruskal-Wallis 检验 》某制造商雇用了来自三个本地大学的雇员作为管理人员。

最近,公司的人事部门已经收集信息并考核了年度工作成绩。

从三个大学来的雇员中随机地抽取了三个独立样本。

制造商数据来源:百度文库 SAS 讲义手算:建立假设组:01H H :三个总体的考核成绩分布相同:三个总体的考核成绩分布不同各雇员的成绩等级2222k jj=1j R 1212(95)(27)(88)KW H 3(N+1)=3(201)8.9163N(N+1)n 20(21)767⎡⎤=-++-+=⎢⎥⎣⎦∑统计量因为出现同分的情况,应对H 进行校正,校正系数3333322u u (33332222)C 1=10.9925N(N +1)20(20+1)H 8.9163/0.99258.9839df=k 12--+-+-+-=--===-=∑∑校正后的统计量查表得,在05.0=α的显著性水平上,20.05χ=,由于H=>20.05χ=,因此拒绝原假设,即三个总体的考核成绩分布不同。

相关主题