当前位置:文档之家› 非参数统计列联表卡方检验

非参数统计列联表卡方检验

非参数统计期末大作业一、Wilcoxon符号秩检验某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。

在广告创意中,预计广告投放后会产生效果。

一组不看广告组和一组看广告,抽取16位被调查者,让起给产品打分。

现有数据如下不看广告62 83 96 99 71 60 97 100 看广告87 92 90 86 94 95 82 91 分析广告效应是否显著。

1、手算建立假设:H0:广告效应不显著H1:广告效应显著不看广告组记为x,看广告组记为y。

X Y D=x-y |D| |D|的秩D的符号62 87 -25 25 7 -83 92 -9 9 2.5 -96 90 6 6 1 +99 86 13 13 4 +71 94 -23 23 6 -60 95 -35 35 8 -97 82 15 15 5 +100 91 9 9 2.5 +由表可知:T+=1+4+5+2.5=12.5T-=7+2.5+6+8=23.5根据n=8,T+和T-中较大者T-=23.5,查表得,T+的右尾概率为0.230到0.273,在显著性水平下,P值显然较大,故没有理由拒绝原假设,表明广告效应不显著。

2、Spss在spss中输入八组数据(数据1):选择非参数检验中的两个相关样本检验对话框中选择Wilcoxon,输出如下结果(输出1):RanksN Mean Rank Sum of Ranks 看广告- 不看广告Negative Ranks 4a 3.12 12.50Positive Ranks 4b 5.88 23.50Ties 0cTotal 8a. 看广告< 不看广告b. 看广告> 不看广告c. 看广告= 不看广告由上表,负秩为4,正秩也为4,同分的情况为0,总共8。

负秩和为12.5,正秩和为23.5,与手算结果一致Test Statistics b看广告- 不看广告Z -.771aAsymp. Sig. (2-tailed) .441a. Based on negative ranks.b. Wilcoxon Signed Ranks Test由上表,Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著性结果为0.441,明显大于0.05,因此在的显著性水平下,没有理由拒绝原假设,即表明广告效应不显著,与手算的结论一致。

3、R语言(R语言1)输入语句:x=c(62,83,96,99,71,60,97,100)y=c(87,92,90,86,94,95,82,91)wilcox.test(x,y,exact=F,cor=F)输出结果:Wilcoxon rank sum testdata: x and yW = 33, p-value = 0.9164alternative hypothesis: true location shift is not equal to 0由输出结果可知,P=0.9164,远大于 =0.05,因此没有理由拒绝原假设,即广告效应并不显著,与以上结果一致。

二、Wal d-Wolfowitz游程检验有低蛋白和高蛋白两种料喂养大白鼠,以比较它们对大白鼠体重的增加是否有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲饲料增重量低蛋白X 64 71 72 75 82 83 84 90 91 96 高蛋白Y 42 52 61 65 69 75 78 78 78 81 给定显著性水平=0.05,试用游程检验法检验两种饲料的影响有无显著差异。

1、手算建立假设:H0:两种饲料对大白鼠无显著差异H1:两种饲料对大白鼠有显著差异将X,Y的数据按从小到大混合排列,得X,Y的混合样本序列:Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X 故得游程总数U=6,m=10,n=10,查表得,U=6的概率为0.019,由于是双侧检验,对于显著性水平=0.05,对应的P值为2因此拒绝原假设,即表明两种饲料对大白鼠有显著差异。

2、Spss在spss中输入数据(数据2)在非参数检验中选择两个独立样本检验对话框:在Define Groups输入1和2。

在Test Type选中Wald-Wolfowitz runs。

输出结果如下(输出2):Frequencies分组N增重量 1 102 10Total 20Test Statistics b,cNumber of Runs Z Exact Sig. (1-tailed)增重量Minimum Possible 6a-2.068 .019Maximum Possible 8a-1.149 .128a. There are 2 inter-group ties involving 4 cases.b. Wald-Wolfowitz Testc. Grouping Variable: 分组由上表,P值与手算结果一致,因此也拒绝原假设,即表明两种饲料对大白鼠有显著差异。

三、Kolmogorov-Smirnov检验为了研究两家电信运营商套餐在目标市场的年龄维度上的分布是否相同,该电信运营公司开展了一个社会调查活动。

数据如下:两种通信套餐的用户年龄套餐1 套餐218 2218 4825 5122 3424 4223 2626 443138分析两种套餐的目标市场年龄的分布是否存在显著性差异。

1、手算建立假设:H0:两种套餐的目标市场年龄分布不存在显著差异H1:两种套餐的目标市场年龄分布存在显著差异检验统计量D的计算表年龄f1 f2 S1(x) S2(x) S1(x)- S2(x)18 1 0 1 0 1/7 0 1/718 1 0 2 0 2/7 0 2/722 1 1 3 1 3/7 1/9 20/6323 1 0 4 1 4/7 1/9 29/6324 1 0 5 1 5/7 1/9 38/6325 1 0 6 1 6/7 1/9 47/6326 1 1 7 2 1 2/9 7/9 31 0 1 7 3 1 3/9 6/9 34 0 1 7 4 1 4/9 5/9 38 0 1 7 5 1 5/9 4/9 42 0 1 7 6 1 6/9 3/9 44 0 1 7 7 1 7/9 2/9 48 0 1 7 8 1 8/9 1/9 5117911由上表,找出检验统计量D=max ()()x S x S 21-=7/9,m=7,n=9,mnD=,查表得,相应的P 值为0.008,在5%的显著性水平上,P 值足够小,因此拒绝原假设,表明两种套餐的目标市场年龄分布存在显著差异。

2、 spss输入数据(数据3)在非参数检验中选择两个独立样本检验:对话框:运营商1和2分类的变量输入到Grouping Variable,在Define Groups输入1和2。

在Test Type选中Kolmogorov-Smirnov。

在点Exact时打开的对话框中可以选择精确方法(Exact)。

输出结果如下(输出3);Frequencies运营商N年龄 1 72 9Frequencies运营商N年龄 1 72 9Total 16Test Statistics a年龄Most Extreme Differences Absolute .778Positive .000Negative -.778Kolmogorov-Smirnov Z 1.543Asymp. Sig. (2-tailed) .017Exact Sig. (2-tailed) .008Point Probability .006a. Grouping Variable: 运营商由上表:精确计算的双尾P 值为0.008,与手算结果一致,表明两种套餐的目标市场年龄分布存在显著差异。

四、k个独立样本的Kruskal-Wallis检验为检测四种防护服对人脉搏的影响,找来20人试穿,每种有5人试穿,测量试1、手算建立假设:H0:测得的脉搏没有显著差异H1:测得的脉搏有显著差异防护服1 防护服2 防护服3 防护服418.5 2.5 15.5 206 11 13 178 4 9.5 18.515.5 1 14 79.5 2.5 12 5秩和57.5 21 64 67.5查表:自由度df=3,显著性水平临界值卡方=7.82。

显然,H=7.854>卡方=7.82,所以拒绝原假设,表明四种防护服对脉搏的影响有显著差异。

2、spss输入20个观测值(数据4)在非参数检验中选择k个独立样本检验防护服分组定义为1到4操作如下图:输出结果如下(输出4):Ranks防护服N Mean Rank脉搏 1 5 11.502 5 4.203 5 12.804 5 13.50Total 20Test Statistics a,b脉搏Chi-Square 7.878df 3Asymp. Sig. .049a. Kruskal Wallis Testb. Grouping Variable: 防护服由上表,卡方与手算十分接近,拒绝原假设,即表明四种防护服对脉搏的影响有显著性差异。

3、中位数检验20个数,中位数为115.5,1 2 3 4>115.5 2 1 4 3 10<=115.5 3 4 1 2 105 5 5 5 20计算Q统计量小于卡方=7.82,没有理由拒绝原假设,表明四种防护服对脉搏的影响没有显著差异。

Spss:在test type中选择中位数,输出结果如下:Test Statistics b脉搏N 20Median 115.50Chi-Square 4.000adf 3Asymp. Sig. .261a. 8 cells (100.0%) have expected frequencies less than 5. The minimum expected cellfrequency is 2.5.b. Grouping Variable: 防护服卡方值为4,与手算结果一致,不拒绝原假设,即表明四种防护服对脉搏的影响没有显著性差异综上,两种算法的结果不一致!!?????4、R语言输入语句(R语言2):x=c(130,111,114,123,115,104,116,106,98,104,123,119,115,120,117 ,133,128,130,112,110)y=c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4)kruskal.test(x,y)输出结果:> kruskal.test(x,y)Kruskal-Wallis rank sum testdata: x and yKruskal-Wallis chi-squared = 7.878, df = 3, p-value = 0.0486 与以上的手算和KS检验法结果一致,拒绝原假设,表明四种防护服防护服对脉搏的影响存在显著差异。

相关主题