实验报告( 2012 / 2013学年第一学期)课程名称非参数统计实验名称1、数据的描述性统计2、中心位置的检验问题3、多样本问题和区组设计问题的比较4、相关分析实验时间2012 年10 月15-22 日学生姓名班级学号学院(系) 通达学院专业统计学实验一一、实验题目某航空公司为了解旅客对公司服务态度的满意程度,对50名旅客作调查,要求他们写出对乘机服务、机上服务和到达机场服务的满意程度,满意程度评分从0到100.分数越大,满意程度越高。
下表是收集到得数据。
50名旅客对乘机服务、机上服务和到达机场服务的满意程度的评分乘机服务机上服务到达机场服务乘机服务机上服务到达机场服务71 49 58 72 76 3784 53 63 71 25 7484 74 37 69 47 1687 66 49 90 56 2372 59 79 84 28 6272 37 86 86 37 5972 57 40 70 38 5463 48 78 86 72 7284 60 29 87 51 5790 62 66 77 90 5172 56 55 71 36 5594 60 52 75 53 9284 42 66 74 59 8285 56 64 76 51 5488 55 52 95 66 5274 70 51 89 66 6271 45 68 85 57 6788 49 42 65 42 6890 27 67 82 37 5485 89 46 82 60 5679 59 41 89 80 6472 60 45 74 47 6388 36 47 82 49 9177 60 75 90 76 7064 43 61 78 52 721、对50名旅客关于乘机服务的满意程度数据作描述性统计分析;2、对50名旅客关于机上服务的满意程度数据作描述性统计分析;3、对50名旅客关于到达机场服务的满意程度数据作描述性统计分析;4、对50名旅客关于这三个方面服务的满意程度数据作一个综合比较的描述性统计分析。
二、实验步骤1、乘机服务1)、直方图乘机服务满意程度评分直方图16141210864260-6566-7071-7576-8081-8586-9091-95 2)、箱线图C1 的箱线图959085801C757065603)、数值分析2、机上服务1)、直方图机上服务满意程度评分直方图141210864225-3031-3536-4041-4546-5051-5556-6061-6566-7071-7576-8081-8586-90 2)、箱线图C1 的箱线图908070601C504030203)、数值分析3、到达机场服务1)、直方图到达机场服务满意程度评分直方图141210864216-2526-3536-4546-5556-6566-7576-8586-95 2)、箱线图C3 的箱线图100908070603C50403020103)、数值分析5、综合比较C3C2C1100908070605040302010数据C1, C2, C3 的箱线图一、实验题目某地区从事管理工作的职员的月收入的中位数是6500元,现有一个该地区从事管理工作的40个妇女组成的样本,她们的月收入数据如此下:5100 6300 4900 71004900 5200 6600 72006900 5500 5800 64003900 5100 7500 63006000 6700 6000 48007200 6200 7100 69007300 6600 6300 68006200 5500 6300 5400 4800(1)使用样本数据检验:该地区从事管理工作的妇女的月收入的中位数是否低于6500元?(2)使用样本数据给出该地区从事管理工作的妇女的月收入的中位数的点估计和95%的区间估计。
二、实验步骤H0:中位数等于6500元 H1:中位数低于6500元中位数的符号检验: C1中位数 = 6500 与 < 6500 的符号检验N 下方相等上方 P 中位数C1 40 26 1 13 0.0266 6200MTB >P=0.05>0.0266,所以拒绝原假设,认为中为数低于6500.符号置信区间: C1中位数的符号置信区间取得的置信区间N 中位数置信度下限上限位置C1 40 6200 0.9193 5800 6400 150.9500 5800 6459 非线性插值0.9615 5800 6500 14MTB >所以中位数95%的置信区间为[5800,6459].一、实验题目为检验两种燃料添加剂对客车每加仑汽油行驶里程数的影响是否不同,随机挑选12辆车,让每一辆车都先后使用这两种添加剂。
12辆车使用这两种添加剂每加仑汽油行驶里程数的检验结果如下:车辆添加剂1 21 22.32 21.252 25.76 23.973 24.23 24.774 21.35 19.265 23.43 23.126 26.97 26.007 18.36 19.408 20.75 17.189 24.07 22.2310 26.43 23.3511 25.41 24.9812 27.22 25.90 试检验:这两种添加剂有没有差异?二、实验步骤H0:两种添加剂无差异H1:两种添加剂有差异1)符号检验法:MTB > Let C3 = C1-C2MTB > SInterval 95.0 C3.符号置信区间: C3中位数的符号置信区间取得的置信区间N 中位数置信度下限上限位置C3 12 1.195 0.8540 0.430 1.840 40.9500 0.342 2.024 非线性插值0.9614 0.310 2.090 32)Wilcoxon符号秩和检验法:MTB > Let C3 = C1-C2MTB > WInterval 95.0 C3.Wilcoxon 符号秩置信区间: C3估计中取得的置信区间N 位数置信度下限上限C3 12 1.23 94.5 0.38 2.073)单样本t检验:MTB > Onet C3.单样本 T: C3平均值变量 N 平均值标准差标准误 95% 置信区间C3 12 1.241 1.355 0.391 (0.380, 2.102)结果分析:综合1、2、3三种方法可以看出,接受原假设,认为两种添加剂无差异。
一、实验题目某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下:牌1:37.5 31.3 33.8 32.5牌2:36.3 32.5 36.3 35.0牌3:40 40 43.8 46.3牌4:36.3 42.5 40 41.3牌5:40 32.5 38.8 33.8这些数据是否说明这5种牌子的汽油每加仑平均行驶的哩数全相等?二、实验步骤检验问题:H:这5种牌子的汽油每加仑平均行驶的哩数全相等H:这5种牌子的汽油每加仑平均行驶的哩数不全相等1在 C1 上的 Kruskal-Wallis 检验C2 N 中位数平均秩 Z1 4 33.15 5.1 -2.032 4 35.65 7.0 -1.323 4 41.90 17.0 2.464 4 40.65 14.6 1.565 4 36.30 8.8 -0.66整体 20 10.5H = 11.82 DF = 4 P = 0.019H = 12.00 DF = 4 P = 0.017(已对结调整)注 * 一个或多个小样本P值小于0.05,拒绝原假设,这5种牌子的汽油每加仑平均行驶的哩数不全相等一、实验题目有四架测量纺织纤维弹性的测量仪器,为检验这些测量仪器之间有没有差异,找了八位质量检验员,要求每一位检验员使用每一架测量仪器对同一批原料进行测量,实验数据如下,这四架测量仪器有没有差异?检验员1 2 3 4 5 6 7 8测量仪器 1 71 73 72 73 75 73 77 75 2 73 75 76 74 78 77 74 743 76 73 79 77 74 75 74 73 4 75 73 73 72 70 71 69 69二、实验步骤Friedman 检验: C1 与 C3,按 C2 区组0H :四架测量仪器没有差别 1H :四架测量仪器有差别S = 8.44 DF = 3 P = 0.038S = 9.12 DF = 3 P = 0.028(已对结调整)C3 N 估计中位数 秩和1 8 73.125 18.52 8 75.125 25.53 8 74.750 24.04 8 71.000 12.0总中位数 = 73.500MTB >P 值小于0.05拒绝原假设一、实验题目某部门有26位女职工和24位男职工。
他们的年收入如下:女职工男职工28500 30650 39700 3370031000 35050 33250 3630022800 35600 31800 3725032350 26900 38200 3395030450 31350 30800 3775038200 28950 32250 3670034100 32900 38050 3610030150 31300 34800 2655033550 31350 32750 3920027350 35700 38800 4100025200 35900 29900 4040032050 35200 37400 3550026550 30450(1)使用MOOD中位数检验法回答问题:收入和性别有没有关系?女职工的收入是否比男职工的收入低?(2)使用Wilcoxon秩和检验法回答上述问题。
二、实验步骤(1)H0:收入与性别之间无关系,女职工的收入不比男职工的收入低H1:收入与性别有关系,女职工的收入比男职工的收入低MTB > Mood C1 C2.Mood 中位数检验: C1 与 C2C1 的 Mood 中位数检验卡方 = 8.01 DF = 1 P = 0.005单组 95.0% 置信区间C2 N<= N> 中位数 Q3-Q1 ---------+---------+---------+-------1 18 8 31325 5500 (---*-------)2 7 17 36200 5288 (----------*-----)---------+---------+---------+-------32500 35000 37500整体中位数 = 33400中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)结果:由于中位数落入0.95置信区间,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低(2)H0:收入与性别之间无关系,女职工的收入不比男职工的收入低H1:收入与性别有关系,女职工的收入比男职工的收入低Mann-Whitney 检验和置信区间: C1, C2N 中位数C1 26 31325C2 24 36200ETA1-ETA2 的点估计为 -4325ETA1-ETA2 的 95.1 置信区间为 (-6400,-2150)W = 478.0在 0.0002 上,ETA1 = ETA2 与 ETA1 < ETA2 的检验结果显著在 0.0002 显著性水平上,检验结果显著(已对结调整)结果:(3)由于 W 为 < 663.0,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低除性别外,还有很多因素例如文化程度、工龄和职位等与职工工资的高低有关,为此考虑男女职工在文化程度、工龄和职位方面有没有差异,该部门的26位女职工和24位男职工的年收入和工龄的数据如下:女性男性工资工龄工资工龄工资工龄工资工龄28500 2 30650 2 39700 16 33700 25 31000 3 35050 16 33250 15 36300 33 22800 0 35600 29 31800 16 37250 19 32350 3 26900 0 38200 32 33950 34 30450 1 31350 2 30800 1 37750 44 38200 21 28950 0 32250 7 36700 14 34100 8 32900 11 38050 33 36100 19 30150 5 31300 11 34800 24 26550 3 33550 18 31350 2 32750 17 39200 19 27350 0 35700 19 38800 21 41000 31 25200 0 35900 15 29900 6 40400 35 32050 4 35200 20 37400 20 35500 23 26550 0 30450 01、男女职工的工龄有没有差异?男职工的工龄是否比女职工长?2、收入与工龄有没有关系?工龄越长,收入是否越高?3、职工的收入究竟与性别有没有关系?H0:收入与性别之间无关系H1:收入与性别有关Mood 中位数检验: C1 与 C3C1 的 Mood 中位数检验卡方 = 8.01 DF = 1 P = 0.005单组 95.0% 置信区间C3 N<= N> 中位数 Q3-Q1 ---------+---------+---------+-------1 18 8 31325 5500 (---*-------)2 7 17 36200 5288 (----------*-----)---------+---------+---------+-------32500 35000 37500整体中位数 = 33400中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)由于中位数(c1-c3)落入0.95置信区间,故拒绝原假设,H0成立,收入与性别之间无关系H0:工龄与性别之间无关系H1:工龄与性别有关Mood 中位数检验: C2 与 C3C2 的 Mood 中位数检验卡方 = 13.48 DF = 1 P = 0.000单组 95.0% 置信区间C3 N<= N> 中位数 Q3-Q1 --------+---------+---------+--------1 20 6 3.0 15.3 (-*-----------)2 6 18 19.5 16.5 (----*--------)--------+---------+---------+--------7.0 14.0 21.0整体中位数 = 15.0中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-22.0,-9.0)由于中位数(c2-c3)落入0.95置信区间,故拒绝原假设,H0成立,工龄与性别之间无关系计算收入与工龄的秩相关系数H0:工龄与收收入相互独立H1:工龄与收入正相关相关: C4, C5C4 和 C5 的 Pearson 相关系数 = 0.855P 值 = 0.000拒绝原假设,H1成立,工龄与收入正相关。