实验报告( 2012 / 2013学年第一学期)课程名称非参数统计实验名称1、数据的描述性统计2、中心位置的检验问题3、多样本问题和区组设计问题的比较4、相关分析实验时间2012年 10月15-22日学生姓名班级学号学院(系)通达学院专业统计学实验一一、实验题目某航空公司为了解旅客对公司服务态度的满意程度,对50名旅客作调查,要求他们写出对乘机服务、机上服务和到达机场服务的满意程度,满意程度评分从0到100.分数越大,满意程度越高。
下表是收集到得数据。
50名旅客对乘机服务、机上服务和到达机场服务的满意程度的评分1、对50名旅客关于乘机服务的满意程度数据作描述性统计分析;2、对50名旅客关于机上服务的满意程度数据作描述性统计分析;3、对50名旅客关于到达机场服务的满意程度数据作描述性统计分析;4、对50名旅客关于这三个方面服务的满意程度数据作一个综合比较的描述性统计分析。
二、实验步骤1、乘机服务1)、直方图2)、箱线图3)、数值分析2、机上服务1)、直方图机上服务满意程度评分直方图141210864225-3031-3536-4041-4546-5051-5556-6061-6566-7071-7576-8081-8586-90 2)、箱线图C1 的箱线图908070601C504030203)、数值分析3、到达机场服务1)、直方图2)、箱线图3)、数值分析5、综合比较C3C2C1100908070605040302010数据C1, C2, C3 的箱线图实验二一、实验题目某地区从事管理工作的职员的月收入的中位数是6500元,现有一个该地区从事管理工作的40个妇女组成的样本,她们的月收入数据如此下:5100 6300 4900 71004900 5200 6600 72006900 5500 5800 64003900 5100 7500 63006000 6700 6000 48007200 6200 7100 69007300 6600 6300 68006200 5500 6300 5400 4800(1)使用样本数据检验:该地区从事管理工作的妇女的月收入的中位数是否低于6500元?(2)使用样本数据给出该地区从事管理工作的妇女的月收入的中位数的点估计和95%的区间估计。
二、实验步骤H0:中位数等于6500元 H1:中位数低于6500元中位数的符号检验: C1中位数 = 6500 与 < 6500 的符号检验N 下方相等上方 P 中位数C1 40 26 1 13 0.0266 6200MTB >P=0.05>0.0266,所以拒绝原假设,认为中为数低于6500.符号置信区间: C1中位数的符号置信区间取得的置信区间N 中位数置信度下限上限位置C1 40 6200 0.9193 5800 6400 150.9500 5800 6459 非线性插值0.9615 5800 6500 14MTB >所以中位数95%的置信区间为[5800,6459].实验三一、实验题目为检验两种燃料添加剂对客车每加仑汽油行驶里程数的影响是否不同,随机挑选12辆车,让每一辆车都先后使用这两种添加剂。
12辆车使用这两种添加剂每加仑汽油行驶里程数的检验结果如下:试检验:这两种添加剂有没有差异?二、实验步骤H0:两种添加剂无差异 H1:两种添加剂有差异1)符号检验法:MTB > Let C3 = C1-C2MTB > SInterval 95.0 C3.符号置信区间: C3中位数的符号置信区间取得的置信区间N 中位数置信度下限上限位置C3 12 1.195 0.8540 0.430 1.840 4 0.9500 0.342 2.024 非线性插值 0.9614 0.310 2.090 32)Wilcoxon符号秩和检验法:MTB > Let C3 = C1-C2MTB > WInterval 95.0 C3.Wilcoxon 符号秩置信区间: C3估计中取得的置信区间N 位数置信度下限上限C3 12 1.23 94.5 0.38 2.073)单样本t检验:MTB > Onet C3.单样本 T: C3平均值变量 N 平均值标准差标准误 95% 置信区间C3 12 1.241 1.355 0.391 (0.380, 2.102)结果分析:综合1、2、3三种方法可以看出,接受原假设,认为两种添加剂无差异。
实验四一、实验题目某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下:牌1:37.5 31.3 33.8 32.5牌2:36.3 32.5 36.3 35.0牌3:40 40 43.8 46.3牌4:36.3 42.5 40 41.3牌5:40 32.5 38.8 33.8这些数据是否说明这5种牌子的汽油每加仑平均行驶的哩数全相等?二、实验步骤检验问题:H:这5种牌子的汽油每加仑平均行驶的哩数全相等0H:这5种牌子的汽油每加仑平均行驶的哩数不全相等1在 C1 上的 Kruskal-Wallis 检验C2 N 中位数平均秩 Z1 4 33.15 5.1 -2.032 4 35.65 7.0 -1.323 4 41.90 17.0 2.464 4 40.65 14.6 1.565 4 36.30 8.8 -0.66整体 20 10.5H = 11.82 DF = 4 P = 0.019H = 12.00 DF = 4 P = 0.017(已对结调整)注 * 一个或多个小样本P值小于0.05,拒绝原假设,这5种牌子的汽油每加仑平均行驶的哩数不全相等实验五一、实验题目有四架测量纺织纤维弹性的测量仪器,为检验这些测量仪器之间有没有差异,找了八位质量检验员,要求每一位检验员使用每一架测量仪器对同一批原料进行测量,实验数据如下,这四架测量仪器有没有差异?检验员12345678测量仪器17173727375737775 27375767478777474 37673797774757473 47573737270716969二、实验步骤Friedman 检验: C1 与 C3,按 C2 区组H:四架测量仪器没有差别1H:四架测量仪器有差别0S = 8.44 DF = 3 P = 0.038S = 9.12 DF = 3 P = 0.028(已对结调整)C3 N 估计中位数秩和1 8 73.125 18.52 8 75.125 25.53 8 74.750 24.04 8 71.000 12.0总中位数 = 73.500MTB >P值小于0.05拒绝原假设实验六一、实验题目某部门有26位女职工和24位男职工。
他们的年收入如下:(1)使用MOOD中位数检验法回答问题:收入和性别有没有关系?女职工的收入是否比男职工的收入低?(2)使用Wilcoxon秩和检验法回答上述问题。
二、实验步骤(1)H0:收入与性别之间无关系,女职工的收入不比男职工的收入低H1:收入与性别有关系,女职工的收入比男职工的收入低MTB > Mood C1 C2.Mood 中位数检验: C1 与 C2C1 的 Mood 中位数检验卡方 = 8.01 DF = 1 P = 0.005单组 95.0% 置信区间C2 N<= N> 中位数Q3-Q1 ---------+---------+---------+-------1 18 8 31325 5500 (---*-------)2 7 17 36200 5288 (----------*-----)---------+---------+---------+-------32500 35000 37500整体中位数 = 33400中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)结果:由于中位数落入0.95置信区间,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低(2)H0:收入与性别之间无关系,女职工的收入不比男职工的收入低H1:收入与性别有关系,女职工的收入比男职工的收入低Mann-Whitney 检验和置信区间: C1, C2N 中位数C1 26 31325C2 24 36200ETA1-ETA2 的点估计为 -4325ETA1-ETA2 的 95.1 置信区间为 (-6400,-2150)W = 478.0在 0.0002 上,ETA1 = ETA2 与 ETA1 < ETA2 的检验结果显著在 0.0002 显著性水平上,检验结果显著(已对结调整)结果:(3)由于 W 为 < 663.0,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低除性别外,还有很多因素例如文化程度、工龄和职位等与职工工资的高低有关,为此考虑男女职工在文化程度、工龄和职位方面有没有差异,该部门的26位女职工和24位男职工的年收入和工龄的数据如下:1、男女职工的工龄有没有差异?男职工的工龄是否比女职工长?2、收入与工龄有没有关系?工龄越长,收入是否越高?3、职工的收入究竟与性别有没有关系?H0:收入与性别之间无关系 H1:收入与性别有关Mood 中位数检验: C1 与 C3C1 的 Mood 中位数检验卡方 = 8.01 DF = 1 P = 0.005单组 95.0% 置信区间C3 N<= N> 中位数 Q3-Q1---------+---------+---------+-------1 18 8 31325 5500 (---*-------)2 7 17 36200 5288 (----------*-----)---------+---------+---------+-------32500 35000 37500整体中位数 = 33400中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)由于中位数(c1-c3)落入0.95置信区间,故拒绝原假设,H0成立,收入与性别之间无关系H0:工龄与性别之间无关系 H1:工龄与性别有关Mood 中位数检验: C2 与 C3C2 的 Mood 中位数检验卡方 = 13.48 DF = 1 P = 0.000单组 95.0% 置信区间C3 N<= N> 中位数 Q3-Q1--------+---------+---------+--------1 20 6 3.0 15.3 (-*-----------)2 6 18 19.5 16.5(----*--------)--------+---------+---------+--------7.0 14.0 21.0整体中位数 = 15.0中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-22.0,-9.0)由于中位数(c2-c3)落入0.95置信区间,故拒绝原假设,H0成立,工龄与性别之间无关系计算收入与工龄的秩相关系数H0:工龄与收收入相互独立 H1:工龄与收入正相关相关: C4, C5C4 和 C5 的 Pearson 相关系数 = 0.855P 值 = 0.000拒绝原假设,H1成立,工龄与收入正相关。