当前位置:文档之家› 实验 5区间估计与假设检验

实验 5区间估计与假设检验

实验5 区间估计与假设检验利用样本对总体进行统计推断,主要有两类问题:一类是估计问题,另一类是检验问题。

参数估计是根据样本的统计量来对总体的参数进行估计,假设检验则是利用样本的统计量来检验事先对总体参数或分布特性所作的假设是否正确。

利用SAS软件中的INSIGHT模块和“分析家”功能以及编程的方法,均可以在不同的置信水平下求出总体参数的置信区间,在不同的检验(显著)水平下对总体的参数和分布特性进行检验。

5.1 实验目的掌握使用SAS对总体参数进行区间估计与假设检验方法。

5.2 实验内容一、用INSIGHT对总体参数进行区间估计与假设检验二、用“分析家”对总体参数进行区间估计与假设检验三、编程对总体参数进行区间估计与假设检验5.3 实验指导一、用INSIGHT对总体参数进行区间估计与假设检验【实验5-1】已知某种灯泡的寿命服从正态分布,现从一批灯泡中抽取Array16只,测得其寿命如表5-1(sy5_1.xls)所示:表5-1 某种灯泡的寿命(单位:小时)图5-1 数据集Mylib.sy5_1 1510 1450 1480 1460 1520 1480 1490 14601480 1510 1530 1470 1500 1520 1510 1470求该灯泡平均使用寿命90%、95%及99%的置信区间,并指出置信区间长度与置信水平的关泡寿命。

(1) y (2) 选择菜单“Analyze (分析)”→“Distribu on(Y)”对话框中选定分析变量:sm ,如图5-2左所示。

(3) 单击“Output ”按钮,在打开的对话框(基本置信区间)”复选框,如图5-2右。

两次单击“OK ”系。

假设上述数据已存放于数据集Mylib.sy5_1中,如图5-1所示,变量sm 表示灯实验步骤如下:启动INSIGHT 模块,并打开数据集M lib.sy5_1。

tion(Y)(分布)”。

在打开的“Distributi中选中“Basic Confidence interval 按钮,得到结果,如图5-3所示。

图5-2 区间估计的设置 (Std Dev )、方(信下限(LCL )和置信上限(UCL )。

样样本,灯泡平均使用寿命的置信水平为间为(1476.8034,1503.1966)。

(4) 选择菜单间)”→“Others (其他)”,在打开的“Basic Confiden 5-4所示。

结果包括一个名为“95%Confidence Intervals (95%置信区间)”的列表,表中给出了均值(Mean )、标准差图5-3 95%置信区间 差(Variance )的估计值Estimate )、置结果表明,根据抽95%的置信区“Tables (表)”→“Basic Confidence Interval (基本置信区ce Interval”对话框中修改置信水平,如图水平的提高,置信区间的长度在增加。

脉搏数如表5-2(sy5_2.xls )所示:图5-4 90%、97.5%置信区间 可以看到,由于置信【实验5-2】正常人的脉搏平均每分钟72次,某医生测得10例“四乙基铅中毒”患者的表5-2 “四乙基铅中毒”患者的脉搏数(次/min ) 6870 66 67 65 69 70 54 67 78 已知人的脉搏次数服从正态分布,试问“四乙基铅中毒”患者的脉搏和无显著差异(α = 0.正常人的脉搏有05)?四乙基铅中毒”患者脉搏数的均值,需值进行检验的步骤如下:(2) 在打开的“Di cs ,单击“Y ”按钮,将变量移到右上方的列表框变量的描述性统计量。

(3) 选择菜单“Tables (表)”→“T for Location (位置检验);在弹出的“Tests for Location ”对话框中输入72,单击“OK 结果,如图5-6所示。

这是一个单样本均值的双边检验问题。

若µ为“要通过样本数据检验如下假设: H 0:µ =72,H 1:µ ≠ 72。

图5-5 数据集Mylib.sy5_2 假定上述数据存放在数据集Mylib.sy5_2中,如图5-5所示,脉搏次数用变量cs 表示。

使用INSIGHT 对均(1) 首先启动INSIGHT ,并打开数据集Mylib.sy5_2,选择菜单“Analyze(分析)”→“Distribution(Y)(分布)”。

stribution(Y)”对话框中选定分析变量:选择变量中。

单击“OK ”按钮,得到ests ””按钮得到输出图5-6 位置检验 结果显示,不等于72的观测有10个,其中有1个观测值大于72。

图中第一个检验为t 检验(Student's t),需要假定变量服从正态分布,检验的p 值为0.0366,这个检验在0.05水平下是显著的,可认为均值与72有显著差异。

第二个检验(Sign)是叫做符验(Sgned Rank)是叫做符号秩检验的非参数检验,其p 值为0.0410,在0.05水平下也是显著的。

可认为“四乙基铅中毒”患者的脉搏和正常人的脉搏有显著差异。

本比例检验)”。

(2) 在打开的“One Sample Test for a Proportion ”对话框中选择变量sex ,单击“Variable ”,将其移到“Variable ”中,单击“Level of Interest ”下拉框右侧的下拉箭头,选“female ”,如号检验的非参数检验,其p 值为0.0215,在0.05水平下是显著的,第三个检由于这三个检验的结论中的p 值均小于0.05,所以应拒绝原假设,即总体的均值与72有显著差异。

因此,二、用“分析家”对总体参数进行区间估计与假设检验【实验5-3】用数据集SASUSER.GPA ,求总体中女生比例的95%的置信区间(α = 0.05)。

步骤如下:(1) 在“分析家”中打开数据集SASUSER.GPA ,选择菜单“Statistics (统计)”→“Hypothesis Tests (假设检验)”→“One Sample Test for a Proportion (单样图 5-7右所示。

两次单击“OK ”按钮,得到结果,如图5-7左所示。

(3) 单击“Intervals ”按钮,在打开的对话框中选定置信估计类型和置信水平,如图5-8所示。

图5-7 设置比例的置信 结果显示:变量sex 取值为“female ”的比例的95【实验5-4】生产工序的方差是工序质量的一个重要度量。

当方差较大时需要对工序进行改区间 %置信区间为(0.585,0.710)。

进以减小方差,现测得两部机器生产(sy xls )所示,设两个总体为正态总体,求两个总体方差比的95%的置信区间(α = 0.01)。

表5-3 机器生产的量(单位:2 的部分袋茶重量如表5-35_4. 两部袋茶重克)机器1 机器3.45 3.22 3.90 3.22 3.28 3.353.20 2.98 3.70 3.38 2.19 3.303.22 3.75 3.28 3.30 3.29 3.053.50 3.38 3.35 3.30 3.20 3.33图5-8 比例的置信区间 2.95 3.45 3.20 3.34 3.35 3.273.16 3.48 3.12 3.28 3.16 3.283.20 3.18 3.25 3.30 3.34 3.25 步骤如下:(1) 首先,将表中的数据生成数据集mylib.sy5_4,如图5-9所jq2表示。

选择菜单“StatisticsSample Test forst for Variance ””选项,并将”框中;如图5-10中选定置信估计类示,两部机器生产的袋茶重量分别用两个变量jq1和 (2) 在分析家中打开数据集mylib.sy5_4后,(统计)”→“Hypothesis Tests (假设检验)”→“Two-Variance (双样本方差检验)”,打开“Two-Sample Te 对话框。

(3) 在“Groups are in ”栏中选择“Two variables 变量jq1和jq2分别移至“Group1”和“Group2左所示。

(4) 单击“Intervals ”按钮,在打开的对话框型和置信水平,如图5-10右所示。

得到分两次单击“OK ”按钮,析结果,如图5-11所示。

图5-10 设置方差比检验 测得16只元件的寿命如表5-4图5-9 数据集Mylib.sy5_4 图5-11 双样本方差比的置信区间结果显示,在95%的置信水平下,两个总体方差比的置信区间为(0.3827,2.3244)。

【实验5-5】某种电子元件的寿命(以小时记)服从正态分布。

现(sy5_5.xls )所示: 表5-4 某种电子元件的寿命 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命显著地大于225小时(α = 0.05)?这是一个单样本均值的单边检验问题。

若µ为元件的平均寿命,需要,灯泡寿命用变量sm 表,选择菜单“Statistics通过样本数据检验如下假设:H 0:µ >= 225,H 1:µ < 225。

由于此时的方差未知,所以使用t 检验法。

假定上述数据存放在数据集mylib.sy5_5中示,如图5-12所示。

步骤如下:(1) 在“分析家”中打开数据集mylib.sy5_5(统计)”→“Hypothesis Tests (假设检验)”→“ne Sample t – test for aMean (单样本均值t - 检验)”,打开 for a Mean ”对话框到“Variable ”框中,单击选项按钮“Mean<”,在假设框“Mean>=”右设的均值数据225,如图5-13左所示。

击“”按,得到结果如-1示拒绝平均寿命大O “One Sample t – test 。

(2) 选中变量“sm ”,单击“Variable ”按钮,将其移边的文本框中填入原假(3) 单OK 钮图53右所。

结果显示t 统计量的p 值为0.743>0.05,所以在0.05的显著水平下,不能于225小时的原假设。

图5-13 设置均值检验 【实验5-6】有若干人参加了一个减肥锻炼,在一年后测量了他们的身脂肪含量的百分数),结果如表5-5(sy5_6.xls )所示:体脂肪含量(身体表5-5 男女生脂肪含量 男生组:13.3 19 20 8 18 2220 31 21 12 16 12 24 女生组: 22 26 16 12 21.7 23.2 21 28 30 23试比较这些人中男性和女性的身体脂肪含量有无显著差异(α = 0.05)。

相关主题