当前位置：文档之家› 第2章统计数据的描述

第2章统计数据的描述

第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量，随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为：A.好；B.较好；C.一般；D.差；E.较差。

调查结果如下：B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型；(2)用Excel制作一张频数分布表；(3) 绘制一张条形图，反映评价等级的分布。

解：（1）由于表中的数据为服务质量的等级，可以进行优劣等级比较，但不能计算差异大小，属于顺序数据。

（2）频数分布表如下：服务质量等级评价的频数分布服务质量等级家庭数（频数）频率%A1414B2121C3232D1818E1515合计100100（3）条形图的制作：将上表(包含总标题，去掉合计栏)复制到Excel表中，点击：图表向导→条形图→选择子图表类型→完成(见Excel练习题。

即得到如下的条形图：700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序；(2)以组距为10进行等距分组，整理成频数分布表，并绘制直方图；(3)绘制茎叶图，并与直方图作比较。

解：（1）排序：将全部数据复制到Excel中，并移动到同一列，点击：数据→排序→确定，即完成数据排序的工作。

(见Excel练习题（2）按题目要求，利用已排序的Excel表数据进行分组及统计，得到频数分布表如下：(见Excel练习题100只灯泡使用寿命非频数分布按使用寿命分组（小时）灯泡个数（只）频率（%）650~66022660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033合计100100制作直方图：将上表(包含总标题，去掉合计栏)复制到Excel表中，选择全表后，点击：图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图：(见Excel练习题（3）制作茎叶图：以十位以上数作为茎，填入表格的首列，将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中，即成为叶，得到茎叶图如下：第5章参数估计●1.某快餐店想要估计每位顾客午餐的平均花费金额，在为期3周的时间里选取49名顾客组成了一个简单随机样本。

（1）假定总体标准差为15元，求样本均值的抽样标准误差；（2）在95%的置信水平下，求允许误差；（3）如果样本均值为120元，求总体均值95%的置信区间。

解：（1）已假定总体标准差为σ=15元，则样本均值的抽样标准误差为x σσ15=（2）已知置信水平1－α=95%，得 α/2Z =，于是，允许误差是E =α/2σZ =×=。

（3）已知样本均值为x =120元，置信水平1－α=95%，得 α/2Z =，这时总体均值的置信区间为±α/2x Z ±=124.2115.8(1)假定总体标准差为15元，求样本均值的抽样标准误差。

x σ=== (2)在95％的置信水平下，求边际误差。

x x t σ∆=⋅，由于是大样本抽样，因此样本均值服从正态分布，因此概率度t=2z α因此，x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×=(3)如果样本均值为120元，求总体均值的95％的置信区间。

置信区间为：(),x x x x -∆+∆=()120 4.2,120 4.2-+=（，）可知，如果样本均值为120元，总体均值95%的置信区间为（，）元。

利用下面的信息，构建总体均值µ的置信区间：1）总体服从正态分布，且已知σ = 500，n = 15， =8900，置信水平为95%。

解： N=15，为小样本正态分布，但σ已知。

则1-＝95%，。

其置信区间公式为∴置信区间为：8900±×500÷√15=（ , ）2）总体不服从正态分布，且已知σ = 500，n = 35， =8900，置信水平为95%。

解：为大样本总体非正态分布，但σ已知。

则1-＝95%，。

其置信区间公式为∴置信区间为：8900±×500÷√35=（）3）总体不服从正态分布，σ未知，n = 35， =8900，s =500，置信水平为90%。

解：为大样本总体非正态分布，且σ未知，1-＝90%，。

2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±nz x σαx x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±nz x σαx其置信区间为：8900±×500÷√35=（8761 9039）x4）总体不服从正态分布，σ未知，n = 35，=8900，s =500，置信水平为99%。

解：为大样本总体非正态分布，且σ未知，1-＝99%，。

其置信区间为：8900±×500÷√35=（）●3.某大学为了解学生每天上网的时间，在全校7500名学生中采取不重复抽样方法随机抽取36人，调查他们每天上网的时间，得到下面的数据（单位：小时）：求该校大学生平均上网时间的置信区间，置信水平分别为90%、95%和99%。

解：⑴计算样本均值x：将上表数据复制到Excel表中，并整理成一列，点击最后数据下面空格，选择自动求平均值，回车，得到x=，⑵计算样本方差s：删除Excel表中的平均值，点击自动求值→其它函数→STDEV→选定计算数据列→确定→确定，得到s=也可以利用Excel进行列表计算：选定整理成一列的第一行数据的邻列的单元格，输入“＝^2”，回车，即得到各数据的离差平方，在最下行求总和，得到：∑2i （x -x ）=再对总和除以n-1=35后，求平方根，即为样本方差的值s=。

⑶计算样本均值的抽样标准误差：已知样本容量 n =36，为大样本，得样本均值的抽样标准误差为 x σs1.6093⑷分别按三个置信水平计算总体均值的置信区间：① 置信水平为90%时：由双侧正态分布的置信水平1－α=90%，通过2β－1=换算为单侧正态分布的置信水平β=，查单侧正态分布表得 α/2Z =，计算得此时总体均值的置信区间为±α/2sx Z ±×= 3.75652.8769可知，当置信水平为90%时，该校大学生平均上网时间的置信区间为（，）小时；② 置信水平为95%时：由双侧正态分布的置信水平1－α=95%，得 α/2Z =，计算得此时总体均值的置信区间为±α/2sx Z ±×= 3.84232.7910可知，当置信水平为95%时，该校大学生平均上网时间的置信区间为（，）小时；③ 置信水平为99%时：若双侧正态分布的置信水平1－α=99%，通过2β－1=换算为单侧正态分布的置信水平β=，查单侧正态分布表得 α/2Z =，计算得此时总体均值的置信区间为±α/2sx Z ±×= 4.00872.6247可知，当置信水平为99%时，该校大学生平均上网时间的置信区间为（，）小时。

●4.某居民小区共有居民500户，小区管理者准备采取一项新的供水设施，想了解居民是否赞成。

采取重复抽样方法随机抽取了50户，其中有32户赞成，18户反对。

（1）求总体中赞成该项改革的户数比率的置信区间，置信水平为95%；（2）如果小区管理者预计赞成的比率能达到80%，应抽取多少户进行调查解：已知总体单位数N =500，重复抽样，样本容量n =50，为大样本，样本中，赞成的人数为n 1=32，得到赞成的比率为 p =n 1n =3250=64%（1）赞成比率的抽样标准误差为=%由双侧正态分布的置信水平1－α=95%，得 α/2Z =，计算得此时总体户数中赞成该项改革的户数比率的置信区间为p ±αZ ±×%=77.304%50.696%可知，置信水平为95%时，总体中赞成该项改革的户数比率的置信区间为（%,%）。

（2）如预计赞成的比率能达到80%，即 p =80%，由得样本容量为 n =20.80.2(6.788%)⨯= 取整为35，即可得，如果小区管理者预计赞成的比率能达到80%，应抽取35户进行调查。

5.顾客到银行办理业务时往往需要等待一段时间，而等待时间的长短与许多因素有关，比如，银行业务员办理业务的速度，顾客等待排队的方式等。

为此，某银行准备采取两种排队方式进行试验，第一种排队方式是：所有顾客都进入一个等待队列；第二种排队方式是：顾客在三个业务窗口处列队等待。

为（1）构建第一种排队方式等待时间标准差的95%的置信区间（2）构建第二种排队方式等待时间标准差的95%的知心区间（3）根据（1）和（2）的结果，你认为哪种排队方式更好卷面解答过程：解：已知n=10（1）根据抽样结果计算得x =s=又∵α=，由单方差得总体标准差σ的95%的置信区间为, ；（2）根据抽样结果计算得x =s=又∵α=，由单方差得总体标准差σ的95%的置信区间为, 。

（3）根据上面两道题目的答案可知，第一种排队方式所需等待的时间较为稳定，更为可取。

MINITAB 操作步骤：（1）输入数据→统计→基本统计量→单样本t →选择数据→选项：95%MINITAB 显示：单样本 T: C1平均值变量 N 平均值标准差标准误 95% 置信区间 C1 10 ,（2）同上6.从两个正态总体中分别抽取两个独立的随机样本，它们的均值和标准差如下表：来自总体1的样本来自总体2的样本141=n 72=n 2.531=x4.432=x8.9621=s0.10222=s（1）求21μμ-90%的置信区间；（2）求21μμ-95%的置信区间。

e商务文档

第2章统计数据的描述

相关文档推荐：