当前位置:文档之家› 第2章统计数据的描述

第2章统计数据的描述

第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。

调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。

解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。

(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C3232D1818E1515合计100100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。

即得到如下的条形图:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。

解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。

(见Excel练习题(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~66022660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033合计100100制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图:(见Excel练习题(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:第5章 参数估计●1.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求允许误差;(3) 如果样本均值为120元,求总体均值95%的置信区间。

解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为x σσ15=(2)已知置信水平1-α=95%,得 α/2Z =,于是,允许误差是E =α/2σZ =×=。

(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =, 这时总体均值的置信区间为±α/2x Z ±=124.2115.8(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x σ=== (2)在95%的置信水平下,求边际误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×=(3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(,)可知,如果样本均值为120元,总体均值95%的置信区间为(,)元。

利用下面的信息,构建总体均值µ的置信区间:1) 总体服从正态分布,且已知σ = 500,n = 15, =8900,置信水平为95%。

解: N=15,为小样本正态分布,但σ已知。

则1-=95%,。

其置信区间公式为∴置信区间为:8900±×500÷√15=( , )2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。

解:为大样本总体非正态分布,但σ已知。

则1-=95%,。

其置信区间公式为∴置信区间为:8900±×500÷√35=( )3) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为90%。

解:为大样本总体非正态分布,且σ未知,1-=90%,。

2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±nz x σαx x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±nz x σαx其置信区间为:8900±×500÷√35=(8761 9039)x4)总体不服从正态分布,σ未知,n = 35,=8900,s =500,置信水平为99%。

解:为大样本总体非正态分布,且σ未知,1-=99%,。

其置信区间为:8900±×500÷√35=()●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。

解:⑴计算样本均值x:将上表数据复制到Excel表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x=,⑵计算样本方差s:删除Excel表中的平均值,点击自动求值→其它函数→STDEV→选定计算数据列→确定→确定,得到s=也可以利用Excel进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:∑2i (x -x )=再对总和除以n-1=35后,求平方根,即为样本方差的值s=。

⑶计算样本均值的抽样标准误差: 已知样本容量 n =36,为大样本, 得样本均值的抽样标准误差为 x σs1.6093⑷分别按三个置信水平计算总体均值的置信区间:① 置信水平为90%时:由双侧正态分布的置信水平1-α=90%,通过2β-1=换算为单侧正态分布的置信水平β=,查单侧正态分布表得 α/2Z =,计算得此时总体均值的置信区间为±α/2sx Z ±×= 3.75652.8769可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(,)小时;② 置信水平为95%时:由双侧正态分布的置信水平1-α=95%,得 α/2Z =,计算得此时总体均值的置信区间为±α/2sx Z ±×= 3.84232.7910可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(,)小时;③ 置信水平为99%时:若双侧正态分布的置信水平1-α=99%,通过2β-1=换算为单侧正态分布的置信水平β=,查单侧正态分布表得 α/2Z =,计算得此时总体均值的置信区间为±α/2sx Z ±×= 4.00872.6247可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(,)小时。

●4.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。

采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。

(1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%; (2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查 解: 已知总体单位数N =500,重复抽样,样本容量n =50,为大样本,样本中,赞成的人数为n 1=32,得到赞成的比率为 p =n 1n =3250=64%(1)赞成比率的抽样标准误差为=%由双侧正态分布的置信水平1-α=95%,得 α/2Z =,计算得此时总体户数中赞成该项改革的户数比率的置信区间为p ±αZ ±×%=77.304%50.696%可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为(%,%)。

(2)如预计赞成的比率能达到80%,即 p =80%,由得样本容量为 n =20.80.2(6.788%)⨯= 取整为35,即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。

5.顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。

为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队等待。

为(1) 构建第一种排队方式等待时间标准差的95%的置信区间 (2) 构建第二种排队方式等待时间标准差的95%的知心区间 (3) 根据(1)和(2)的结果,你认为哪种排队方式更好 卷面解答过程: 解:已知n=10(1) 根据抽样结果计算得x =s=又∵α=,由单方差得总体标准差σ的95%的置信区间为, ;(2) 根据抽样结果计算得x =s=又∵α=,由单方差得总体标准差σ的95%的置信区间为, 。

(3) 根据上面两道题目的答案可知,第一种排队方式所需等待的时间较为稳定,更为可取。

MINITAB 操作步骤:(1) 输入数据→统计→基本统计量→单样本t →选择数据→选项:95%MINITAB 显示: 单样本 T: C1平均值变量 N 平均值 标准差 标准误 95% 置信区间 C1 10 ,(2) 同上6.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:来自总体1的样本 来自总体2的样本141=n 72=n 2.531=x4.432=x8.9621=s0.10222=s(1) 求21μμ-90%的置信区间;(2) 求21μμ-95%的置信区间。

相关主题