第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C3232D1818E 15 15 合计100100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel 表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel 练习题2.1)。
即得到如下的条形图:2040A B C D E 服务质量等级评价的频数分布 频率%服务质量等级评价的频数分布 家庭数(频数)●2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693697664681721720 677 679 695 691 713 699 725 726 704 729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。
解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。
(见Excel练习题2.4) (2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题2.4)100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题2.4)51015202530650~660670~680690~700710~720730~740100只灯泡使用寿命非频数分布灯泡个数100只灯泡使用寿命非频数分布频率(%)(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 将直方图与茎叶图对比,可见两图十分相似。
第5章 参数估计●1.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求允许误差;(3) 如果样本均值为120元,求总体均值95%的置信区间。
解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σ=nσ=4915=2.1429(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =nα/2σZ =1.96×2.1429=4.2000。
(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 n±α/2σx Z =120±4.2=124.2115.8(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x nσσ=1549==2.143 (2)在95%的置信水平下,求边际误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2)可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
5.2利用下面的信息,构建总体均值µ的置信区间:1) 总体服从正态分布,且已知σ = 500,n = 15,=8900,置信水平为95%。
解: N=15,为小样本正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2) 2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。
解:为大样本总体非正态分布,但σ已知。
则1-α=95%,。
其置信区间公式为∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1) 3) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为90%。
解:为大样本总体非正态分布,且σ未知,1-α=90%, 1.65。
2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±nz x σαx x x x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯±=±nz x σαx x其置信区间为: 8900±1.65×500÷√35=(8761 9039)4) 总体不服从正态分布,σ未知,n = 35,=8900,s =500,置信水平为99%。
解:为大样本总体非正态分布,且σ未知,1- =99%,2.58。
其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.3 3.1 6.2 5.8 2.34.15.4 4.5 3.2 4.4 2.0 5.4 2.66.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
解:⑴计算样本均值x :将上表数据复制到Excel 表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x =3.316667, ⑵计算样本方差s :删除Excel 表中的平均值,点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定,得到s=1.6093也可以利用Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:x x∑2i (x -x )=90.65再对总和除以n-1=35后,求平方根,即为样本方差的值s=1n -∑2i(x -x )=90.6535=1.6093。
⑶计算样本均值的抽样标准误差: 已知样本容量 n =36,为大样本, 得样本均值的抽样标准误差为 x σ=ns =361.6093=0.2682⑷分别按三个置信水平计算总体均值的置信区间:① 置信水平为90%时:由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64,计算得此时总体均值的置信区间为n±α/2sx Z =3.3167±1.64×0.2682= 3.75652.8769可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时;② 置信水平为95%时:由双侧正态分布的置信水平1-α=95%,得 α/2Z =1.96,计算得此时总体均值的置信区间为n±α/2sx Z =3.3167±1.96×0.2682= 3.84232.7910可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时;③ 置信水平为99%时:若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态分布的置信水平β=0.995,查单侧正态分布表得 α/2Z =2.58,计算得此时总体均值的置信区间为n±α/2sx Z =3.3167±2.58×0.2682= 4.00872.6247可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(2.62,4.01)小时。