第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT 从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据合计100 100 (2)条形图如下:(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 6881.以组距为10进行分组,整理成频数分布表。
2.根据分组数据绘制直方图,说明数据分布的特点。
3.制作茎叶图,并与直方图作比较。
详细答案:(1)频数分布表如下:100只灯泡使用寿命的频数分按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下及格9 8不及格 4 2(1)根据上面的数据,画出两个班考试成绩的环形图,比较它们的构成。
(2)画出雷达图,比较两个班考试成绩的分布是否相似。
详细答案:(1)环形图如下:(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
从雷达图的形状看,两个班考试成绩的分布没有相似之处。
2.4 下面是我国10个城市2006年各月份的气温数据:从箱线图可以看出,10个城市中气温变化最小的是昆明,最大的是沈阳。
从中位数来看,多数靠近上四分位数,说明多数城市的气温分布都有一定的左偏。
第3章用统计量描述数据3.1 随机抽取25个网络用户,得到他们的年19152925242321382218302019191623272234244120311723龄数据如下(单位:周岁):计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。
详细答案:网民年龄的描述统计量如下:从集中度来看,网民平均年龄为24岁,中位数为23岁。
从离散度来看,标准差在为6.65岁,极差达到26岁,说明离散程度较大。
从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。
3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。
一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)计算第二种排队时间的平均数和标准差。
(2)比两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
详细答案:(1)(岁);(岁)。
(2);。
第一中排队方式的离散程度大。
(3)选方法二,因为平均等待时间短,且离散程度小。
3.3 在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元)企业数(个)300以下19300~40030400~50042500~60018600以上11合计120计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
详细答案:=426.67(万元);(万元)。
3.4 一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?详细答案:通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.5 一种产品需要人工组装,现有3种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。
下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C1641291251671301261681291261651301271701311261651301281641291271681271261641281271621281271.你准备用哪些统计量来评价组装方法的优劣?2.如果让你选择一种方法,你会做出怎样的选择?试说明理由。
详细答案:3种方法的主要描述统计量如下:(1)从集中度、离散度和分布的形状三个角度的统计量来评价。
从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程度都不大,方法C则较大。
(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小。
第4章概率分布4.1 消费者协会经过调查发现,某品牌空调器有重要缺陷的产品数出现的概率分布如下:X012345678910P0.0410.1300.2090.2230.1780.1140.0610.0280.0110.0040.001根据这些数值,分别计算:(1)有2到5个(包括2个与5个在内)空调器出现重要缺陷的概率。
(2)只有不到2个空调器出现重要缺陷的概率。
(3)有超过5个空调器出现重要缺陷的概率。
详细答案:(1)0.724。
(2)0.171。
(3)0.105。
4.2 设是参数为和的二项随机变量。
求以下概率:(1);(2)。
详细答案:(1)0.375。
(2)0.6875。
4.3 求标准正态分布的概率:(1);(2);(3)。
详细答案:(1)0.3849。
(2)0.1844。
(3)0.0918。
4.4 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据如下(单位:公升)9.1910.019.609.279.788.829.638.8210.508.839.358.6510.109.4310.129.399.548.519.7010.039.499.489.369.1410.099.859.379.649.689.75绘制正态概率图,判断该种汽车的耗油量是否近似服从正态分布?详细答案:正态概率图如下:由正态概率图可以看出,汽车耗油量基本服从正态分布。
4.5 从均值为200、标准差为50的总体中,抽取的简单随机样本,用样本均值估计总体均值。
(1)的期望值是多少?(2)的标准差是多少?(3)的概率分布是什么?详细答案:(1)200。
(2)5。
(3)近似正态分布。
4.6 从的总体中,抽取一个容量为500的简单随机样本。
(1)的期望值是多少?(2)的标准差是多少?(3)的分布是什么?详细答案:(1)0.4。
(2)0.0219 。
(3)近似正态分布。
4.7 假设一个总体共有8个数值,54,55,59,63,64,68,69,70。
从该总体中按重复抽样方式抽取的随机样本。
(1)计算出总体的均值和方差。
(2)一共有多少个可能的样本?(3)抽出所有可能的样本,并计算出每个样本的均值。
(4)画出样本均值的正态概率图,判断样本均值是否服从正态分布?(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?详细答案:(1),。
(2)共有64个样本。
(3)所有样本的样本均值如下:54.556.558.559.061.061.562.054.054.555.057.059.059.561.562.062.556.557.059.061.061.563.564.064.558.559.061.063.063.565.566.066.559.059.561.563.564.066.066.567.061.061.563.565.566.068.068.069.061.562.064.066.066.568.569.069.562.062.564.566.567.069.069.570.0(4)样本均值的正态概率图如下:从正态概率图可以看出,样本均值近似服从正态分布。
(5),。
样本均值的平均数等于总体平均数,样本均值的标准差等于总体标准差的。
第5章参数估计5.1 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。