第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26 700 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 18720 1 2 2 5 6 7 8 9 9 1073 3 5 6 374 1 4 7 3茎叶图与直方图所反映的数据分布是一致的,不同的是茎叶图中保留了原始数据。
2.3 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:人数考试成绩甲班乙班优 3 6良 6 15中18 9及格9 8不及格 4 2(1)根据上面的数据,画出两个班考试成绩的环形图,比较它们的构成。
(2)画出雷达图,比较两个班考试成绩的分布是否相似。
详细答案:(1)环形图如下:(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
从雷达图的形状看,两个班考试成绩的分布没有相似之处。
2.4 下面是我国10个城市2006年各月份的气温数据:月份北京沈阳上海南昌郑州武汉广州海口重庆昆明1月-1.9 -12.7 5.7 6.6 0.3 4.2 15.8 18.5 7.8 10.82月-0.9 -8.1 5.6 6.5 3.9 5.8 17.3 20.5 9.0 13.23月8.0 0.5 11.1 12.7 11.5 12.8 17.9 21.8 13.3 15.94月13.5 8.0 16.6 19.3 17.1 19.0 23.6 26.7 19.2 18.05月20.4 18.3 20.8 22.7 21.8 23.9 25.3 28.3 22.9 18.06月25.9 21.6 25.6 26.0 27.8 28.4 27.8 29.4 25.4 20.47月25.9 24.2 29.4 30.0 27.1 30.2 29.8 30.0 31.0 21.38月26.4 24.3 30.2 30.0 26.1 29.7 29.4 28.5 32.4 20.69月21.8 17.5 23.9 24.3 21.2 24.0 27.0 27.4 24.8 18.310月16.1 11.6 22.1 22.1 19.0 21.0 26.4 27.1 20.6 16.911月 6.7 0.8 15.7 15.0 10.8 14.0 21.9 25.3 14.6 13.2绘制各城市月气温的箱线图,并比较各城市气温分布的特点。
详细答案:箱线图如下:从箱线图可以看出,10个城市中气温变化最小的是昆明,最大的是沈阳。
从中位数来看,多数靠近上四分位数,说明多数城市的气温分布都有一定的左偏。
第3章用统计量描述数据3.1 随机抽取25个网络用户,得到他们的年19152925242321382218302019191623272234244120311723龄数据如下(单位:周岁):计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。
详细答案:网民年龄的描述统计量如下:从集中度来看,网民平均年龄为24岁,中位数为23岁。
从离散度来看,标准差在为6.65岁,极差达到26岁,说明离散程度较大。
从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。
3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。
一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)计算第二种排队时间的平均数和标准差。
(2)比两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
详细答案:(1)(岁);(岁)。
(2);。
第一中排队方式的离散程度大。
(3)选方法二,因为平均等待时间短,且离散程度小。
3.3 在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元)企业数(个)300以下19300~40030400~50042500~60018600以上11合计120计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
详细答案:=426.67(万元);(万元)。
3.4 一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?详细答案:通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.5 一种产品需要人工组装,现有3种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。
下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C1641291251671301261681291261651301271701311261651301281641291271681271261641281271621281271631271251661281261.你准备用哪些统计量来评价组装方法的优劣?2.如果让你选择一种方法,你会做出怎样的选择?试说明理由。
详细答案:评价。
从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程度都不大,方法C则较大。
(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小。
第4章概率分布4.1 消费者协会经过调查发现,某品牌空调器有重要缺陷的产品数出现的概率分布如下:X012345678910P0.0410.1300.2090.2230.1780.1140.0610.0280.0110.0040.001根据这些数值,分别计算:(1)有2到5个(包括2个与5个在内)空调器出现重要缺陷的概率。
(2)只有不到2个空调器出现重要缺陷的概率。
(3)有超过5个空调器出现重要缺陷的概率。
详细答案:(1)0.724。
(2)0.171。
(3)0.105。
4.2 设是参数为和的二项随机变量。
求以下概率:(1);(2)。
详细答案:(1)0.375。
(2)0.6875。
4.3 求标准正态分布的概率:(1);(2);(3)。
详细答案:(1)0.3849。
(2)0.1844。
(3)0.0918。
4.4 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据如下(单位:公升)9.1910.019.609.279.788.829.638.8210.508.839.358.6510.109.4310.129.399.548.519.7010.039.499.489.369.1410.099.859.379.649.689.75绘制正态概率图,判断该种汽车的耗油量是否近似服从正态分布?详细答案:正态概率图如下:由正态概率图可以看出,汽车耗油量基本服从正态分布。
4.5 从均值为200、标准差为50的总体中,抽取的简单随机样本,用样本均值估计总体均值。
(1)的期望值是多少?(2)的标准差是多少?(3)的概率分布是什么?详细答案:(1)200。
(2)5。
(3)近似正态分布。
4.6 从的总体中,抽取一个容量为500的简单随机样本。
(1)的期望值是多少?(2)的标准差是多少?(3)的分布是什么?详细答案:(1)0.4。
(2)0.0219 。
(3)近似正态分布。
4.7 假设一个总体共有8个数值,54,55,59,63,64,68,69,70。
从该总体中按重复抽样方式抽取的随机样本。
(1)计算出总体的均值和方差。
(2)一共有多少个可能的样本?(3)抽出所有可能的样本,并计算出每个样本的均值。
(4)画出样本均值的正态概率图,判断样本均值是否服从正态分布?(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?详细答案:(1),。
(2)共有64个样本。
(3)所有样本的样本均值如下:54.556.558.559.061.061.562.054.054.555.057.059.059.561.562.062.556.557.059.061.061.563.564.064.558.559.061.063.063.565.566.066.561.562.064.066.066.568.569.069.562.062.564.566.567.069.069.570.0(4)样本均值的正态概率图如下:从正态概率图可以看出,样本均值近似服从正态分布。