当前位置：文档之家› 统计学课后题答案(袁卫庞皓曾五一贾俊平)

统计学课后题答案(袁卫庞皓曾五一贾俊平)

第1章绪论5.简要说明抽样误差和非抽样误差。

答：统计调查误差可分为非抽样误差和抽样误差。

非抽样误差是由于调查过程中各环节工作失误造成的，从理论上看，这类误差是可以避免的。

抽样误差是利用样本推断总体时所产生的误差，它是不可避免的，但可以控制的。

6．一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。

因此，他们开始检查供货商的集装箱，有问题的将其退回。

最近的一个集装箱装的是2 440加仑的油漆罐。

这家零售商抽查了50罐油漆，每一罐的质量精确到4位小数。

装满的油漆罐应为4.536 kg。

要求：(1)描述总体；(2)描述研究变量；(3)描述样本；(4)描述推断。

答：(1)总体：最近的一个集装箱内的全部油漆；(2)研究变量：装满的油漆罐的质量；(3)样本：最近的一个集装箱内的50罐油漆；(4)推断：50罐油漆的质量应为4.536×50＝226.8 kg。

7．“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。

这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。

假定作为百事可乐营销战役的一部分，选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中，两个品牌不做外观标记)，请每一名被测试者说出A品牌或B品牌中哪个口味更好。

要求：(1)描述总体；(2)描述研究变量；(3)描述样本；(4)描述推断。

答：(1)总体：市场上的“可口可乐”与“百事可乐”(2)研究变量：更好口味的品牌名称；(3)样本：1000名消费者品尝的两个品牌(4)推断：两个品牌中哪个口味更好。

第2章统计数据的描述思考题4. 一组数据的分布特征可以从哪几个方面进行测度？答：数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。

常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。

5. 怎样理解均值在统计中的地位？答：均值是对所有数据平均后计算的一般水平的代表值，数据信息提取得最充分，具有良好的数学性质，是数据误差相互抵消后的客观事物必然性数量特征的一种反映，在统计推断中显示出优良特性，由此均值在统计中起到非常重要的基础地位。

受极端数值的影响是其使用时存在的问题。

6. 对于比率数据的平均，为什么采用几何平均？答：比率数据往往表现出连乘积为总比率的特征，不同于一般数据的和为总量的性质，由此需采用几何平均。

7. 简述众数、中位数和均值的特点和应用场合。

答：众数、中位数和均值是分布集中趋势的三个主要测度，众数和中位数是从数据分布形状及位置角度来考虑的，而均值是对所有数据计算后得到的。

众数容易计算，但不是总是存在，应用场合较少；中位数直观，不受极端数据的影响，但数据信息利用不够充分；均值数据提取的信息最充分，但受极端数据的影响。

8.标准差和方差反映数据的什么特征?反映数据离散程度的特征.标准差反应数据的变化幅度，即上下左右波动的剧烈程度。

在统计中可以用来计算某变量值的区间范围（即置信区间）。

方差：即标准差的平方。

所以，标准差和方差两者没有本质区别。

10. 为什么要计算离散系数？答：在比较二组数据的差异程度时，由于方差和标准差受变量值水平和计量单位的影响不能直接比较，由此需计算离散系数作为比较的指标。

●9.某百货公司6月份各天的销售额数据如下（单位：万元）：257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295（1）计算该百货公司日销售额的均值、中位数和四分位数；（2）计算日销售额的标准差。

解：（1）将全部30个数据输入Excel表中同列，点击列标，得到30个数据的总和为8223，于是得该百货公司日销售额的均值：(见Excel练习题2.9)x=xn∑=822330=274.1（万元）或点选单元格后，点击“自动求和”→“平均值”，在函数EVERAGE()的空格中输入“A1：A30”，回车，得到均值也为274.1。

在Excel表中将30个数据重新排序，则中位数位于30个数据的中间位置，即靠中的第15、第16两个数272和273的平均数：M e=2722732+=272.5（万元）由于中位数位于第15个数靠上半位的位置上，所以前四分位数位于第1～第15个数据的中间位置(第8位)靠上四分之一的位置上，由重新排序后的Excel表中第8位是261，第15位是272，从而：Q L=261+2732724-=261.25（万元）同理，后四分位数位于第16～第30个数据的中间位置(第23位)靠下四分之一的位置上，由重新排序后的Excel表中第23位是291，第16位是273，从而：Q U=291－2732724-=290.75（万元）。

（2）未分组数据的标准差计算公式为：s302 1()1iix xn=--∑利用上公式代入数据计算是个较为复杂的工作。

手工计算时，须计算30个数据的离差平方，并将其求和，()再代入公式计算其结果：得s=21.1742。

(见Excel练习题2.9)我们可以利用Excel表直接计算标准差：点选数据列(A列)的最末空格，再点击菜单栏中“∑”符号右边的小三角“▼”，选择“其它函数”→选择函数“STDEV”→“确定”，在出现的函数参数窗口中的Number1右边的空栏中输入：A1:A30，→“确定”，即在A列最末空格中出现数值：21.17412，即为这30个数据的标准差。

于是：17.21=s（万元）。

(见Excel练习题2.9)●11.在某地区抽取的120家企业按利润额进行分组，结果如下：按利润额分组（万元）企业数（个）200～300 19300～400 30400～500 42500～600 18600以上11合计120计算120家企业利润额的均值和标准差。

解：设各组平均利润为x，企业数为f，则组总利润为xf，由于数据按组距式分组，须计算组中值作为各组平均利润，列表计算得：按利润额分组（万元）组中值企业数（个）总利润x f xf200～300 250 19 4750300～400 350 30 10500400～500 450 42 18900500～600 550 18 9900600以上650 11 7150合计—120 51200 于是，120家企业平均利润为：x=xff∑∑=51200120= 426.67（万元）；分组数据的标准差计算公式为：s2()1ix x ff--∑∑手动计算须列表计算各组数据离差平方和(x－426.67)2f，并求和，再代入计算公式：列表计算如下组中值企业数（个）(x －426.67)2f x f 250 19 593033.4891 350 30 176348.667 450 42 22860.1338 550 18 273785.2002 650 11 548639.1779 合计1201614666.668表格中(x －426.67)2f 的计算方法：方法一：将表格复制到Excel 表中，点击第三列的顶行单元格后，在输入栏中输入：=(a3－426.67)* (a3－426.67)*b3，回车，得到该行的计算结果；点选结果所在单元格，并将鼠标移动到该单元格的右下方，当鼠标变成黑“＋”字时，压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开，则各组数据的(x －426.67)2f 计算完毕；于是得标准差：(见Excel 练习题2.11)2()1ix x ff --∑∑1614666.6681201-（万元）。

点击第三列的合计单元格后，点击菜单栏中的“∑”号，回车，即获得第三列数据的和。

方法二：将各组组中值x 复制到Excel 的A 列中，并按各组次数f 在同列中复制，使该列中共有f 个x ，120个数据生成后，点选A 列的最末空格，再点击菜单栏中“∑”符号右边的小三角“▼”，选择“其它函数”→选择函数“STDEV ” →“确定”，在出现的函数参数窗口中的Number1右边的空栏中输入：A1:A30，→“确定”，即在A 列最末空格中出现数值：116.4845，即为这120个数据的标准差。

(见Excel 练习题2.11)于是得标准差：s =116.4845（万元）。

●12.一项关于大学生体重状况的研究发现，男生的平均体重为60公斤，标准差为5公斤；女生的平均体重为50公斤，标准差为5公斤。

请回答下面的问题：（1）是男生的体重差异大还是女生的体重差异大？为什么？（2）以磅为单位（1公斤＝2.2磅），求体重的平均数和标准差。

（3）粗略地估计一下，男生中有百分之几的人体重在55公斤到65公斤之间？（4）粗略地估计一下，女生中有百分之几的人体重在40公斤到60公斤之间？解：（1）由于两组的平均体重不相等，应通过比较离散系数确定体重差异较大的组：因为女生的离散系数为V=s x ＝550＝0.1 男生体重的离散系数为 V=s x ＝560＝0.08 对比可知女生的体重差异较大。

（2）男生：x =602.2公斤公斤＝27.27（磅），s =2.25公斤公斤=2.27（磅）；女生：x =2.250公斤公斤=22.73（磅），s =2.25公斤公斤=2.27（磅）；（3）68%；（4）95%。

● 13.对10名成年人和10名幼儿的身高（厘米）进行抽样调查，结果如下：成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75（1）要比较成年组和幼儿组的身高差异，你会采用什么样的指标测度值？为什么？（2）比较分析哪一组的身高差异大？解：（1）应采用离散系数，因为成年人和幼儿的身高处于不同的水平，采用标准差比较不合适。

离散系数消除了不同组数据水平高低的影响，采用离散系数就较为合理。

（2）利用Excel 进行计算，得成年组身高的平均数为172.1，标准差为4.202，从而得：成年组身高的离散系数：024.01.1722.4==s v ；又得幼儿组身高的平均数为71.3，标准差为2.497，从而得：幼儿组身高的离散系数： 2.4970.03571.3s v ==；由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。

第3章概率、概率分布与抽样分布思考题12. 解释总体分布、样本分布和抽样分布的含义。

1.总体分布指某个变量在总体中各个个体上的取值所形成的分布，它是未知的，是统计推断的对象。

从总体中随机抽取容量为n 的样本()12,,,n x x x ，它的分布称为样本分布。

e商务文档

统计学课后题答案(袁卫庞皓曾五一贾俊平)

相关文档推荐：