第三章 数据分布特征的统计描述思考与练习一、选择题1.有n 辆汽车在同一距离的公路上行驶的速度资料,确定汽车平均每小时行驶速度的平均数公式是:( C )A .n x∑ B .∑∑fxf C .∑x n 1 D .∑∑xm m2.权数对加权算术平均数的影响,取决于( B )A. 权数所在组标志值的大小;B. 权数的大小;C. 各组单位数的多少;D. 总体单位数的多少 3.是非标志不存在变异时,意味着:( B ,C )A. 各标志值遇到同样的成数;B. 所有单位都只具有某种属性C. 所计算的方差为0;D. 所计算的方差为0.254.能够综合反映总体各个单位标志值的差异,对总体标志变异程度作全面客观评定的指标有( A ,C )A.方差B.算术平均数C.标准差D.全距二、判断题1.甲乙两地,汽车去程时速20公里,回程时速30公里,其平均速度为25公里。
[答]错。
本题应采用调和平均法计算平均速度。
2.权数起作用的前提是各组的变量必须互有差异。
[答]对。
3.变量同减某个数再同除于另一数然后求其方差,其方差等于原方差乘于除数的平方。
[答]对。
4.与平均数相比,中位数比较不受极端值的影响。
[答]对。
三、计算题1.甲乙两企业生产三种产品的单位成本和总成本资料如下表,试比较哪个企业的平均成本高,并分析其原因。
产品 单位成本(元) 总成本(元) 甲企业 乙企业 A B C15 20 302100 3000 1500 3255 1500 1500[解]甲企业的平均成本210030001500660019.4118210030001500340152030++===++乙企业的平均成本325515001500625518.2895 325515001500342152030++===++由上面的计算得知,甲企业的平均成本高于乙企业。
因为乙企业单位成本低的A产品生产的数量多,占总成本一半以上,即成本低的产品相对权数大,而甲企业生产单位成本低的A产品数量少,仅占总成本的31.8%(=2100/6600)。
由于权数的作用,乙企业的平均成本低于甲企业。
2.甲、乙两市场农产品价格及成交量资料如下表,试比较哪个市场的平均价格高,并分析其原因。
品种价格(元/公斤) 甲市场成交额(万元) 乙市场成交量(万公斤)甲乙丙1.21.41.51.22.81.5211合计-- 5.5 4 [解]甲市场的平均价格1.22.8 1.5 5.51.375 1.22.8 1.541.2 1.4 1.5++===++乙市场的平均价格1.22 1.41 1.51 5.31.32544⨯+⨯+⨯===由上面的计算得知,甲市场农产品的平均价格高高于乙市场。
因为价格低的甲产品在甲市场成交额少,仅占21.8%(=1.2/5.5);而在乙市场的成交额大,占45.3%(=2.4/5.3),由于权数的作用,甲市场的平均价格高于乙市场。
3.某企业工人平均月工资为1440元,月收入少于1280元的占一半,试估计众数,并对该企业工人工资的分布情况做一简要说明。
[解] 由题中可知,企业工人月工资的中位数=1280所以众数≈1440-3×(1440-1280)=960所以众数<中位数<平均数,则该企业的月工资分布为右(正)偏,说明该企业工人的月工资分布中出现极大值,即出现有人拿到高额的工资,导致月工资分布呈右偏。
4.某城市对3000户居民户均月消费支出进行调查,得到下表资料。
居民户月均支出(元) 户数比重(%)200以下200~ 300 300~ 400 400~ 500 500~ 600 600~ 700 700~ 800 800~ 900301804506001 050300180120161520351064900~1 000 1000以上60 30 2 13 000100.00要求:(1)计算居民户总平均月支出;(2)计算居民户月均支出标准差和变异系数; (3)计算居民月均支出中位数和众数;(4)分析平均数、中位数和众数之间的数量联系,并阐明分布的特征。
[解](1)居民总平均月支出52501.0105002.095004.085006.07501.065035.05502.045015.035006.025001.0150=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)居民月均支出标准差()()()()7492.93888125052510505253505252505251502222≈=-++-+-+-(3)居民户数数列向上累计频数为2310,占总户数一半以上,中位数处于在这一组,即月均支出数列500~600中。
用下限公式计算:8571.5228571.2250010010501260150050021=+≈⨯-+=⨯-+=-∑e ee e M M M M e df S fL M用上限公式计算:8571.5221429.776001001050690150060021=-≈⨯--=⨯--=+∑e ee e M M M M e df S fU M频数最高的(户数最多)组就是众数所在之组,众数应处于居民月均支出分组500~600这一组,用下限公式计算:()()5.537100300105060010506001050500)()(111=⨯-+--+=⨯-+--+=+--oo o o o o o o M M M M M M M M o d f f f f f f L M用上限公式计算:()()5.537100300105060010503001050600)()(111=⨯-+---=⨯-+---=+-+oo o o o o o o M M M M M M M M o d f f f f f f U M5.某生产班组11个工人日生产零件数为:15,17,19,20,22,22,23,23,25,26,30。
要求:(1)计算平均数和方差;(2)按照15~19、20~24、24以上分成三组,计算组内方差和组间方差;(3)验证总方差等于组间方差与组内方差平均数之和。
[解](1)总平均数2211301715=+++=x ,总方差()()()11178112230221722152222=-++-+-=σ(2)组一(15~19):15,17,19 ;171=x 组内方差:3821=σ 组二(20~24):20,22,22,23,23 ;222=x ; 组内方差:5622=σ 组三:(24以上):25,26,30 ;273=x ; 组内方差:31423=σ ∴组间方差()()()11150113222752222322172222=⨯-+⨯-+⨯-=δ(3)证明:总方差216.18σ=,组间方差213.64δ=组内方差的平均值11281133145563382=⨯+⨯+⨯=i σ 22211281115011178i σδσ+=+==∴总方差=组间方差+组内方差的平均值。
原命题得证。
6.某管理局下属8家企业的产品销售数据如下表所示:.试比较其产品销售额和销售利润的离散程度。
企业产品销售额(X 1) (万元)销售利润(X 2) 1 2 3170 220 3908.1 12.5 18.04 5 6 7 8430 480 650 950 1 00022.0 26.5 40.0 64.0 69.0[解] 产品销售额的平均数=536.25,标准差=289.2204;∴其标准差系数5393.025.5362204.289≈=销售利润的平均数=32.5125,标准差=21.6004∴其标准差系数6644.05125.326004.21≈=根据标准差系数的计算结果,产品销售额的标准差系数较小,说明产品销售额离散程度较小,分布比较均匀。
7.某高校学生参加英语四级考试的优秀率和合格率分别为15%和90%,试计算优秀率和合格率分布的方差和标准差。
[解] 该题属于求0-1分布的方差和标准差 由题意得优秀率P 1=15%,合格率P 2=90% ∴优秀率的方差和标准差21111(1)0.150.850.12750.3571P P σσ=-=⨯== ∴合格率的方差和标准差22222(1)0.90.10.090.3P P σσ=-=⨯==8.某粮食作物的产量和播种面积资料如下,试测定其偏度和峰度。
亩产量x 400~500 500~600 600~700 700~800 800~900 900~1 000 合计播种面积f630 50 60 40 14 200[解]亩 产(百斤) 组中值i xi fi i f x x x - ()f x x 2- ()f x x 3- ()f x x 4-1 4~5 4.5 6 27 -2.7 43.74 -118.098 318.86462 5~6 5.5 30 165 -1.7 86.7 -147.39 250.563 3 6~7 6.5 50 325 -0.7 24.5 -17.15 12.0054 7~8 7.5 60 450 0.3 5.4 1.62 0.486 5 8~9 8.5 40 340 1.3 67.6 87.88114.24469~109.5141332.374.06170.338 391.77742.72001440===∑∑fxf x (百斤),2288.151.1200302===σ; 偏度00614.02288.12008.22333<-=-==σνα 峰度06143.033857.2320030220094.10873244<-=-=-⎪⎭⎫⎝⎛=-=σνβ负偏;低峰态。
2001440302-22.81087.94。