第一章1.举出你所知道的统计应用的例子。
答:期末考试后统计班里同学的成绩,从而进行排名等;人口普查统计,从而得知男女人口比例,年龄分布等;统计一个生态系统里某种物种的密度;统计股票市场上某一天的各种数据;统计某个城市的人均收入水平,人民幸福指数,对某一电视节目的看法等。
2.解释定性数据和定量数据的区别,分别给出一个定性数据和一个定量数据的例子。
答:定性数据和定量数据的区别:定性数据是由于我们考虑的是取值为类别的变量,对这些类别用数字来分别代表就得到定性数据;定量数据是我们所考虑的变量的取值为数值,它将在某个区间上连续取值,或在某个区间上取离散的值。
定性数据的例子:例如考察某幼儿园10个人的性别,定义仁男,2=女,则所得到定性数据为:1,1,2,2,2,1,2,1,1,1. 定量数据的例子:考察某幼儿园10个人的身高,则此变量取值区间为(0,200)(单位:cm)3.解释样本和总体的区别。
答:总体是根据一定目的和要求所确定的研究事物的全体。
为了了解总体的分布,我们从总体中随机地抽取一些个体,称这些个体的全体为样本。
样本和总体的区别在于总体是要考虑对象的全体,而样本是从总体中抽取出的一部分具有代表性的个体,从而通过对样本的研究得出关于总体的一些结论。
4.解释离散型变量和连续型变量的区别,并各举一例。
离散型变量是指其数值只能用自然数或整数单位计算。
例如:某企业里职工的人数连续型变量是如果所考虑变量可以在某个区间内取任一实数,即变量的取值可以是连续的。
例如:生产零件的规格尺寸。
5.阐述四种主要的收集数据方法的区别。
答:观测,访问,问卷,实验区别:观测数据的研究者尽量不干涉研究对象的行为模式;访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。
6.举出一些观测数据和实验数据的例子。
答:(1)观测数据:证券分析人员可能会记录某即将收购的公司在被收购的前一天的股市收盘价,并与宣布被收购的当天的收盘价比较。
(2)试验数据:研究某药物是否具有特定效用,将所有志愿者分成治疗者和控制组。
治疗组每天服用一片该药物,而控制组则服用一片大小形状颜色与前一药物相同或相近的安慰剂。
7•答:(1 )是样本。
所有的CEO的收入排行榜上的数据是总体,我们从中抽取的500名CEO的收入排行榜上的数据是样本。
(2)其中CEO所在公司所属行业是定性变量,而上一年全年CEO 总收入(百万美元),过去5年中CEO的总收入,公司所持有的股票份额(百万),CEO的年龄(岁),CEO的效率评分是定量变量。
8.答:定类水平:性别定序水平:人可以根据年龄分为幼年、少年、青年、中年、壮年、老年定距水平:温度定比水平:身高,收入9.答:根据这个样本知:约有80%的顾客认为此药膏非常好,约有6.4%的顾客认为此药膏一般,而约有13.6%的顾客的反应不明朗。
10.■01A B C D1 itkE人口数(人)2000年比重2010年比重2」北乐市19612368 1.1.46 3天津市12938224 0. 0. 97 4河北省71854202 5. 5. 36 5〔山西省357121112. 6 2. 67 6內蒙古自治区24706321 1.88 1.84 7上海市23019148 1.32 1.72 8江苏省78659903 5. 5. 87 9全国合计1339724852YK ・》[ Sheetlz She"2 Sheet3第二章1. (1)两个班考试成绩的柱形图如下所示:•优-良 i_中二及格 u 不及格的n饼图甲班1乙班成rnu分叮 「所示■ 1人数甲班不及格优良20 18 16 14 12 10>人数甲班-人数乙班(2)两个 成绩在优 数多于乙 乙班成绩卜班考试成绩分 和良的等级上乙班人 班,在及格和不及格级 要比甲班好。
2.( 1)反映评价等级的分人数乙班如下所示:____ 班, 在中等级别 上乙班人数少于甲班骨 良 中-及格■不及格甲班人艮明显, 频数格3. (1)国产车和进口车销售量的对比条形图:■压产车钢程排厅前m名■进口车销锂排行前iu名(2)国产车销售量帕累托图等级一二20)0 一II~ I看吏来 文別 擡达扭趣圧 M 哈飞蔣高曲 宝进口车销售量帕累托图:4•答:首先认为是雇员盗窃以及高价买入导致存货缩水。
帕累托图如下所示:2D IQ—iniN25)0 -—测1530-//J- ・・ncbft东;r 之底求翌愛肛舍 于 屈存货缩水原因5.O£±e顾客投诉由图可得,对汽车经销商的投诉是最多的。
频率转机行李处理在原机场没有其他配载限制装载、卸载错到达站处理不不当卸载误不当当±e延迟原因紫外线指数E A C B DU- ? ±e城市数目一南美||北美一欧洲厂非洲口大洋洲■亚洲预算额(百万美元)10.死亡人数J科学,航空,探索口探索能力亠-常规检查11.死亡人数■轿车1■-卡车摩托车其他12年度进口额(万元)匚轿车■卡车1摩托车其他第三章1•答:频数分布表比较清晰的展现出在每个分组中的数据占样本数据的百分比。
2.答:频数分布图便于对数据的主要特征(高点,低点,集中点等)得到直观的印象。
3•答:相对频率很容易可以看出每组的频数,而累积频率可以方便的看出该组数据之前的累积频率。
4.(1)9 组;(2)10 组;(3)18 组;(4)15 组。
5.0 组。
6.组。
7.(1)组距:10(2)数据趋向于集中到58(3)数据呈左偏态尖峰分布。
(4)相对频数分布为组频数相对频数15~24 1 2.5%25~34 2 5.0%35~44 5 12.5%45~54 10 25.0%55~64 15 37.5%65~74 4 10.0%75~84 3 7.5%8.(1)答:5名员工由于生病每年缺勤的天数少于3天。
17名员工由于生病每年缺勤的天数少于6天。
(2)累积频数分布缺勤的天数累计频数累积频率0~3 5 10%3~6 17 34%6~9 40 80%9〜12 48 96%12〜15 50 100%(3)根据累积频数折线图,75%的员工每年由于生病而缺勤的天数不超过37.5天100008000 6000 4000 2000 —0答:线图如 曾的趋势,且在>1998年以前增长速度较快,或1998年以后人口增 长速度相比以前有所下降。
'举9.柱体图如下:年度进口额可看出 1990—20571年每年的人口呈递 从下图11•答:(1)建议分成6组;组距为2。
(2)直方图如下所示:直方图说明大多数人上网时间在4到7 个小时之间;也有一部分人上网时间在1到3个小时之间或者是8到10个小时之间1.00 4 . 03.00 4 . 7994.00 5 . 01244.00 5 . 68993.00 6 . 1231.00 6 . 72.00 7 . 133.00 7 . 6893.00 8 . 0441.00 8 . 7Stem width: 10Each leaf: 1 case(s)13. 答:茎叶图展示数据如下:冰层厚度(厘米) Stem-and-Leaf PlotMe an = 5.17Std. De v. = 2.6284N = 60Frequency Stem & Leaf时间12.答:茎叶图展示数据如下:年龄Stem-a nd-Leaf Plot2.00 4 . 395.00 5 . 188895.00 6 . 489996.00 7 . 0022252.00 8 . 01Stem width: 1.0 Each leaf: 1 case(s)14.答:用散点图表示数据如下:16•答:袋中苹果数量的均值为:21.71,中位数为:22.15•答:散点图如下:0 5 10 ts £02530()0on006 4厂昔数量6-toOC 404 2 0 8 11117.答:该机器每天被使用的次数的均值为70.53。
18.答:(1 )售价的均值是:1.6380(2)售价的中位数是:1.4500(3)售价的众数是:1.4919.答:地震等级的中位数是:7.050地震等级的均值是:6.967 死亡人数的中位数是:1100,死亡人数的均值是:5607.79 地震等级选择均值作为集中趋势的度量;死亡人数选择中位数作为集中趋势的度量。
20.答:(1)(2)数据显示不存在异常值。
21.答:(1)样本均值是:4.154万元;样本标准差是:0.5317 (2)中位数:4.200 ;上四分位数:3.750 ;下四分位数:4.650(3)样本中每个员工获得5%的加薪后集合的样本均值为:4.3615,样本标准差为:0.55827(4)月薪的样本均值为:0.3462,样本标准差为:0.04431 (5)用不同的度量来衡量数据的变异所得结果是不同的。
22.答:(1 )数据的均值是:49.23数据的中位数是:46.50(2)茎叶图:顷烦St en-and-Leaf PlotFrequency& Leaf2,001・13巳002-28巴M3.6S677785. 004.134674.005・IL捋q, oo・1^344. 007.2246L 003.51. 00g・0Stem uiidth:10Each leaf!I(3)数据呈右偏态,扁平分布。
23.答:(1)女生体重差异大,因为男生体重的变异系数比女生的小;⑵⑶68%⑷95%24.答:此位应试者A项测试更为理想。
25.答:国内乘客的变异系数为CV1=4.5/21x100%=21.4% 海外乘客的变异系数为CV2=6.8/35X100%=19.4%根据两组乘客的行李重量的变异系数可以看出,国内乘客携带行李重量的相对离散程度更高,而海外乘客的相对离散程度则比国内更低一些。
26.答:(1)因为这是两组不同水平的变量,均值相差很远,使用变异系数可对离散性进行有意义的比较。
(2)市盈率的变异系数为:0.165,投资收益率的变异系数为:0.208,这说明投资收益率的相对离散程度比市盈率的大。
27.答:(1)使用标准差和方差来反映风险(2)商业类股票,因为商业类股票方差较小,离峰值较集中(3)选择高科技类股票,因为两类股票峰值左侧的频数都较少,而峰值及其右侧的频数较多,其中高科技类股票的收益率更高,选择它有更大几率获得更多利润第四章1•答:(1)-6(2)利用等可能事件求概率的方法。
(3)掷一枚骰子的结果中1点到6点的结果是相等的,互斥的。
2.答:(1)50(2)使用相对频数的方法3.答:(1)古典概率(2)古典概率(3)主观概率4答:(1)一共有36种可能结果,具体组合略。