当前位置:
文档之家› 统计学高教第三版课后习题答案
统计学高教第三版课后习题答案
vs =
方法 A 平均 中位数 众数 标准偏差 极差 最小值 最大值 165.6 165 164 2.13 8 162 170
方法 B 平均 中位数 众数 标准偏差 极差 最小值 最大值 128.73 129 128 1.75 7 125 132
方法 C 平均 中位数 众数 标准偏差 极差 最小值 最大值 125.53 126 126 2.77 12 116 128
k
∑(x −万元)
s=
i =1
k
∑f
i =1
i
−1
13(1)离散系数,因为它消除了不同组数据水平高低的影响。
4 .2 = 0.024 172.1 (2)成年组身高的离散系数: ; 2 .3 vs = = 0.032 71.3 幼儿组身高的离散系数: ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高 的离散程度相对较大。 14 .表给出了一些主要描述统计量
( )
( )
( )
(z ) 答:以估计总体均值时样本容量的确定公式为例: n = α / 2
2
σ2
E2
样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。 练习题: 2. 解:由题意:样本容量为 n = 49 (1) 若 σ = 15, σ x =
σ 15 = = 2.143 n 49 σ = 1.96* 2.143 = 4.20028 n
σ2 , n
σ2 ⎛ N −n⎞ ⎟ n ⎜ ⎝ N −1 ⎠
因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数 3.解释中心极限定理的含义 答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期 望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正 态分布。中心极限定理为均值的抽样推断奠定了理论基础。
23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (3) A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比 A 班分散, 且平均成绩较 A 班低 8. 箱线图如下:(特征请读者自己分析)
某管理局下属 40 个企分组表 企业数(个) 11 11 9 9 40 频率(%) 27.5 27.5 22.5 22.5 100.0 先进企业 良好企业 一般企业 落后企业 合计
按销售收入分组(万元)
3 采用等距分组 全距=49-25=24 n=40 取组距为 5,则组数为 24/5=4.8 取 5 组
服务质量等级评价的频数分布 服务质量等级 A B C D E 合计 条形图(略) 家庭数(频率) 14 21 32 18 15 100 频率% 14 21 32 18 15 100
2 (1)采用等距分组:
n=40 全距=152-88=64 取组距为 10 组数为 64/10=6.4 取 6 组 频数分布表如下: 40 个企业按产品销售收入分组表 按销售收入分组 企业数 频率 (万元) (个) (%) 100 以下 5 12.5 向上累积 企业数 5 频率 12.5 向下累积 企业数 40 频率 100.0
15
14 14
Frequency 10
10
8
8 7
5
4
0 -30
-20
-10 tempture
0
10
7 (1)茎叶图如下:
A班 数据个数 树 叶 树茎 B班 树叶 数据个数
0 1 2 11
4 97 97665332110
3 4 5 6
59 0448 122456677789 011234688
2 4 12 9
频数分布表: 按销售额分组(万元) 25-30 30-35 35-40 40-45 45-50 合计
频数(天数) 4 6 15 9 6 40
15
15
Frequency 10
9
6
6
5
4
0
25
30
35 sales
40
45
50
4. .(1)排序略。
(2)频数分布表如下: 100 只灯泡使用寿命非频数分布 按使用寿命分组(小时) 灯泡个数(只) 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计 直方图(略)。 (3)茎叶图如下: 6518 6614 6713 6811 6900 7000 7100 5 4 2 1 1 2 6 6 3 1 1 2 8 7 3 1 2 3 2 5 6 14 26 18 13 10 3 3 100 频率(%) 2 5 6 14 26 18 13 10 3 3 100
(2) α = 0.05, E = zα / 2
σ σ ⎞ ⎛ x = 120, ⎜ x − zα / 2 , x + zα / 2 ⎟ = (120 − 4.20028,120 + 4.20028 ) (3) 若 n n⎠ ⎝ = (115.7997,124.20028 )
9 3 1 2 3
4 2 3 5
5 2 4 6
5 2 5 7
5 3 6 7
8 3 6 8
8 4 6 8
9 9 4 5 5 6 6 6 7 7 8 8 8 8 9 9 7 7 8 8 8 9 9
7201 2 2 5 6 7 8 9 9 7335 6 7414 7
5 等距分组 n=65 全距=9-(-25)=34 取组距为 5,组数=34/5=6.8, 取 7 组 频数分布表: 按气温分组 天数 -25 --- -20 8 -20 --- -15 8 -15 --- -10 10 -10 --- -5 14 -5 --0 14 0 --5 4 5 --- 10 7 65 合计
=19.41(元),
∑m
乙企业平均成本 x2 =
i =1 3
2i
m1i ∑ i =1 x2 i
=18.29(元);
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占 比重较大,因此拉低了总平均成本。
k
11. x =
∑x f
i =1 k
i i
426.67(万元);
i
∑f
i =1
第二章、统计数据的描述
思考题 1 描述次数分配表的编制过程 答:分二个步骤: (1) 按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时, 可将其每个具体的表现作为一个组,或者几个表现合并 成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间) 作 为一个组。 统计分组应遵循“不重不漏”原则 (2) 将数据分配到各个组,统计各组的次数,编制次数分配表。 2.解释洛伦兹曲线及其用途 答:洛伦兹曲线是 20 世纪初美国经济学家、统计学家洛伦兹根据意大利经济学 家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。 洛伦兹 曲线可以观察、分析国家和地区收入分配的平均程度。 3. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。 常
统计学 第一章 1. 什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据 存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对 统计数据的研究, 离开了统计数据, 统计方法以致于统计学就失去了其存在意义。 2.简要说明统计数据的来源 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学 实验, 在社会经济管理领域, 主要通过统计调查方式来获得, 如普查和抽样调查。 间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差 答: 统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中 各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用 样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.答: (1)有两个总体:A 品牌所有产品、B 品牌所有产品 (2)变量:口味(如可用 10 分制表示) (3)匹配样本:从两品牌产品中各抽取 1000 瓶,由 1000 名消费者分别打 分,形成匹配样本。 (4)从匹配样本的观察值中推断两品牌口味的相对好坏。
95 85
75
65
55 45
Min-Max 25%-75% Median value
35
9.(1) x =274.1(万元);Me =272.5 ;QL=260.25;QU =291.25。 (2) s = 21.17 (万元)。
3
10.甲企业平均成本 x1 =
∑m
i =1 3
3
1i
m1i ∑ i =1 x1i
用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和 峰度系数。 4 怎样理解均值在统计中的地位? 答: 均值是对所有数据平均后计算的一般水平的代表值, 数据信息提取得最充分, 具有良好的数学性质, 是数据误差相互抵消后的客观事物必然性数量特征的一种 反映, 在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地 位。受极端数值的影响是其使用时存在的问题。 5 对比率数据的平均,为什么采用几何平均? 答: 比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的 性质,由此需采用几何平均。 6. 简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数 据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易 计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响, 但 数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。 7 为什么要计算离散系数? 答: 在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位 的影响不能直接比较,由此需计算离散系数作为比较的指标。 练习题: 1. 频数分布表如下: