第一章数据与统计资料
P 18
25. 表1-8是一个由25只影子股票组成的数据集,(表略)
a 数据集中有几个变量?答:数据集中有5个变量。
b哪些变量是数量变量?哪些变量是品质变量?
答:市场价值、市盈率和毛利率属于数量变量;交易所和股票代码是品质变量。
c对交易所变量,计算AMEX、 NYSE 和OTC频数或百分数频数。
绘制类似于图1-5的交易所
20.2
第二章表格法和图形法
P 23
5按字母顺序,美国最常见的6个姓氏为:布朗、戴维斯、约翰逊、琼斯、史密斯和威廉姆斯。
假设根据一个由50个人组成的样本,得到如下的姓氏数据(图略)
c 构建饼形图
d根据这些数据,最常见的3个姓氏是哪些?
答:最常见的3个姓氏分别是史密斯、约翰逊和威廉姆斯。
P50
51 表2-17 给出了50家《财富》500强公司的所有者权益、市场价值和利润数据。
(图略)a.构建所有者权益和利润变量的交叉分组表。
对利润数据以0-200,200-400,…,1000-1200
53. 参考表2-17中的数据集
a. 绘出显示利润和所有者权益变量之间关系的散点图。
b. 评价这两个变量之间的关系。
答:二者呈正相关的关系,即所有者权益增加,利润也增加。
但因为所有点并不在一条直线上,所以这种关系不是完全的。
案例2-1 Pelican 商店
券购买的奖励性顾客占全体顾客总数的70%,分布于各个销售额区域,尤其在销售额100内的范围里做出了突出贡献,尽管未使用折扣赠券的常规性顾客也主要集中在该销售额区域,但比重明显低于奖励性顾客,且在200以上的销售额区域则无常规性顾客,奖励性顾客的消费金额也扩大到300。
4. 考察净销售额与顾客年龄关系的散点图
根据上图,净销售额与顾客年龄之间没有明显的相关关系。
总之,Pelican商店所推出的促销活动取得了成效,净销售额明显增加,客户群有所扩大。
第二次作业
第三章描述统计学II :数值方法
P 87
63 人们每天去上班时,可以乘坐公交车或开私家车。
下面是这两种方式所花费时间的样本数据,时间以分钟计。
a. 计算每种方式所花费时间的样本平均数。
乘坐公交车所花费时间的样本平均数:32
乘坐私家车所花费时间的样本平均数:32
b.计算每种方法的样本标准差
乘坐公交车的样本标准差:4.643
乘坐私家车的样本标准差:1.826
c.根据(a)和(b)的计算结果,哪一种方式上班去更好?请解释。
答: 乘坐公交车所花费时间的样本平均数:32。
以及乘坐私家车所花费时间的样本平均数:32。
二者数据相同,无法直观比较二者的差别。
而从样本标准差相比,拥有较大标准的变量显示变异程度也较大,即每个观察值X远离平均值μ,离散程度大,稳定性差,风险高。
乘坐公交车的样本标准差:4.643,而乘坐私家车的样本标准差:1.826,说明乘坐公交车的各个样本花费时间的差距比乘坐私家车的大,前者不稳定,所以乘坐私家车去上班更好。
d.绘出每种方法的箱型图。
对箱型图的比较是否也支持你在(c)中的结论。
答:支持。
P 89
案例3-1 Pelican 商店
第四章概率
P158
18 标准普尔500公司股票的平均价格为30美元,标准差是8.2美元(《商业周刊》,2003年春)。
假定股票价格服从正态分布。
a. 某公司股票价格至少为40美元的概率是多少?
答:利用EXCEL的NORMDIST计算得出该题的概率是0.111325
1- NORMDIST(40,30,8.2,1)= 1-0.888675
= 0.111325
b. 某公司股票价格不超过20美元的概率是多少?
答:利用EXCEL的NORMDIST计算得出该题的概率是0.111325
NORMDIST(20,30,8.2,1)= 0.111325
c. 某公司股票价格排名位于全部股票的前10%,则公司的股票价格至少应达到多少?
答:利用EXCEL的NORMINV计算得出该题的股票价格至少达到40.50872美元。
P ( X > Z ) = 0.1, P( X ≤ Z ) = 0.9
Z = NORMINV(0.9,30,8.2)
= 40.50872
P 159
20 在2003年1月,美国工人工作中平均在互联网上用去77小时()。
假设美国工人在互联网上的工作时间服从正态分布,其总体均值为77小时,其标准差为20小时。
a. 随机选取一名工人,则他2003年1月在互联网上的工作时间低于50小时的概率是多少?
答:利用EXCEL的NORMDIST计算得出该题的概率是
b.有多少百分比的工人2003年1月在互联网上的工作时间多于100小时?
答:利用EXCEL的NORMDIST计算得出该题的概率是12.51%
1- NORMDIST(100,70,20,1)= 1-0.8749
= 0.1251
c. 如果某人在互联网上的工作时间排名在前20%,则认为他属于大量使用者。
试问,如果
一名工人属于大量使用者,那么他2003年1月在互联网上的工作时间至少应该有多少小时?
答:利用EXCEL的NORMINV计算得出该题的工作时间至少有93.83242小时:
P ( X > Z ) = 0.2, P( X ≤ Z ) = 0.8
Z = NORMINV(0.8,70,20,1)
= 93.83242。