《统计学导论》答案
m→∞
1 22m −
1
m−1 i=0
22i
22m − 1 1 1
=
lim
m→∞
22m
−
1
×
3
=
, 3
=
lim
m→∞
1 22m+1
−
1
m−1
22i
i=0
=
1 6
.
即y = 2的频率不具备频率的稳定性。
练习1.7 模拟抛一枚硬币100次,记录下结果,并用此来解释事件的随机 性、规律性以及概率的概念. 题目设计用意: 训练学生通过随机模拟的方法体会随机现象的特性及 基本概念的内涵。
参考解: 为把复杂事件表示成简单事件的运算,以利用概率的性质简 化复杂事件的概率计算。
练习2.4.4 假设男婴的出生率为0.51,请估计1000个有3个孩子的家庭中至 少有一个男孩的家庭数. 题目设计用意: 训练学生们用频率近似于概率的思想解决实际问题的 能力。
参考解: 用ξ表示有3个孩子家庭中的男孩个数,则ξ ∼ B (3, 0.51)。 从而
北京师范大学数学科学学院
第四章
x05=median(x) k=1+log2(100); k=round(k); d=range(x)/k; g=(min(x)-0.5*d):d:(max(x)+0.5*d); h=histc(x,g)/(d*100); bar(g,h,’histc’);
boxplot(x) ; 运行结果为:样本中位数是0.2134;直方图与盒形图分别为
练习4.2.5 连续变量的点图有何特点?为什么? 题目设计用意: 使学生了解点图可以用来确定观测数据是否来自连续 变量。
参考解: 由于连续型变量的两次重复观测值相等的概率为0,所以其点 图中的点都应该落在纵坐标等于1的直线上。当然,由于数据的舍入误 差,会有个别的例外点。
练习4.3.5 某银行的一个储蓄所有3个服务窗口,想从如下的两种方式中 确定顾客的排队规则: (1) 每个窗口单独排成一个队列,共3个队列,顾客任选一队列等候服 务; (2) 所有顾客排成一个队列,3个服务窗口对队列中的顾客依次服务.
统计含义知 进而
λ = E (ξ) ≈ 33959.
(1)一年内没有发生大地震的概率
P (ξ = 0) ≈ e−399/35 ≈ 1. 119 5 × 1概率
P (ξ < 20) ≈ 19 (399/35)k e−399/35 ≈ 0.986 83.
k=0
k!
参考解: 运行MATLAB程序代码
y=unidrnd(2,1)-1;
得一次模拟结果,这里0和1分别代表“正面”和“反面”。
2
北京师范大学数学科学学院
在代码运行之前,我们不能预知是否出现1;但是随着模拟次数的增 加,出现1的频率却趋于稳定。事件的随机性指的就是这种不能事先预 知的、具有频率稳定性的性质。
1 12
用 计 算 机 模 拟Z 的 重 复 观 测 结 果1000次 , 将Z 的 经 验 分 布 函 数F1000(x) 与Φ(x) 在点
x = −3 + 0.5k, 0 k 12
的值相比较,并解释此比较结果. 题目设计用意: 使学生通过随机模拟实验体会中心极限定理的结论的 正确性,体会用标准正态分布函数近似z的分布函数的精度。
(3)一年发生20次以上大地震的概率
P (ξ ≥ 20) = 1 − P (ξ < 20) ≈ 0.013 17.
练习2.5.2 试用蒙特卡罗方法估算定积分 1 x2ex2dx
0
6
北京师范大学数学科学学院
题目设计用意: 训练学生们用蒙特卡罗方法解决实际问题的能力。
参考解: 取ξ ∼ U (0, 1),ξ1, · · · , ξ10000为ξ的10000次重复观测值,则
参考解: 由所给数据画盒形图如下: 从盒形图的比较知两种排队规则 的等待时间的样本中位数相等,但是一个队列的规则使得顾客的等待时 间更集中于其中位数附近。因此应该采用一个队列的规则,以保证使得
12
北京师范大学数学科学学院
¨
©
§
¦
¥
¤
£
¢
䱏ࡇ
!
"
䱏ࡇ
¡
#
$
%
各个顾客等待的时间相差不大,更好地体现公平性。
参考解: a. 总体是所关心的研究对象的全体,样本是由部分总体对象 组成的,是总体的一部分。人们想用样本的特征来估计总体的特征。 b. 研究总体中的所有对象要比研究样本中所有对象花费更多的人力、物 力和财力。对于无限总体,不可能对总体的每个成员进行观察。在一些 特殊情况下,不容许我们研究总体中的所有对象。如在研究刚生产的一 批高压锅的极限耐压力,需要做极限耐压试验。因为这种试验是破坏性 的,所以不能对每一个高压锅都做试验。因此需要通过样本的研究来推 断总体的特性,以节省人力、物力和财力,避免研究对总体中的所有对 象造成的损坏。
5
北京师范大学数学科学学院
第二章
次数,若用泊松分布来近似ξ的分布,估计下列事件发生的概率. (1)一年内没有发生大地震; (2)一年内发生小于20次大地震; (3)一年内发生20次以上大地震.
题目设计用意: 训练学生们用频率近似于概率的思想解决实际问题的 能力。
参考解: ξ ∼ P (λ),今在35年中观测到399次大地震,由数学期望的
练习4.3.8 模拟100个N (0, 1)分布的随机数,计算样本均值和样本中位 数,画出频率直方图和盒形图. 题目设计用意: 训练学生随机模拟的能力,体会频率直方图与盒形图 的随机性。
参考解: 可用如下的MATLAB程序代码完成任务:
x=normrnd(0,1,100,1); m=mean(x)
13
练习1.6 试证明:若在
y = sin
π 2
+e
的观测中,e的值按表3-1中的规律变化,则y的观测值不具备频率稳定
性.
题目设计用意: 使学生感受存在不具备频率稳定性的不确定现象。产
生这种现象的原因是没有发现左右这种现象的全部非随机因素,如在此
1
北京师范大学数学科学学院
第一章
处不知道现象y还受e的影响。
10
北京师范大学数学科学学院
第四章
练习4.1.1 对于连续型总体变量,为什么可以用频率直方图近似它的密 度函数? 题目设计用意: 使学生能够用阶梯函数逼近连续函数、密度函数的概 率含义和频率近似于概率的原理解释频率直方图近似于密度函数的原 因。
参考解: 连续型总体变量的密度函数可以用阶梯函数任意逼近,而根 据密度函数的概率含义和频率近似概率的思想,这个阶梯函数的每个阶 梯又可以用相应的频率矩形的顶边近似,所以可用频率直方图的顶边近 似密度函数。
参考证明: 事实上,
log n
yn = 1 + (−1) log 2 , n ≥ 1, 进而对于整数k ≥ 0,当2k ≤ n < 2k+1时有
y = 1 + (−1)k .
用f (n)表示前n个观测值中y = 2的频率,则
lim f 22m − 1
m→∞
lim f 22m+1 − 1
m→∞
=
lim
练习3.4.1 某中学教师,在长期的教学过程中总结出了一套教学方法。
9
北京师范大学数学科学学院
第三章
现在想用实验来检验该教学方法是否有必要在校内推广,应该如何确定 实验组和对照组?如何安排实验? 题目设计用意: 训练学生正确获取实验数据的能力。 参考解: 随机选择学生,随机选择授课教师,在实验的过程中保持实 验组和对照组的外部环境一致。
练习4.2.2 可以用频率条形图来近似离散型随机变量的分布密度图像 吗?为什么? 题目设计用意: 使学生了解大数定律可以解释用频率条形图来近似离 散型随机变量的分布密度图像的原因。
参考解: 可以,由大数定律,频率条形图上各个条形的高度随着样本
11
北京师范大学数学科学学院
第四章
容量的增加趋于相应密度的概率为1。
即标准正态分布函数与Z的经验分布函数模拟计算结果中的平均最大误 差不超过0.0087,这说明标准正态分布函数能够很好地近似Z的分布函 数。
8
北京师范大学数学科学学院
第三章
练习3.1.4 某人向你咨询样本和总体的概念, a.你的回答应包含什么样的信息? b.你将用什么样的理由去解释为什么人们要用样本来代替对总体每个 成员的观测? 题目设计用意: 巩固学生对总体和样本概念的理解。
北京师范大学数学科学学院
第一章
练习1.4 有些人相信“乌鸦叫,没好兆”的说法,并可以举出很多具体 事例来论证此事。你认为这种论证方法可靠吗?应该用什么样的思路考 察这种说法是否正确? 题目设计用意: 训练学生从统计学的角度寻求解决问题的思路。
参考解:这种论证方法不可靠,因为该结论来自精心挑选的事例,它们 都说明“乌鸦叫,没好兆”。这样的事列不具有代表性,由此所得的结 论有很大的偏差。要考察这种说法是否正确,可以通过实验数据来考 察。随机选取一些人,在特定一段时间内记录他们听到乌鸦叫的时刻和 发生事故的时刻,分析二者之间的关系,推断出结论。
P (ξ ≥ 1) = 1 − P (ξ = 0) = 1 − 0.493 = 0.882 35 根据频率近似于概率的思想,在1000个有3个孩子的家庭中至少有一个 男孩的家庭数约为
[1000 × P (ξ ≥ 1)] = 882.
练习2.4.10 从1970年1月1日到2004年12月31日,中国地震监测台网记录到 了399次大地震(震级在6Ms以上).用ξ表示一年内记录到的大地震的
该储蓄所对两种规则进行了实验,观察顾客等候服务的时间(分 钟),得到如下数据: