第一章1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A.9252157 B. 9282157 C.528292 D. 655292 E. 9252821*. Answer :BAnalysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为:92829282(,)()()157157157157P Earned Employed Total P Earned P Employed Total ===2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组的试验结果。
如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱绿色的人数的期望值? A.(99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35)3142*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为:1089999108(3050,)(3050)()314314314314P green Total P P green Total -=-==第二章1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。
下面哪个图代表了有最大标准差的数据集?A. B.C. D.E.2*..这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张A.较低的20个分数的差异大于较高的20个分数的差异B.中位数小于50C.60%的学生的分数高于80分D.如果设定及格线是70,那么大多数人没通过这次考试E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高F.1*. Answer:DG.Analysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。
1*. Answer:DAnalysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。
这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张图中得出?A.较低的20个分数的差异大于较高的20个分数的差异B.中位数小于50C.60%的学生的分数高于80分D.如果设定及格线是70,那么大多数人没通过这次考试E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高2*. Answer:AAnalysis:本题考查累计频数分布图,较低的20个分数累积的比较快,较高的20个分数累积的比较慢,所以,较低的20个分数的变异性较大。
Set ISet II20 30 45 50 60这张箱线图表明了两个统计数据组,根据这张箱线图,下列哪一个选项不能推断出来?A.1组的范围和2组的范围一样B.1组的四分位差和2组的四分位差一样C.1组的中位数比2组的中位数小D.1组的数据同2组的数据有相同的数据量E.2组大约75%的数据大于或等于1组中大约50%的数据Analysis:本题考查平行箱线图的数值特征。
I和II的极差相同;IQR就是箱子的宽度,I和II 相同;中间的竖线是中位数,I小于II;从图中看不出I和II的数据量是否相同;I的中位数和II的下四分位数相同,所以II中至少有75%的数据比I中50%的数据大。
4*.植物学家正在研究两种不同种类的百合花的花瓣长度(以毫米计)。
上面的箱线图是选取两个不同物种的相同大小的样本的花瓣长度收集的数据。
根据这个箱线图,哪一个选项是这次研究出的正确结果?A.两组的四分位差相同B.B种花的长度范围大于A种花C.A种花的长度同B种花的长度相比有更多长于70mm的花瓣D.B种花的长度同A种花的长度相比有更多长于40mm的花瓣E.B种花的长度同A种花的长度相比有更多少于30mm的花瓣4*. Answer:EAnalysis:本题考查平行箱线图的数值特征。
A的IQR比B的小;A和B的极差相同;大于70的数据A比B的少;大于40的数据A比B多;大于30的数据A比B多。
5*.詹妮尔收集了一个大样本中每一个顾客在当地一个商店中停留的时间。
这些数据被分为男士组和女士组。
下图是这些数据的箱线图。
下面哪一个说法是正确的?A.男士组在商店停留的时间的极差是40分钟B.男士组平均在商店停留的时间大约为20分钟C.男士组的3/4位数大约是45分钟D.样本中女士组的四分位差是15分钟E.样本中大约一半的男士在商店停留的时间至少同女士一样多Analysis:本题考查平行箱线图的数值特征。
解题思路同第3、4题,不再赘述。
6*.在1830年,土地测量员开始调查路易斯安那州的土地购买。
他们的部分任务是调查该区下列哪一个选项表示了累积相对频率表中树木直径在12到16英寸的组A. 0.615 - 0.325B. 0.615 - 0.473C. 0.726 - 0.325D. 0.726 - 0.473E. 0.731 - 0.325 6*. Answer :CAnalysis :本题考查通过累积频率计算相应的区间。
注意,题目问的是直径在12到16英尺之间,包括12和16。
所以应该是11对应的相对频率0.325到16对应的相对频率0.726。
B. 问答题1*.美国每个州每年公立学校招收学生与雇佣老师的数量的数据由美国每个州记录。
从这些记录中,每个州学生和老师的数量比值(p-t 比)可以被计算出来。
下面的柱状图显示了每个州在2001 - 2002学年的p-t 比。
左边的柱状图显示了密西西比河以西的24个周的比率,右边的柱状图显示了密西西比河以东的26和州的比率(a ) 描述你如何估计这两组数据的中位数的方法。
然后用你所描述的方法估计西部地区的中位数和东部地区的中位数。
(b ) 简单用几句话比较2001-2002学年这两组数据p-t 值。
(c ) 用你从(a )和(b )中的答案,来比较2001-2002学年这两组p-t 值的均值大小 1*. Analysis :本题考查直方图的相关知识。
(a) 找出中位数,根据中位数的定义M e 的位置是12n ,n 1 = 24,n 2 = 26。
所以两个中位数所在的组都是15~16。
(b) shape :west 右偏,east 接近对称;center :中位数相同;spread :the range of west = 22 – 12 = 10,the range of east = 19 – 12 = 7。
(c) west 右偏,有mean > median ;east 接近对称,有mean = median 。
两者中位数相同,所以,mean west > mean east 。
第三章1*.下面的茎叶图显示了16年来两家不同的公司股票每股收益的比较下列哪一个选项是正确的?A.A公司的收益的中位数小于B公司收益的中位数B.A公司收益的范围小于B公司的收益范围C.A公司的3/4位数小于B公司的3/4位数D.A公司收益的均值比B公司收益的均值大E.A公司的四分位差是B公司的四分位差的两倍1*. Answer:DAnalysis:本题考查背靠背茎叶图的数值特征。
A的中位数为1.955,B的中位数为1.32;A 的极差为3.32,B的极差为1.71;A的上四分位数为2.49,B的上四分位数为1.65;A的均值为2.1475,B的均值为1.38625;A的IQR为1.06,B的IQR为0.67。
2*. 一个公司想要确定员工的医疗费用。
对一个25个雇员的样本进行采访,确定他们上一年的医疗花费。
后来该公司发现,最高的医疗费用在样本被错误地记录为10倍的实际金额。
但是,在纠正错误之后,正确的数字依然大于或等于样本中任何其他的医疗花费数字。
下列哪个样本统计量必须在更正后保持不变?A. Mean 均值B. Median 中位数C. Mode 众数D. Range 范围E. Variance 方差2*. Answer:BAnalysi:本题考查变量取值的变化对变量数字特征的影响。
题中把数据错误变为原来的10倍。
改正后数据还是偏大,那么和正确的相比,只有中位数不会变化。
3*. 从总人口中随机选取一个10人大小的随机样本。
这个样本的方差是0。
下列哪一个选项是正确的?1:总人口的方差也是0。
2:样本的均值和样本的中位数一样。
3:这10个样本数据数学上相等A. I only 只有1B. II only 只有2C. III only 只有3D. I and II 1和2E. II and III 2和33*. Answer:EAnalysis:本题考查样本均值与中位数的关系受方差变化的影响。
样本方差为0,说明样本数据没有波动,即样本中每个数据都是相同的,但这并不意味着总体也是如此。
所以样本均值和中位数相等。
4*.一个教授教两个统计学班。
早上的课有25个学生,他们的第一次测试平均分是82。
晚上的课有15个学生,他们的第一次测试成绩是74。
考虑他两个班的情况,教授所教全部学生的平均测试成绩是多少? A. 76 B. 78 C. 79 D. 80E. The average cannot be calculated since individual scores of each student are not available. 由于不是每个学生成绩都知道所以不可计算 4*. Answer :CAnalysis :本题考查平均数的计算。
两个班级的平均成绩为:25821574792515⨯+⨯=+5*. 从芒廷维尤学区抽取一个25个家庭的随机样本进行调查。
在这次调查中,收集的数据是每一个家庭中生活的最小的小孩。
下面的直方图展示了这次调查中得到的数据。
下面哪一个组包含了这次调查中的均值A. 0 years old to less than 2 years old 0岁到小于2岁B. 4 years old to less than 6 years old 4岁到小于6岁C. 6 years old to less than 8 years old 6岁到小于8岁D. 8 years old to less than 10 years old 8岁到小于10岁E. 10 years old to less than 12 years old 10岁到小于12岁 5*. Answer :DAnalysis :本题考查中位数的计算。