练习一一、单项选择题(每题1分,共15分,选出最为恰当的一项)。
1.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。
在该项研究中,样本是()A、100所中学B、20个城市C、全国的高中学生D、100所中学的高中学生2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54794美元,中位数是47543美元,标准差是10250美元。
对样本中位数可作如下解释()A、大多数女性MBA的起薪是47543美元B、最常见到的起薪是47543美元C、样本起薪的平均值为47543美元D、有一半女性的起薪高于47543美元3.某组数据的四分之一分位数是45,中位数是85,四分之三分位数是105,则该组数据的分布是()A、右偏的B、对称的C、左偏的D、上述全不对4.权数对均值的影响实质上取决于()A、各组权数的绝对值大小B、各组权数是否相等C、各组变量值的大小D、各组权数的比重5.下列关于抽样调查的描述,不正确的是()A、目的是根据抽样结果推断总体;B、结果往往缺乏可靠性;C、是一种非全面;D、调查单位是随机抽取的6.两组数据的均值不等,但标准差相等,则()A、均值小,差异程度大;B、均值大,差异程度大;C、两组数据的差异程度相同;D、无法判断。
7.下列叙述正确的是()A、众数可以用于数值型数据;B、中位数可以用于分类数据;C、几何平均数可以用于顺序数据;D、均值可以用于分类数据。
8.各变量值与其()的离差之和等于零。
A、中位数;B、众数;C、均值;D、标准差9.点估计的缺点是()A、不能给出总体参数的准确估计B、不能给出总体参数的有效估计C、不能给出点估计值与总体参数真实值接近程度的度量D、不能给出总体参数的准确区间10.估计量的抽样标准误差反映了估计的()A、准确性;B、精确性;C、显著性;D、可靠性11.在总体均值和总体比率的区间估计中,允许的极限误差由()确定。
A、置信水平B、统计量的抽样标准差C、置信水平和统计量的抽样标准差D、统计量的抽样方差12.下面的说法正确的是()A、一个无偏的估计量意味着它非常接近总体的参数;B、一个无偏的估计量并不意味着它等于总体的参数;C、一个有效的估计量意味着它更接近总体的参数;D、一个有效的估计量意味着它等于总体的参数。
13.在假设检验中,“=”总是放在( )A、原假设上;B、备择假设上;C、可以放在原假设上,也可以放在备择假设上;D、有时放在原假设上,有时也放在备择假设上14.在假设检验中,原假设总是表示( )A、总体参数会变大;B、总体参数会变小;C、总体参数没有变化;D、样本统计量没有变化。
15.P值的大小()A、与拒绝原假设的对或错有关;B、与拒绝原假设的对或错无关;C、与拒绝备择假设的对或错有关;D、与观测数据出现的经常程度有关。
一、单项选择题(每小题1分,共15分)DDCDB AACCB CBACB二、简答题(每题5分,共20分)16、常见变异指标有哪些?变异指标的主要作用有哪些?1)常用的变异指标主要有:极差、四分位差、平均差、标准差、离散系数、异众比率。
2)变异指标的主要作用:①说明数据的离散程度,反映变量的稳定性、均衡性。
②衡量平均数的代表性③在统计推断中,变异指标常常还是判别统计推断前提条件是否成立的重要依据,也是衡量推断效果好坏的主要尺度。
17、确定检验统计量时应考虑哪些因素?(10分)答:主要考虑:1)总体的分布;2)总体的方差已知还是未知;3)样本容量的大小18、二手资料与一手资料有何不同?使用二手资料时应注意哪些问题?二手资料是指与研究内容有关的信息,只需重新加工、整理的资料(2分);而一手资料是指必须通过调查和实验的方法直接获得的资料(2分)。
注意问题:①资料的可信度;②资料的时效性;③资料的产生背景;④数据质量;⑤要注意数据的定义、含义、计算口径和计算方法;⑥注明数据来源。
(各1分)19、什么是参数最小二乘估计?最小二乘法是指使因变量的观察值y i与估计值y iˆ之间的残差平方和达到最小来求得βˆ0和βˆ1的方法(5分),即.min1)ˆˆ()ˆ(22==∑--∑-xyyy iiiiββ(2分)然后对该式求相应于βˆ0和βˆ1的偏导数并令其等于零,便可求出βˆ和βˆ1(3分)。
三、计算题(共70分)20、1. (10分)某公司付给生产一线雇员的平均工资是每小时15美元。
该公司正计划建造一座新厂,备选厂址有好几个地方。
但是,能够获得每小时至少15美元的劳动力是选厂址的主要因素。
某个地方的40名工人的样本显示:最近每小时平均工资是x=14美元,样本标准差是s=2.4美元。
问在α=0.01的显著水平下,样本数据是否说明在这个地方的工人每小时的平均工资大大低于15美元?已知326.201.0=z ,426.201.0=t (10分)解:15:,15:10<≥μμH H检验统计量为:n s x z /μ-= , 拒绝域为: 326.201.0-=-=-<z z z α由已知计算得:635.240/4.21514/-=-=-=n s x z μ由于01.0635.2z z -<-=,故拒绝原假设,即可认为该地区的平均工资确实大大低于15美元。
或检验统计量为:ns x t /μ-= , 拒绝域为: 426.201.0-=-=-<t t t α由已知计算得:635.240/4.21514/-=-=-=n s x t μ由于 01.0635.2t t -<-=,故拒绝原假设,即可认为该地区的平均工资确实大大低于15美元。
21、一家知名螺杆生产厂家一个生产车间某天的生产数量(单位:根)如下所示: 41,25,29,47,38,34,30,38,43,40 46,36,45,37,37,36,45,43,33,44 35,28,46,34,30,37,44,26,38,44 42,36,37,37,49,39,42,32,36,35根据以上数据进行适当分组,编制频数分布表,并绘制直方图。
解:频数分布表如下:一生产车间某天产量分组表按产量分组(万元) 频数(天) 频率(%) 25~30 4 10.0 30~35 6 15.0 35~40 15 37.5 40~45 9 22.545~50 6 15.0 合计 40 100.0 直方图(略)22、已知甲、乙两个班学生的成绩资料如下:甲班的平均成绩为78.5分,成绩标准差是9.58分;乙班的资料见下表:计算:(1)乙班学生的平均成绩、成绩标准差和标准差系数; (2)哪个班的平均成绩更具有代表性?为什么?∴(1))(4.73503670分乙==∑∑=f xf x ()()分乙84.1044.1175058722≈==∑-∑=ffx x σ %77.14%1004.7384.10%100≈⨯=⨯=乙乙乙x v σσ (2)具有代表性!乙班学生的平均成绩更甲班学生的平均成绩比又,乙甲甲甲甲甲甲∴≈⨯=⨯=∴==σσσννσνσ %20.12%1005.7858.9%10058.95.78x x23、某快餐店某天随机抽取49名顾客对其的平均花费进行抽样调查。
调查结果为:平均花费8.6元,标准差2.8 元。
试以95.45%的置信度估计:(1)该快餐店顾客总体平均花费的置信区间及这天营业额的置信区间(假定当天顾客有2000人);(2)若其他条件不变,要将置信度提高到99.73%,至少应该抽取多少顾客进行调查?(提示:69.10455.0=z ,22/0455.0=z ;32/0027.0=z ,78.20027.0=z ) 1、4.0498.2==x μ,8.04.02=⨯=∆x总体均值的置信区间:(8.6-0.8,8.6+0.8)即(7.8,9.4)元 营业总额的置信区间:(2000*7.8,2000*9.4)即(15600,18800)元。
必要的样本容量: 11125.1108.08.2*922===n 24、某公司的10家下属企业的产量与生产费用之间关系如下:要求:(1)计算相关系数并进行显著性检验;(2)拟合回归方程; (3)计算估计标准误差yx S2222221657277119107777090310165777713293810)()(-⨯-⨯⨯-⨯=---=∑∑∑∑∑∑∑y y n x x n y x xy n r =0.808(2)=-⨯⨯-⨯=--=∑∑∑∑∑22217777090310165777713293810)(ˆx x n y x xy n β0.398789.13410777398.0101657ˆˆ1=⨯-=⨯-=∑∑n x ny ββ回归方程为:x y398.0789.134ˆ+= (3)8132938398.01657789.1342771192ˆˆ102⨯-⨯-=---=∑∑∑n xyy yS yx ββ=10.394练习二一、单项选择题(每题1分,共15分,选出最为恰当的一项)。
1.在假设检验中,原假设总是表示( )A、总体参数会变大B、总体参数会变小C、总体参数没有变化D、样本统计量没有变化2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54794美元,中位数是47543美元,标准差是10250美元。
根据这些数据可以判断,女性MBA起薪的分布状态()A、尖峰,对称B、右偏C、左偏D、均匀3.当()时,均值只受变量值大小的影响,而与次数无关。
A、变量值较大而次数较小B、变量值较大且次数较大C、各变量值出现次数相等D、变量值较小且次数较小4.当数据分布有对称的集中趋势时,其均值()A、趋于变量值大的一方B、趋于变量值小的一方C、趋于权数大的变量值D、趋于哪方很难判定5.某城市对1000户居民的一项调查显示,人均收入在2000-3000元的家庭占24%,在3000-4000元的家庭占26%,在4000-5000元的家庭占29%,在5000-6000元的家庭占10%,在6000-7000元的家庭占7%,在7000元以上的家庭占4%。
从此数据可以判断,该城市收入数据的分布是( )。
A、右偏的;B、左偏的;C、对称的;D、正态的。
6.计算方差所依据的中心数据是()A、众数;B、中位数;C、均值;D、几何平均数7.以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则如下说法正确的是()A、95%的置信区间比90%置信区间宽B、样本容量较小的置信区间较小C、相同置信水平下,样本量大的区间较大D、样本均值越小,区间越大8.在参数估计中利用t分布构造置信区间的条件是()A、总体分布需服从正态分布且方差已知B、总体分布为正态分布,方差未知C、总体不一定是正态分布但须是大样本D、总体不一定是正态分布,但需要方差已知9.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是他与总体参数的离差越小越好。