浙江师范大学《统计学》期终试卷(A 卷)1 (2013—2014学年第二学期)2考试类别 闭卷 使用学生 12级工商管理类 专业本3 科4考试时间 120 分钟 出卷时间 2014 年 6 月 4 日 5说明:考生应将全部答案写在答题纸上,否则作无效处理。
67 一、填空题(每小题2分,共30分)81. 推断统计是根据 对 进行估计、假设检验、预9 测或其他推断的统计方法。
102. 抽样调查中误差的来源有_________和_________两类。
113. 假定总体共有1000个单位,均值为32,标准差为5。
采用不重复抽样12 的方法从中抽取一个容量为30的简单随机样本,则样本均值的标准差为 13 (保留4位小数)。
144. 和 是从数据分布形状及位置角度来考虑的集中趋势15 代表值,而 是经过对所有数据计算后得到的集中趋势值。
165. 如果估计量1ˆθ与2ˆθ相比满足 ,我们称1ˆθ是比2ˆθ更有效的17 一个估计量。
186. 当 时,我们称估计量ˆθ是总体参数θ的一个无偏估计量。
197. 从标准差为的正态总体中抽取容量为n 的样本,样本均值为x ,在20小样本条件下,总体均值在1-置信水平下的置信区间为(写出公21 式) 。
228. 在假设检验中,第一类错误又称弃真错误,是指 。
239. 若居民在某月以相同的开支额购买到的消费品比上月减少10%,则消24 费价格指数应为(用百分比表示,保留到整数) 。
2510. 某学校学生在统计学考试中的平均得分是70分,标准差是3分,从该26 校学生中随机抽取36名,计算他们的统计学平均成绩,则平均分超过71分的27 概率是(用标准正态分布函数表示) 。
2811. 由统计资料得知,1989年某地新生儿的平均体重为3190克,现从199029 年的新生儿中随机抽取100个,测得其平均体重为3210克。
要检验1990年的30 新生儿与1989年相比,体重是否有显著差异,其原假设与备择假设31 是 。
3212. 总体回归函数是将因变量y 的__________表示为自变量x 的函数。
3313. 根据高斯—马尔可夫定理,在基本假定满足的条件下,回归系数的最34 小二乘估计是 。
3514. 根据某商业企业2007-2011年五年内商品销售额x (万元)和商业利36 润y (万元)资料计算的有关数据如下:37222100,560,890000,240170,75000x y xxy y =====∑∑∑∑∑38则商业销售额与商业利润的样本相关系数 。
3915. 在上题中,估计样本回归方程ˆˆˆyx αβ=+,则ˆβ= 。
40二、单项选择题(每小题2分,共20分)411. 最近发表的一份报告称,由“150部新车组成的一个样本表明,外国42 新车的价格明显高于本国生产的新车”。
这是一个( )的例子43A. 随机样本B. 描述统计C. 统计推断44D. 总体452. 在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准46 差是5分,中位数是86分,则新员工得分的分布形状是( )47A. 对称的B.右偏的C. 左偏的D.48 无法确定493. 某学校学生的年龄分布是右偏的,均值为22,标准差为4.45。
如果采50 取重复抽样的方法从该校抽取容量为100的样本,则样本均值的抽样分布是(51)52A. 分布形状未知,均值为22,标准差为0.445 53B. 分布形状未知,均值为22,标准差为4.45 54C. 正态分布,均值为22,标准差为4.45 55D. 正态分布,均值为22,标准差为0.445564. 正态总体方差未知时,在小样本条件下,检验总体均值使用的统计量57 是( )58A. (0,1)x z N = B. (0,1)x z N =59C. ()/x t t n nσ-=D. (1)/x t t n s n-=-605. 在一次假设检验中,若当显著性水平α=0.01原假设被拒绝,则用61 α=0.05时( )62A. 一定不拒绝原假设B. 有可能拒绝原假设63C. 需要重新检验D. 一定会拒绝原假设646. 在回归模型y=+x+中,反映的是()65A 、 由于x 的变化引起的y 的线性变化部分 66B 、 由于y 的变化引起的x 的线性变化部分67C 、 除x 和y 的线性关系之外的随机因素对y 的影响 68D 、 由于x 和y 的线性关系对y 的影响697. n 个相互独立的标准正态分布的平方和服从()70A. 参数为n 的2χ分布B. 参数为(n,1) 的F 分布 71C. 参数为(1,n ) 的F 分布D. 参数为n 的t 分布728. 当置信水平一定时,置信区间的宽度( )73A. 随着样本容量的增大而增大B. 随着样本容量的增大而减74 小75C. 与样本容量的大小无关D. 与样本容量的平方根成正76 比779. 由最小二乘法得到的回归直线,要求满足因变量的( )78A. 平均值与其估计值的离差平方和最小B. 实际值与其平均值的79 离差平方和最小80C. 实际值与其估计值的离差和为0D. 实际值与其估计值的离差81 平方和最小8210. 某造纸厂2002年的产量比2001年增长了13.6%,生产费用增加了83 12.9%,则该厂2002年单位产品成本( ) 84A 、减少了5.15%B 、减少了0.62%C 、增加了12.9%D 、增85 加了1.75%8687 三、判断题(每小题1分,共6分)881. 在分组数据中,利用组中值计算均值时假定各组数据在各组中是均匀89 分布的,计算结果是准确的( )902. 测定离散程度时,只有全距才易受极端值的影响( )913. 若随机变量X ~N(µ,σ2),则随着σ的增大,概率P{|X-µ|<σ}将保92 持不变。
( )934. 简单随机抽样中,重复抽样的抽样标准误差小于不重复抽样的抽样标94 准误差。
( )955. 在线性回归方程ˆ48.53 2.87i iY X =+中,2.87说明X 平均增加一个单位,96 Y 会增加2.87个单位。
( )976. 置信区间的长度与置信水平成正比,即置信水平越高,置信区间越长。
98 ( )99四、简答题(每小题5分,共10分)1001、中心极限定理的含义是什么?1012、什么是抽样误差?其特点是什么?102五、计算分析题(共34分)1031、(8分)从某车间抽查30名工人周加工零件数的频数分布如下表:104计算30名工人周加工零件数的均值、方差和偏态系数(偏态系数不用105计算最后结果)。
1062、(8分)在一项家电市场调查中,随机抽取了300个居民户,调查他们是否107拥有某一品牌的电视机。
其中拥有该品牌电视机的家庭占25%。
求总体比率的置信108水平为95%的置信区间。
1093、(8分)一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,110 假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。
据报道,111 10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平α=0.01,112 这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增113 加了”?1144、(10分)已知某地区2007年的农副产品收购额为380亿元,2008年比上115 年的收购总额增长13%,农副产品收购价格总指数为105%。
问,2008年与2007116 年对比:117 (1)农民因销售农副产品共增加多少收入?118 (2)农副产品收购量增加了百分之几?农民因此增加了多少收入? 119 (3)由于农副产品收购价格提高5%,农民增加了多少收入?120121 注:122 0.0250.0250.0250.050.010.005(25) 2.0595,(24) 2.0639, 1.96, 1.645, 2.33, 2.58t t z z z z ======123124 2014上《统计学》期终试卷(A 卷)答案及评分标准125一、填空题(每小题2分,共30分)1261、样本信息,总体2、抽样误差、非抽样127 误差1283、0.89954、众数、中位数,均值1295、12ˆˆ()()D D θθ<6、ˆ()E θθ= 1307、/2x z α± 8、原假设为真时拒绝131原假设时所犯的错误1329、111% 10、1-Φ(2)= Φ(-2)13313411、01:3190,:3190H H μμ=≠12、条件期望 13513、最佳线性无偏估计14、0.501413615、0.6213137138 二、单项选择题(每小题2分,共20分)1391、C2、C3、D4、D5、D1406、A7、A8、B9、D10、B141142 三、判断题(每小题1分,共6分)1431、×2、√3、√4、×5、×6、√144145 四、简答题(每小题5分,共10分)1461、从任意一个均值为μ,方差为2σ的总体中重复地抽取容量为n 的样本,当147n 充分大时(通常要求n ≥30),样本均值的抽样分布近似服从均值为μ、方差为2nσ148 的正态分布1492、答:抽样误差是利用样本推断总体时产生的误差。
150特点:151对任何一个随机样本来讲都是不可避免的; 152是可以计量的,并且是可以控制的; 153样本的容量越大,抽样误差就越小; 154总体的变异性越大,抽样误差也就越大。
155156 五、计算分析题(共34分)1571、解:11853957105121156125230ki ii kii x fx f==⨯+⨯+⨯+⨯+⨯==∑∑ 312010430==1582分15916022122222()1(85104)3(95104)7(105104)12(115104)6(125104)2112.7629ki i i x x f s n =-=--⨯+-⨯+-⨯+-⨯+-⨯==∑1611626分163313333331.5()(85104)3(95104)7(105104)12(115104)6(125104)230112.76kiii x x f SK ns =-=-⨯+-⨯+-⨯+-⨯+-⨯=⨯∑ 1648分1652、解:p=25%,n=300,z 0.025=1.96 3分166/2(1)25%(125%)25% 1.9630025% 1.96 2.5%25% 4.9%(20.1%,29.9%)p p p z nα-±-=±⨯=±⨯=±=8分1673、解:H 0:6.70,H 1:> 6.701682分169检验统计量 3.112.5200 2.5200x t -===4分170= 0.01,n = 200,临界值:0.010.01(199) 2.33t z ≈=1710.013.11(199) 2.33t t =>=6分172所以拒绝原假设,表明“如今每个家庭每天收看电视的平均时间增加了”。