中央财经大学2011-2012学年第二学期《统计学》试题专业___________________ 学号_____________ 姓名_______________注意事项:1.考试中可以使用计算器。
2.本试卷共有四道大题,请不要漏答。
3.考试时间为110分钟,请注意合理分配考试时间。
4.答题中可能用到的部分公式已经附在试卷末尾供参考。
5.试卷不得带出考场,交卷时请将试卷和答题纸分开。
6. 可以把试卷的空白处用作草稿纸,不另附草稿纸。
7. 所有假设检验中显著性水平α都取为0.05,不再另行说明。
8.请将所有答案写在答题纸对应的位置上或者写清题号,评分只以答题纸为准。
空间不足时可在答题纸背面答题。
一、单项选择题(选出最为恰当的一项。
每题1分,共20分)。
1. 根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是A、名义尺度B、顺序尺度C、定距尺度D、定比尺度2. 某市场调查公司为了对一家大型商场做顾客满意度调查,对不同性别和年龄的顾客按事先规定的人数随意进行了一些调查询问,这种调查属于A、整群抽样B、分层抽样C、配额抽样D、方便抽样3. 进行抽样调查,当总体内部差异较大且有明显的不同类型界限或标志时,通常采用A、简单随机抽样B、系统抽样C、整群抽样D、分层抽样4. 一组数据的偏度系数为-3,则该数据的统计分布应具有如下特征A、尖峰分布B、扁平分布C、左偏分布D、右偏分布5. 在一项抽样调查中,由于抽样随机性造成的误差属于A、抽样误差B、抽样框误差C、无回答误差D、计量误差6. 观测数据序列为,1,3,3,7,9,25。
则数字“3”的秩为:A、2B、2.5C、3D、以上都不对7. 观测数据序列为,1,3,3,7,9,25。
则这组数据的中位数等于:A、3B、5C、7D、以上都不对8. 如果假设检验中原假设为H0: μ≥μ 0,备则假设为H1:μ<μ 0,则该检验是A、左侧检验B、右侧检验C、双侧检验D、独立样本检验9. 要描述我国国内生产总值的三次产业构成,最恰当的图形是:A、线图B、直方图C、茎叶图D、饼图10. 某地粮食总产量比去年增长了10%,粮食播种面积增长了5%,则粮食平均亩产量增长了:A、0.5%B、2%C、4.8%D、5%11. 用SPSS软件对变量做描述统计分析时,会计算“标准差”和“标准误”。
以下说法正确的是:A、标准差反映了样本均值抽样分布的离散程度B、标准误反映了样本均值抽样分布的离散程度C、标准差反映了变量的集中趋势D、标准误反映了变量的集中趋势12. 在一项抽样调查中采用有放回的简单随机抽样,已知最大允许误差为5,置信度为95%,总体标准差为50,则必要样本容量为:A、20B、196C、385D、以上都不对13. 对于一个平稳的时间序列,其自相关和偏自相关函数都是拖尾的,则该序列最可能适合的模型形式是:A、AR模型B、MA模型C、ARMA模型D、以上都不对14. 多元回归分析中修正的R2:A、可以是负值B、取值在0-1之间C、总是大于R2D、与方程中自变量的个数无关15. 对1,2,5,7,10共5个数做系统聚类分析,则以下说法正确的是A、最先聚在一起形成一类的是1和2B、最后聚在一起形成一类的是1和2C、最先聚在一起形成一类的是7和10D、不能确定,因为未说明距离的计算方法16. 系统聚类分析中计算个体之间的距离可以使用的方法是:A、最短距离B、最长距离C、平均距离D、欧式距离17. 为了检验两个独立样本对应总体的均值是否相等,可以使用的检验方法是A、Kruskal-Wallis检验B、Wlicoxon秩和检验C、独立样本t检验D、匹配样本t检验18. 使用K-S检验来进行正态性检验时,以下说法正确的是:A、检验的原假设是样本服从正态分布B、检验的备择假设是样本服从正态分布C、检验的原假设是总体服从正态分布D、检验的备择假设是总体服从正态分布19.回归分析中的最小平方法是使______达到最小。
A、残差之和B、残差平方和C、残差绝对值之和D、因变量的离差平方和20. 在对多个ARIMA模型进行比较以选择模型时,以下最为恰当的指标是A、模型的R2B、模型的BIC值C、模型的估计标准误D、模型的t检验值二、多项选择题(至少有一个选项是正确,多选、少选均不得分。
每题2分,共10分)。
1. 以下关于面访调查的说法正确的有:A、一般有较高的回答率B、调查成本相对较低C、调查的时效性高,可以迅速获得调查结果D、适合对敏感性问题的调查E、可以询问比较复杂的问题2. 多元线性回归分析中,需要以下哪些假设条件以保证OLS估计量的优良性质?A、模型中随机误差项的方差保持不变B、模型中随机误差项之间不存在自相关C、自变量和因变量之间高度相关D、自变量之间相互独立E、自变量之间不存在完全的多重共线性3. 以下关于χ 2检验的说法正确的有:A、可以用来检验两个定性变量是否相互独立B、可以用来检验单个定性变量是否服从正态分布C、可以用来检验单个定量变量是否服从正态分布D、要求每个分组(单元格)中的观测频数大于等于5E、是一种参数检验方法4. 以下以Kruskal-Wallis检验的输出结果,根据结果以下正确的有:工资卡方12.316df 3渐近显著性0.006A、检验中需要假设各个子总体的方差相等B、检验结论是各个子总体的均值不全相等C、检验结论是各个子总体的中位数不全相等D、从表格可以看出检验中总共涉及4个子总体E、从表格可以看出检验中总共涉及3个子总体5. 对x和y两个变量计算相关系数并进行假设检验的结果如下表,则相关说法正确的有:相关性X yx Pearson 相关性 1 .271**显著性(双侧).006N 100 100y Pearson 相关性.271** 1显著性(双侧).006N 100 100**. 在 .01 水平(双侧)上显著相关。
A、以y为因变量,x为自变量做回归(包含常数项),则方程的判定系数0.073。
B、以y为因变量,x为自变量做回归(包含常数项),则方程的判定系数0.271。
C、对相关系数的假设检验中p值=0.271。
D、对相关系数的假设检验中p值=0.006。
E、假设检验的结果是拒绝原假设,认为两个变量的相关系数是显著的。
三、判断题(正确的在答题纸相应位置打√,错误的打×。
每题1分,共10分)1.定性变量不能计算算术平均数。
2.对于等间隔的时点序列,将所有数值之和除以数据个数即可以计算出平均发展水平。
3.由于调查中被调查者一般不愿意如实回答敏感性问题,因此调查问卷中不应该包含此类问题。
4.基于两个独立样本对两个总体的均值进行假设检验时,需要先检验两个总体的方差是否相等。
5. Wlicoxon符号秩检验可以用来检验两个独立样本的中位数是否相等。
6.方差分析中的因变量也称为因素。
7. 在多元线性回归分析中,如果在t检验中所有的自变量都不显著,则方程在整体显著性的F检验中一定是不显著的。
8. 计算加权综合指数时,如果同度量因素固定在基期,则相应的指数称为拉氏指数。
9. 因子分析中必须先对变量进行标准化以消除计量单位对计算结果的影响。
10.聚类分析中可以通过共同度这一指标来比较聚类效果的好坏。
四、计算和案例分析题(共60分)。
1.(9分)人民网在6月6日推出的“如何看待人保部拟适时建议弹性延迟领养老金年龄”调查显示,截止到6月11日下午14点,该调查已有超过80万人参加,其中,超过75万人表示反对,占93.7%;有2.5%的人表示支持,2.1%的人持中立态度。
对于这一调查结果,人社部认为“网络调查具有一定片面性,上网的人多数比较年轻,某种意义上老人占位子,年轻人压力会很大,网上很难展现出全景的结果,需要对不同行业、单位、层级的人进行调查。
”(1)你如何看待网络调查结果的代表性?(3分)(2)如果由你来设计一个调查,要求在短时间内了解全国15-64岁人口对延迟退休年龄的态度,你将采用何种调查方法?通过何种方式收集数据?为调查设计3-5个封闭式的问题和备选答案。
(6分)2.(8分)中国统计年鉴公布的我国2007-2010年的居民消费价格指数(CPI)和居民消费支出数据见下表(当年价格)。
居民消费价格指数居民消费支出(当年价格,亿元)2007 104.8 95609.82008 105.9 110594.52009 99.3 121129.92010 103.3 133290.9(1)简要说明居民消费价格指数的含义和统计方法。
(2)计算以2007年价格表示的各年居民消费。
(3)以2007年为基期,计算2008-2010年我国实际居民消费支出的年平均增长率。
3、(8分)要检验一种新的操作方法是否能够增加钢产量,在10个平炉中分别用原有的操作方法炼一炉,再用新操作方法炼一炉。
用X1和X2分表表示原操作方法和新操作方法产量。
对测试结果用匹配样本t检验进行分析,SPSS的部分输出结果如下。
(1)写出检验中的原假设和备择假设。
(2)写出检验的p值以及检验的结论。
(3)如果差值序列不服从正态分布,可以使用哪种非参数检验方法进行假设检验?4、(9分)为了测试4种不同的原材料对产品使用寿命的影响,随机抽取4种不同原材料的产品若干件测试其使用寿命,对实验数据进行单因素方差分析的结果如下,请据此回答问题。
(1)请判断数据是否满足方差分析关于“方差齐性”的假设条件,并给出依据;(2)请计算方差分析表中A、B、C、D、E五项数值;(3)根据方差分析的结果,能否认为4种材料的产品使用寿命有显著差异?5. (6分)SPSS软件估计的一个AR(2)模型(不包含常数项)的结果如下。
ARIMA 模型参数估计SE t Sig.x-模型_1 x 无转换AR 滞后1 .550 .109 5.065 .000滞后 2 .275 .109 2.515 .014 (1)写出模型表达式(3分);(2)已知x最近3期(t-2、t-1、t)的值分别为0.11,1.04和0.12,请根据模型预测t+1时刻x的值。
(3分)6、(12分)一家大型超市每个月都会由于偷窃行为造成一定的损失。
以各个月份的损失额(Y,美元)为因变量,员工人数(X1,人)、交易量(X2,笔数)为自变量的回归结果如下:(1)请写出估计的回归方程,并说明回归系数的含义。
(2)说明模型估计标准误的含义。
已知Y 的均值为3300美元,计算一个离散系数来反映模型的拟合效果。
(3)分析方程t 检验和F 检验的结果。
(4)某一个月份职工人数为200人,交易笔数15618笔。
根据模型估计该月份的偷窃损失。
7. (8分)一项研究中试图比较多个城市综合发展水平的差异。
研究中选择的变量如下: X1:年末总人口 ; X2:地区生产总值 X3:城乡居民储蓄余额 ; X4:在岗职工平均工资 X5:年末邮政局数 ; X6:社会商品零售总额 ; X7:医院卫生院个数以下是使用主成分方法提取因子、采用最大方差法进行因子旋转得到的因子分析的部分结果。