、单项选择题(每小题 2分,共40分)1要了解某市工业企业生产设备情况,则统计总体是 A.该市工业企业的全部生产设备 B.该市每一个工业企业C.该市工业企业的某一台设备D.该市全部工业企业2 •若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大, 则 (B )A.甲单位的平均数代表性比较大B. 甲单位的平均数代表性比较小C.两单位的平均数一样大D.无法判断3.—个统计总体 (C )A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标4.品质标志的表现形式是(D )A.绝对数B.相对数C.平均数D.文字5.统计工作的各项任务归纳起来就是两条(A )A.统计调查和统计分析B.统计设计和统计研究C.统计预测和统计D.统计服务和统计监督6.对上海港等十多个沿海大港口进行调查, 以了解全国的港口吞吐量情况,则这种调查方 式是(B )A.普查B. 重点调查C.典型调查D.抽样调查7.某连续变量分为五组:第一组为 40〜 50;第二组为 50〜60;第三组为 60〜70;第四组为70〜80;第五组为80以上。
依习惯上规定 (C ) A. 50在第一组,70在第四组 B. 60在第二组,80在第五组C. 70在第四组,80在第五组D. 80在第四组,50在第二组&某城市为了解决轻工业生产情况,要进行一次典型调查,在选送调查单位时,应选择生 产情况()的企业。
(D )该组的分组标志是A.性别 C.文化程度10•变量数列中各组频率的总和应该A.小于1C.大于1A.较好B.中等C.较差D.好、中、差 9 •某厂的职工工人人数构成如下表所示(A )11 •已知变量X 与Y 之间的关系如下图所示,则其相关系数可能为(C )A. 0.1B. 0.9C. -0.9D. -0.112 . 在完成了构造与评价一个回归模型之后,我们可以(D )A.估计未来所需样本的容量B.计算相关系数和可决系数C.以给定的因变量的值估计自变量的值D.以给定自变量的值估计因变量的值 13.回归直线方程,其中x 为自变量,y 为因变量,则B.可以根据y 推断xD.可以互相推断若样本容量n 和置信度1-a 均不变,则对(B ) B.不变D.变低H 1,则称()为犯第二类错误 (C ) B. H 0为真,拒绝比 D. H 0不真,拒绝H 。
(D )B.直线截距a D.可决系数R 2(A )B.圆形图 D.直方图B.次数最多的变量值D.最大的变量值(C )B.非系统性误差 D.偏差 (D )A. Z 检验2C. 'p检验A.可以根据x 推断y C.不能推断14.设总体X 服从正态分布「严「I , ■:■ 于不同的样本观测值,总体均值卩 A.无法确定 C.变高15•在假设检验中,原假设 H o ,备择假设A. H o 为真,接受比C. H 0不真,接受H 。
16 •评价回归直线方程拟合优度如何的指标有A.回归系数b C.相关系数r17 •欲以图形显示两变量 X 与Y 的关系,最好创建A.散点图 C.条形图18 •众数是(B )A.最多的变量值 C.最多的次数19 .在抽样调查中,无法避免的误差是A.登记性误差 C.抽样误差未知。
的区间估计的精确度B. F 检验D. T 检验、判断题(每小题2分,共10 分)1.所谓上组限不在内”原则,是对连续型变量分组采用重合组限时,习惯上规定一般只包括本组下限变量值的单位,而当个体的变量值恰为组的上限时,不包括在本组。
(V)2.当H1为真时拒绝H1,犯了纳伪”错误。
(V3•假设检验范两类错误的概率可以同时控制。
(存4.X、Y两个变量之间,既可由Y对X回归,也可由X对Y回归,于是可产生两个回归系数。
(>)5.按检验假设的形式,可以把假设检验分为左侧检验与右侧检验。
(>三、计算分析题(共计40分)1.一个灯泡制造商的广告上说,他们的长寿命灯泡平均能持续使用5000小时,为了验证这种说法,统计人员随机抽取了100个灯泡,测量每个灯泡的使用时间。
在5%的显著性水平下,我们能否认为这种说法是正确的?请按顺序回答下列问题:3 (2分)用原假设与备择假设描述该检验问题。
H0 :平均寿命达到5000小时H1 :平均寿命不等于5000小时4 (4分)定义在该检验中,可能发生的两类错误。
第一类弃真错误:平均寿命真实结果等于5000小时,但检验结论却认为不等于5000小时。
第二类纳伪错误:平均寿命真实情况是不等于5000小时,但检验结论却认为等于5000小时。
Statistics Std Error r cost^ Mean*31810.1563^ - 40.43077^95% Confidence IntervalLower BouncP 1729.361B^forMean^Upper Sound*1 51890.9507^5% Trimmed Mean*31003.2936^Variance^104617.436^p4Std. Deviation*3玄 44b1 阳Minimum^ M250.0C^MaximurrM 32600.00+1Stow 熾仪[328^ .299*3Kurtosis#3-.472^590+3(1)( 2分)当置信水平为 95 %时,试确定度假费用的点估计量。
(1810.1563)(2)( 4分)在95%的置信水平下,抽样误差为多少?(1890.9507-1810.1563=80.7944)(3)( 4分)确定每人最近度假费用 95 %的置信区间。
[1729.3618,1890.9507]3.某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。
样本中每个人 都分别在看过该产品的新的电视广告之前与之后打分。
潜在购买力的分值在0〜10分,值越高表示潜在购买力越高。
根据下列检验报告,回答如下问题:5 ( 4分)由检验报告给出的检验的结果,并对该广告给予评价。
结果显示sig 值0.217大于显著性水平0.05,所以广告并未显著提高潜在购 买力。
4.从某大学统计系的学生中随机抽取 16人,对数学和统计学的考试成绩(单位:分)进行 调查,结果如下:Paired Differences*Mean*3std. Devi ation*3 std ErrorMean*5 95% Confidence Interval or the Difference*7Lower*3UppersPair 佃广告后广告前心 ■^uGSSOO*1.30247* ..46049+ -1713 妙.46339+-1.357*217^Paired Samples Test^Sig 肱七iled 护Moctei Summary-Model*3R Square** Adjusted RSquare-Std Error ofthe Estimates7B5(a>.616- 538+B50939*Cxffi 氓玳呦卜」Models•Q 口目刼。
處[Qi.轰aCoef fl clients^Standardized Coefficients^Sig*羊Std. ErrorsBeta*3pConstant}*5.422* 15.062*.360*724+数学成绩卩.943* .199^784 738*OOCh(1) (2分)根据这些数据,绘制出如下散点图,请说明这两个变量之间存在什么关系?根据散点图可以看出两个变量之间存在一定的线性关系,并且是正相关。
(2) ( 4分)拟合统计学考试成绩对数学考试成绩的回归直线。
根据回归分析报告, 可以得到回归直线方程: Y = 5.422+0.943X (其中Y :统计成绩X :数学成绩)(3) ( 2分)估计的回归方程对数据的拟合好吗?请作出解释。
根据拟和优度指标 R Square 值:0.616,拟和效果不够好。
(4) (2分)t 检验是否表明在数学成绩和统计学成绩之间存在显著的关系?你的结论是什 么?取 a =0.05。
T 检验统计量的Sig 值小于显著性水平,故变量间的线性关系是显著的。
(5) ( 4分)对于数学考试成绩为 80分的学生,估计他的统计学考试成绩。
( 80.862 )四、简答题(共计 25分)1. (4分)美国商务部报告说 1994年申请马尔科姆国家质量奖的公司中,23家来自于大型制造业公司,18家来自大型服务公司,30家来自小企业。
要求:(1 )企业类型是定性变量还是定量变量? (定性变量)(2 )来自小企业的申请的百分比是多少?(42% )2. (6分)一个农民在四个果园中种植了苹果树,这些果园分别位于农场的不同地方。
每个1加血— co 一的站一70. CO 一&0 C0 一50JOO 一50.0060. 0070. oo so. on90.00果园种植了200棵苹果树,为了跟踪这些果树的情况,农民对它们按1至800进行了编号,现在,这名农民相俩界这些苹果树是否受到某类昆虫的侵害,为此他并没有检查所有800棵苹果树的情况,而是决定从中选取80棵果树进行检查,他打算采用以下三种抽样方案:方案A :从800棵苹果树中随机抽取80棵果树。
方案B :在编号为1至10的苹果树中随机抽取1棵果树,然后每隔10棵果树抽取1棵果树。
方案C :从4个果园中随机抽取2个果园,并从被挑中的每个果园中随机抽取40棵果树。
请指出上述三个方案分别为哪三种抽样方式。
分别为:A (简单随机抽样方法) B (系统抽样)C (分群抽样)。