当前位置:文档之家› 统计学阶段性作业3

统计学阶段性作业3

中国地质大学(武汉)远程与继续教育学院统计学 课程作业3(共4次作业)学习层次:本科 涉及章节:第7章——第11章1、一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60克一袋的那种土豆片的重量不符。

店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(克)μ进行检验,假设陈述如下:如果有证据可以拒绝原假设,店方就拒收这批炸土豆片并向供应商提出投诉。

(1)与这一假设检验问题相关联的第一类错误是什么? (2)与这一假设检验问题相关联的第二类错误是什么?(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为严重?2、某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。

研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。

假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。

(1) 选择检验统计量并说明其抽样分布是什么样的? (2) 检验的拒绝规则是什么?(3) 计算检验统计量的值,你的结论是什么? 3、一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。

据报道,10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平α=0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?4、一个著名的医生声称有75%的女性所穿鞋子过小。

一个研究组织对356名女性进行了研究,发现其中有313名妇女所穿鞋子的号码至少小一号。

取α=0.01,检验如下的假设:75.0:0=πH 75.0:1≠πH 对这个医生的论断你有什么看法?5、从三个总体中各抽取容量不同的样本数据,得到如下资料。

检验3个总体的均值之间是否有显著差异?(α=001.)(专科不要求) 样本1 样本2 样本3 158148 161 154 169153 142 156 149169 158 1806、某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据如下:试验号 电池生产企业A B C 1 2 3 4 550 50 43 40 3932 28 30 34 2645 42 38 48 40试分析三个企业生产的电池的平均寿命之间有无显著差异?(α=005.)如果有差异,用LSD 方法检验哪些企业之间有差异(专科不要求)?7、表中是道琼斯工业指数(DJIA )和标准普尔500种股票指数(S&P500)1988年至1997年对应股票的收益率资料:年份 DJIA 收益率(%) S&P500收益率(%) 年份DJIA 收益率(%)S&P500收益率(%)1988 16.0 16.6 1993 16.8 10.1 1989 31.7 31.5 1994 4.9 1.3 1990 -0.4 -3.2 1995 36.4 37.6 1991 23.9 30.0 1996 28.6 23.0 19927.47.6199724.933.4计算两种指数收益率的相关系数,分析其相关程度,并以0.05的显著性水平检验相关系数的显著性。

8、在计算一元线性回归方程时,已得到以下结果:试根据此结果,填写下表的空格:9、某县城研究居民月家庭人均生活费支出和月家庭收入的相关关系,随机抽查10户进行调查,其结果如下:来 源 平方和 自由度 方差 来自回归 2179.56来自残差 99.11 22 总离差平方和 2278.67200时,其人均生活费应为多少?(4)求估计标准差,当概率为95.45%、x 为200时的y 的估计区间。

10、设x 、y 是存在相关关系的两个变量,并已算得如下数据:5x =,10y =,225x σ=,264y σ=, 1.28b =。

试求:(1)回归方程。

(2)相关系数。

(3)决定系数,并解释决定系数的意义。

11、表中是1992年亚洲各国人均寿命(y )、按购买力平价计算的人均GDP (1x )、成人2x 3x(1)用多元回归的方法分析各国人均寿命与人均GDP 、成人识字率、一岁儿童疫苗接种率的关系;(2)对所建立的回归模型进行检验。

(要求使用EXCEL 或其他统计软件计算,专科不要求)12、欲研究不同收入人群对特定商品是否有相同的购买习惯,研究人员调查了四个不同收入人群的消费者527人,购买习惯分为三种情况,见表。

要求:(1)提出假设;(2)计算卡参考答案1、(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。

2、解:(1)检验统计量n s x z /μ-=,在大样本情形下近似服从标准正态分布;(2)如果05.0z z >,就拒绝0H ;(3)检验统计量z =2.94>1.645,所以应该拒绝0H 。

3、解:z =3.11>1.28,拒绝0H 。

4、解:z =7.48>2.58,拒绝0H 。

5、解:按照方差分析步骤,先做出假设,再用EXCEL 计算统计量,有: 差异源 SS dfMS FP-valueF crit 组间 618.91672 309.4583 4.6574 0.0408778.02151731组内5989 66.44444总计 1216.917 110215.86574.401.0=<=F F或01.00409.0value =>=-αP ,不能拒绝原假设。

6、解:用EXCEL 计算后有: SUMMARY组 观测数求和平均方差A 5 222 44.4 28.3B 5 150 30 10C 521342.615.8差异源 SS dfMS FP-valueF crit组间 615.6 2307.8 17.068390.00031 3.885294组内216.412 18.03333总计 832 148853.30684.1705.0=>=F F或05.00003.0value =<=-αP ,拒绝原假设。

经过多重比较,85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设; 85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。

7、解:(1)利用Excel 计算结果可知,相关系数为 0.948138XY r =,说明相关程度较高。

(2)计算t 统计量2.6817398.4370.317859t ==== 给定显著性水平=0.05,查t 分布表得自由度n -2=10-2=8的临界值t α为2.306,显然2t t α>,表明相关系数 r 在统计上是显著的。

8、解:9、解:(1)绘制散点图如下:(2)为计算相关系数,先编制一张相关系数计算表如下:(2)相关系数计算表因此,相关系数为:0.976r ====(3)设月人均消费支出y 关于月人均收入x 的直线回归方程为ˆya bx =+根据最小平方法,有22377500.46()82500n xy x y b n x x ∑-∑∑===∑-∑10210.46145035.7510y b x a n ∑-∑-⨯===所以直线回归方程为ˆ35.750.46yx =+ 月人均收入为200时,估计月人均生活费用为:ˆ35.750.46200127.27()y=+⨯=元 (4)估计标准差为3.27y S ===当x 为200时,y 的估计区间为:ˆ127.272 3.27120.73~133.81()y ytS ±=±⨯=元10、解:(1)10 1.285 3.6a y bx =-=-⨯=回归方程为:ˆ3.6 1.28y x =+(2)1.280.8x y r bσσ===(3)220.80.6464%r ===,表明y 的变化中有64%由x 决定。

11、解:由Excel 回归输出的结果可以看出:方差分析df SS MS F Significance F 回归分析 3 1937.749 645.9162 58.20479 1.83316E-09 残差 18 199.7515 11.0973 总计 21 2137.5Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 32.99309 3.138595 10.51206 4.12E-09 26.39914416 39.58703275 X Variable 1 0.071619 0.014755 4.853871 0.000128 0.040619648 0.102617688 X Variable 2 0.168727 0.039956 4.222811 0.000512 0.084782234 0.252671203 X Variable 3 0.179042 0.048869 3.663731 0.001776 0.076372446 0.281711103(1)回归结果为^23332.993090.0716190.1687270.179042i i i i Y X X X =+++(2)由Excel 的计算结果已知:1234,,,ββββ对应的 t 统计量分别为10.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值0.025(224) 2.101t -=,所以各个自变量都对Y 有明显影响。

由F=58.20479, 大于临界值0.05(41,224) 3.16F --=,说明模型在整体上是显著的。

12、解: (1)01234H ππππ===:,11234,,,H ππππ:不完全相等(2)220()17.626e ef f f χ-==∑(3)显著性水平为0.1时,2(2*3)10.65χ=,故拒绝原假设,即不同收入人群的购买情况不同。

相关主题