统计学实验内容一、频数统计1.A公司在招聘时采用了综合能力测试(满分为100分),由于应聘的人数较多,现随机抽取了157名应聘者的测试成绩,其测试分数的数据如book1所示。
(1)根据上面的资料,进行分组,并确定组数和组距。
根据资料判断,进行分组,分为六组,组距为10。
(2)编制频率分布表上限成绩频数频率0.101911 19 16 ~20 100.171975 27 29 20~300.356688 56 ~39 30400.248408 50 ~39 49 400.089172 50~60 14 580.031847~70 5 6068合计 157% 累积接收频率10.19% 16 19 27.39% 29 2763.06% 39 5687.90% 49 3996.82% 59 14100.00% 69 5100.00%0 其他()画出直方图3直方图6040率频率频200其他493929195868接收。
120.00%60100.00%5080.00%40率60.00%30频40.00%2020.00%100.00%0其他594969192939接收家庭构成的一个样为评价家电行业售后服务的质量,随机抽取了由2. 100较差。
调查D.差;E.A.好;B.较好;C.一般;本。
服务质量的等级分别表示为:结果见book2。
(1) 指出表中的数据属于什么类型?定序型(2) 制作一张频数分布表;频率频数服务质量等级0.14 1 14 A0.21 B 2 210.32 C 3 320.18 D 18 40.15 E 15 5合计100量C质汇总务B服A402030100频数19/ 2服务质量等级计数项:汇服务质量等级总14 A21 B32 C18 D15 E100 总计二、参数估计现从一批产品中小时。
已知灯管使用寿命服从正态分布,1.其标准差为50的概率保证95%25个作为样本,测得其平均使用寿命为1600小时,要求在抽取函数)下估计该批产品平均使用寿命的置信区间。
(运用CONFIDENCE标准差 500.95 置信度样本容 25 量 1600 平均值极限误 19.59964 差置信区1619.61580.4间1619,置信区间抽样平均误差 19.59964)1580.4003~即(.59964.在一篇关于“通货紧缩”的文章中,作者考察了各种各样投资的收益情2200况。
这些投资包括股票、债券以及房地产等。
这篇文章抽取的是样本容量为19 / 3的样本,计算的房地产投资收益(单位:%)如book3所示。
同时根据经验假定,房地产投资收益的总体标准差为2.3%。
请你用区间估计的方法,采用95%的置信度估计房地产投资的平均收益率。
解:用函数AVERAGE求得,样本均值=12.08运用CONFIDENCE函数求得,CONFIDENCE(0.05,2.3,200)=房地产,取0.318758投资收益的=0.32x△房地产投资收益的置信区间为(11.76,12.40)19/ 43.Metropolitan Research有限公司是一家消费者研究组织,它设计调查,对消费者所使用的大量的产品和服务进行评估。
在某一项研究中,Metropolitan调查消费者对底特律某一个主要制造商所生产的汽车的性能的满意程度。
分发给该制造商所生产的一种最大型号小汽车用户的调查表表明,许多人抱怨该车刚开始传动系统不佳。
为了更好地了解传动系统的问题,Metropolitan采用由底特律地区一个修理企业所提供的实际传动系统的维修记录为样本。
Book4数据是50辆汽车传动系统出现故障时所行驶的实际里程的数据。
(1)对样本数据进行描述性统计分析。
19/ 5)求曾经出现过传动系统问题的汽车总体中在出现传动系统问题时所行(2 95%置信区间。
驶里程的均值的用运房地CONFIDENCE(0.05,24898.8,50)=CONFIDENCE函数求得,,取6901.468428,73342.3-6901.47产投资收益的=6901.47,房地产投资收益的置信区间为(x△ 80243.77)。
66440.8373342.3+6901.47)即(,估计出现传动系统问题时所行5000英里的允许误差下,)(3如果研究公司想在 95%时应选取多大的样本容量?驶里程的均值,则置信度为22?z?n2?????运用公式样本容量n=95.2624898.8,所以5000z=1.96,,有知,。
9695%故在置信度为时应选取样本容量为19/ 6三、方差分析(选做)三种不同的培训方式对产品组装CB一家产品制造公司管理者想比较A、、 1.名新员工随机分配给每种培训方式。
在培训26时间的多少是否有显著影响,将。
所示(单位:分钟)参加培训的员工组装一件产品所花的时间如结束后,book5 ,确定不同培训方式对产品组装的时间是否有显著影响?取显著性水平=0.05公司为了使新产品迅速占领市场,2.一家食品制造商推出了一种新的产品,并且在三个地区分别采用这三种营销方的市场营销部经理提出了三种营销方式,这三种营销方式在市场上推出然后观察营销方式所产生的产品销售额情况。
式,,如周的销售额数据(单位:千元)之后,公司的统计分析人员随机抽查了20 book6所示。
市场营销部经理提出的三种营销方式所产生的销售额是否存在显著性试问:差异?(取显著性水平=0.05)四、相关与回归分析1.根据教材第207页表9-4的资料及补充的几个问题,进行相关与回归分析。
(1)根据表中数据绘制散点图,观察其相关类型。
19/ 7人均收入与寿险保额605040额保30系列1险寿20100301015202505人均收入(2)计算相关系数,判断相关密切程度。
故其相关关系密切程度为高度相关。
计算得到相关系数为0.944 相关程度是显著的,说明年收入与寿险保额整体呈现正的线性关系。
)建立寿险保额对人均年收入的回归方程,并解释回归方程的相关含义。
(319/ 84)计算所建模型拟合优度并解释其意义。
(19/ 9能够被估计的估计的回归方程89.17%R^2=0.8917 ,表明总平方和中的能够被产量与89.17%y=2.2326x-2.8033所解释,换句话说,单位成本差异性的单位成本之间的线性关系所解释。
?的情况下,检验总体回归方程和总体回归系数)在显著性水平(5050.?的显著性。
SUMMARY OUTPUT回归统计0.944285 Multiple R0.891675 R SquareAdjusted R0.878134Square19/ 10标准误差 4.66924210 观测值方差分析Significance FMSSSFdf3.94E-05 1435.685 1 1435.685 65.85164回归分析残差 21.80182 174.4145 891610.1 总计上限下限 Lower UpperCoefficients 标准误差 t Stat P-value 95% 95% 95.0% 95.0%8.1143278.114327 Intercept -13.721 -13.721 -2.80332 4.734442 -0.59211 0.570128 X Variable2.232619 0.275126 8.114902 13.94E-05 1.598178 2.86706 1.598178 2.86706对总体回归方程显著性检验○0 1≠βo=0; H1: β1提出假设:Ho:○F=65.85164 2根据回归分析知:○=0.05 αn-2),n=10,F3~F(1,查表得临界值F=5.320.05○。
接受H14因为F>F所以拒绝Ho,,0.05所以总体回归方程存在且有意义。
对总体回归系数的显著性检验○0 1≠Ho: βo=0; H1: β1假设○t=根据回归分析知28.114902○tt0.05=1.8125 n-2)3α=0.05,,~(○tt H1。
>所以拒绝Ho,4因为接受0.05,所以总体回归系数存在显著性。
2.金融机构发放房屋抵押贷款必须了解市场上购买房屋的支付能力和支付状况,购房者的支付能力作为因变量y(用家庭平均月收入的百分比代表每月抵押贷款的平均支付能力),抵押贷款的成本费用作为自变量x(用抵押贷款的平均利率代表)。
统计分析人员随机收集了如book7所示的样本数据。
(1)采用最小二乘法求线性回归直线方程;19/ 11购房能力散点图y = 1.516x + 7.02022 = 0.9801R25.020.0力15.0系列1能付线性 (系列1)支10.05.00.012.0010.000.002.004.006.008.00抵押贷款利率(2)计算可决系数,并解释其意义;表明估计的回归方程对样本数据的拟合效果0.9801可决系数为,接近于1,较好。
购房者的支付)显著性水平设为t检验统计量进行检验:=0.05,采用(3 能力与抵押贷款利率之间是否存在显著性的线性关系?购房者的采用方差分析检验方法进行检验:=0.054)显著性水平设为,(支付能力与抵押贷款利率之间是否存在显著性的线性关系? SUMMARY OUTPUT回归统计0.99002042 Multiple R0.980140432 R Square0.977657986 Adjusted R Square0.219955429 标准误差10 观测值方差分析SignificanceFdf SS MS F4.29E-08 1 394.8285 19.10196 19.10196 回归分析 8 0.387043 0.04838 残差总计 19.489 9预测观测值 Y标准残差残差-1.15961 22.24047 -0.24047 11.356677 21.11866 0.281342 2-0.07067 19.31466 3 -0.014661.087465 17.87449 0.225514 40.750154 0.155564 18.34444 5-0.09887-0.0205 6 18.920519/ 127 18.70827 0.091732 0.4423440.179435 18.66279 0.037211 8-1.84943 -0.38353 17.78353 9-0.6374918.1322 -0.1322 10上限Upper 下限 LowerCoefficients 标准误差 t Stat P-value 95% 95% 95.0% 95.0%8.432353 5.607954 5.607954 8.432353 Intercept 7.020153877 0.612401 11.46333 3.04E-06X Variable 1 1.515968166 0.076293 19.87029 4.29E-08 1.340036 1.691901 1.340036 1.691901○0≠β1假设Ho: βo=0; H1: 1(3)○t=19.87029根据回归分析知2○tt n=10,0.05=1.8125 ,~(n-23α=0.05,)○tt H1。