置信区间某大学为了了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,求该校大学生平均上网时间的置信区间,置信水平分别是90%,95%和99%。
已知:36=n ,当α为、、时,相应的645.121.0=z 、96.1205.0=z 、58.2201.0=z 。
根据样本数据计算得:32.3=x ,61.1=s 。
由于36=n 为大样本,所以平均上网时间的90%的置信区间为:44.032.33661.1645.132.32±=⨯±=±n s z x α,即(,)。
平均上网时间的95%的置信区间为:53.032.33661.196.132.3±=⨯±=±n s z x α,即(,)。
平均上网时间的99%的置信区间为:69.032.33661.158.232.32±=⨯±=±ns z x α,即(,)。
某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。
(2)如果小区管理者预计赞成的比例能达到80%,估计误差不超过10%。
应抽取多少户进行调查? (1)已知:50=n ,64.05032==p ,05.0=α, 1.9605.0=z 。
总体中赞成该项改革的户数比例的95%的置信区间为:13.064.050)64.01(64.096.164.0)1(2±=-±=-±n p p z p α,即(,)。
(2)已知:80.0=π,05.0=α, 1.9605.0=z 。
应抽取的样本量为:621.0)80.01(80.096.1)1()(22222=-⨯=-⋅=E z n ππα。
一名汽车销售管理者声称其每个月平均销售的汽车数量至少为14辆,反对组织想通过研究知道这一数量是否属实。
(1)为解决该组织的疑问,建立合适的原假设和备择假设。
(2)当不能拒绝原假设时,该组织会得到什么结论? (3)当可以拒绝原假设时,该组织会得到什么结论?(1)该组织想要证实的假设是“每个月平均销售的汽车数量不足14辆”,所以提出的假设形式为,14:0≥μH ,14:1<μH 。
(2)当不能拒绝原假设时,该组织认为没有充分的理由怀疑汽车销售管理者的说法。
(3)当可以拒绝原假设时,该组织有充分的统计证据断定汽车销售管理者的声明不真实。
某种纤维原有的平均强力不超过6g ,现希望通过改进工艺来提高其平均强力。
研究人员测得了100个关于新纤维的强力数据,发现其均值为。
假定纤维强力的标准差仍保持为不变,在5%的显着性水平下对该问题进行假设检验。
(1)检验的临界值是多少?拒绝法则是什么? (2)计算检验统计量的值,你的结论是什么?(1)检验的临界值是645.105.0=z ,拒绝法则是:如果n x z /0σμ-=>,就拒绝0H 。
(2)检验统计量645.194.2100/19.1635.6>=-=z ,所以拒绝原假设,认为新纤维的平均强力超过了6克。
某印刷厂旧机器每台每周的开工成本服从正态分布N(100,252),现新安装了一台机器,观测到它在9周里平均每周的开工成本为75元。
假定成本的标准差不变,试问在α=的水平上该厂机器的平均开工成本是否有所下降?建立原假设与备择假设为:100:0≥μH ,100:1<μH ;检验统计量0.39/2510075-=-=z <,拒绝原假设,认为该厂机器的平均开工成本的确有所下降。
一般来说,如果能够证明某部电视连续剧在播出后的前13周中观众的收视率超过了25%,就可以认为它获得了成功。
现针对一部关于农村生活题材的电视剧抽选了400个家庭组成一个样本,发现前13周里有112个家庭看过这部电视剧。
(1)建立适当的原假设与备择假设。
(2)如果允许发生第一类错误的最大概率为,这些信息能否断定这部电视剧是成功的?(1)25.0:0≤p H25.0:1>p H 。
如果0np 和)1(0p n -都大于等于5。
(2)39.1400)25.01(25.025.0400112=--=z <)33.2(01.0=z ,不能拒绝原假设,因此没有充分的理由认为这部电视剧是成功的。
学生在期末考试之前用于复习的时间和考试分数之间是否有关系?为研究这一问题,一位研究者抽(2)计算相关系数,说明两个变量之间的关系强度。
(1)散点图如下:从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。
(2)利用Excel 的“CORREL”函数计算的相关系数为8621.0=r 。
相关系数8.0>r ,表明复习时间与考试分数之间有较强的正线性相关关系。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显着性(α=)(6)如果某地区的人均GDP 为5000元,预测其人均消费水平。
(7)求人均GDP 为5000元时,人均消费水平的95%的置信区间和预测区间。
(1)散点图如下:从散点图可以看出,人均GDP 与人均消费水平为正的线性相关关系。
(2)利用Excel 的“CORREL”函数计算的相关系数为998128.0=r 。
相关系数接近于1,表明人均GDP与人均消费水平之间有非常强的正线性相关关系。
(3)由Excel 输出的回归结果如下表:回归统计 Multiple RR Square Adjusted RSquare 标准误差 观测值7方差分析df SSMSF Significance F 回归 1残差 5 305795总计6Coefficients 标准误差 t Stat P-value Intercept X Variable 1得到的回归方程为:x y 308683.06928.734ˆ+=。
回归系数308683.01=β表示人均GDP 每增加1元,人均消费水平平均增加元。
(4)判定系数996259.02=R 。
表明在人均消费水平的变差中,有%是由人均GDP 决定的。
. (5)首先提出如下假设:0:10=βH ,0:11≠βH由于Significance F<05.0=α,拒绝原假设,表明人均GDP 与人均消费水平之间的线性关系显着。
(6)1078.22785000308683.06928.734ˆ5000=⨯+=y(元)。
(7)当05.0=α时,571.2)27(05.0=-t,247.3035=e s 。
置信区间为: 即(,)。
预测区间为: 即(,)。
1981-1999年国家财政用于农业的支出额数据如下:(1)绘制时间序列图描述其形态。
(2)计算年平均增长率。
(3)根据年平均增长率预测2000年的支出额。
7.1 (1)时间序列图如下:从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。
(2)年平均增长率为:%55.131%55.113121.11076.10851180=-=-=-=nn Y Y G 。
(3)88.1232%)55.131(76.1085ˆ2000=+⨯=Y。
1981-2000年我国油菜籽单位面积产量数据(单位:kg/hm 2)如下:(1)绘制时间序列图描述其形态。
(2)用5期移动平均法预测2001年的单位面积产量。
(3)采用指数平滑法,分别用平滑系数和预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适。
7.2 (1)时间序列图如下: (2)2001年的预测值为:2001年时的预测值为:5.0=α时的预测值为:比较误差平方可知,5.0=α更合适。
我国1964-1999年的纱产量数据(单位:万吨)如下:(1)绘制时间序列图描述其形态。
(2)选择一条合适的趋势线拟合数据,并根据趋势线预测2000年的产量。
7.5 (1)趋势图如下:(2)从图中可以看出,纱产量具有明显的线性趋势。
用Excel 求得的线性趋势方程为: 2000年预测值为:65.585379495.135202.69ˆ2000=⨯+=Y =(万吨)。
下表中的数据是一家大型百货公司最近几年各季度的销售额数据(单位:万元)。
对这一时间序列的构成要素进行分解,计算季节指数,剔除季节变动,计算剔除季节变动后趋势方程。
7.8各季节指数如下:根据分离季节因素后的数据计算的趋势方程为:t Yt7064.16392.2043ˆ+=。