第2章 统计数据的描述——练习题●2. 解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel 练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。
整理得到频数分布表如下:●13.因为女生的离散系数为V=s x =550=0.1 男生体重的离散系数为 V=s x =560=0.08 对比可知女生的体重差异较大。
(2) 男生:x =602.2公斤公斤=27.27(磅),s =2.25公斤公斤=2.27(磅);女生:x =2.250公斤公斤=22.73(磅),s =2.25公斤公斤=2.27(磅);(3)68%; (4)95%。
14 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。
离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。
(2)利用Excel 进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:成年组身高的离散系数:024.01.1722.4==s v ; 又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:幼儿组身高的离散系数: 2.4970.03571.3s v ==; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
第四章参数估计(1) ●1. 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σσ5=0.7906(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2σZ 6×0.7906=1.5496。
●2. 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为x σσ15=2.1429(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2σZ 6×2.1429=4.2000。
(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为±α/2σx Z 0±4.2=124.2115.8可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
●3. 解:⑴计算样本均值x :将上表数据复制到Excel 表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x =3.316667,⑵计算样本方差s :删除Excel 表中的平均值,点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定,得到s=1.6093也可以利用Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:∑2i(x -x )=90.65再对总和除以n-1=35后,求平方根,即为样本方差的值。
⑶计算样本均值的抽样标准误差: 已知样本容量 n =36,为大样本, 得样本均值的抽样标准误差为 x σ1.6093=0.2682⑷分别按三个置信水平计算总体均值的置信区间:① 置信水平为90%时:由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64, 计算得此时总体均值的置信区间为±α/2sx Z 7±1.64×0.2682= 3.75652.8769可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时;② 置信水平为95%时:由双侧正态分布的置信水平1-α=95%,得 α/2Z =1.96,计算得此时总体均值的置信区间为±α/2sx Z 7±1.96×0.2682= 3.84232.7910可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时;③ 置信水平为99%时:若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态分布的置信水平β=0.995,查单侧正态分布表得 α/2Z =2.58, 计算得此时总体均值的置信区间为±α/2sx Z 7±2.58×0.2682= 4.00872.6247●6. 解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,拥有该品牌电视机的家庭比率的抽样标准误差为p σ⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64,此时的置信区间为 p ±αZ %±1.64×2.98%=27.89%18.11%可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。
⑵双侧置信水平为95%时,得 α/2Z =1.96,此时的置信区间为 p ±αZ %±1.96×2.98%=28.8408%17.1592%可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16%,28.84%)。
●7.解: 已知总体单位数N =500,重复抽样,样本容量n =50,为大样本,样本中,赞成的人数为n 1=32,得到赞成的比率为 p =n 1n =3250=64%(1)赞成比率的抽样标准误差为=6.788% 由双侧正态分布的置信水平1-α=95%,得 α/2Z =1.96,计算得此时总体户数中赞成该项改革的户数比率的置信区间为p ±αZ 64%±1.96×6.788%=77.304%50.696%可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为(50.70%,77.30%)。
(2)如预计赞成的比率能达到80%,即 p =80%,由得样本容量为 n =20.80.2(6.788%)⨯= 34.72 取整为35, 即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。
●13. 解:已知总体比率π=2%=0.02,由置信水平1-α=95%,得置信度α/2Z =1.96,允许误差E ≤ 4%即由允许误差公式 E=/2Z ασ整理得到样本容量n 的计算公式:n=2()Eα/2P Z σ=2=2E 2α/2Z π(1-π)≥20.020.980.04⨯⨯21.96=47.0596 由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。
●14. ?解:已知总体标准差x σ=120,由置信水平1-α=95%,得置信度α/2Z =1.96,允许误差E ≤ 20即由允许误差公式 E=/2Z x ασ整理得到样本容量n 的计算公式:n=2()Eα/2xZ σ≥2()20⨯1.96120=138.2976 由于计算结果大于47,故为保证使“≥”成立,至少应取139个顾客作为样本。
第6章 假设检验——练习题(全免)6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:1035:0≤μH ,1035:1>μH 。
6.2 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
第七章●4. 解:(1)利用EXCEL 制作数据散点图:将已知表格的后两列复制到Excel 中,选择该表格后,点击:图表向导→XY 散点图→确定,即得散点图如下:(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明航班整点率与投诉率两者之间,存在着一定的负相关关系。
[利用Excel 的统计函数“CORREL ”计算得到相关系数r = -0.88261,属于高度负相关](3)求投诉率依赖航班正点率的估计的回归方程设投诉率为Y ,航班正点率为X建立回归方程 i i X Y 21ββ+= 解法一:应用Excel 函数计算:应用统计函数“SLOPE ”计算直线斜率为:2β=-0.07041应用统计函数“INTERCEPT ”计算直线与y 轴的截距为:1β= 6.017832解法二:应用Excel 列表计算:作出Excel 运算表格如下:得回归系数为: 222)n xy x y n x x -=-(∑∑∑∑∑β9523.215667.27.18949590.46⨯-⨯=⨯-2(667.2) = 81.5611158.3-= —0.0704144初始值 y x =-12ββ=y x nn-∑∑2β = 7.18667.20.070414499+⨯=6.01783 于是得回归方程为^6.01780.07i i Y X =-(4)参数的经济意义是:航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。
(5)航班按时到达的正点率为80%时,估计每10万名乘客投诉的次数可能为:4187.08007.00178.6ˆ=⨯-=iY (次/10万)第八章 时间序列分析——练习题●1. 解:设i 年的环比发展水平为x i ,则由已知得:x 2003=30, (1)又知:320042005200620032004200516%x x x x x x ≥+(),2200720082006200715%x x x x ≥+(),求x 2008由上得32200820072008200320032007(16%)(15%)x x x x x x =≥++ 即为3220081.061.0530x ≥,从而2008年该厂汽车产量将达到 得 x 2008≥30× 31.06×21.05= 30×1.3131 = 39.393(万辆) 从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。