当前位置:文档之家› 2020年华南理工大学统计学原理平时作业-主观题

2020年华南理工大学统计学原理平时作业-主观题

2020统计学作业题一、计算题1、为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,得样本均值为6.5小时,样本标准差为2.5小时。

(1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。

答:已知N=225, 1-α=95%, Z α/2=1.96, -x =6.5,Ó=2.5 网络用户每天平均上网时间的95%的置信区间为: (-x- Z α/2 * Ó/√n, -x+ Z α/2 * Ó/√n ) =(6.5-1.96*2.5/√225,6.5+1.96*2.5/√225) =(6.17,6.83)(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。

以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间?(注:96.1025.0=z ,645.105.0=z )答:样本比例:P=90/225=0.4;年龄20岁以下的网络用户比例的置信区间为: 即(33.6%,46.4%)2、一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。

已知轮胎寿命的公里数服从正态分布,制造商能否根据这些数据作出验证,产品同他所说的标准相符?(α = 0.05,t α(19)=1. 7291)解:H0: m ³ 40000 H1: m < 40000 a = 0.05 df = 20 - 1 = 19 临界值:检验统计量:决策: 在a = 0.05的水平上不能拒绝H0结论:有证据表明轮胎使用寿命显著地大于40000公里3、拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?(已知:z α/2=1.96)解:已知σ=2000,E=400,α=1-0.95=0.05,从而zα/2=1.96。

因此,。

即应抽取97人作为样本。

4、某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。

试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。

(已知:z α/2=1.96)解:已知100n =,21.96z α=,6565%100p == 根据公式得: 265% 1.96p Z α±=±即65%±9.35%=(55.65%,74.35%),95%的置信水平下估计该城市下岗职工中女性所占比例的置信区间为55.65%~74.35%。

5、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。

现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得样本均值为:32.101=x 克,样本标准差为:634.1=s 克。

假定食品包重服从正态分布,96.1205.0=z ,=05.0z 1.64,05.0=α,要求:(1) 确定该种食品平均重量95%的置信区间。

(2) 采用假设检验方法检验该批食品的重量是否符合标准要求?(写出检验的具体步骤)。

解:(1)已知:总体服从正态分布,但σ未知。

n=50为大样本。

α=0.05,2/05.0Z =1.96 根据样本计算可知 X =101.32 s=1.63 该种食品平均重量的95%的置信区间为45.032.10150/63.1*96.132.101/2/±=±=Z ±X n s α即(100.87,101.77)(2)提出假设:,计算检验的统计量:由于,所以拒绝原假设,该批食品的重量不符合标准要求。

二、分析题1、控制不良贷款的办法一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。

近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。

为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。

下面是该银行所属的25家分行2002年的有关业务数据用excel 中“数据分析”工具中的“回归”分析得到以下结果。

100:0=μH 100:1≠μH 712.550634.110032.1010=-=-=n sx z μ96.1712.5205.0=>=z zSUMMARY OUTPUT回归统计Multiple R 0.843571R Square 0.711613Adjusted R Square 0.699074标准误差 1.979948观测值25方差分析df SS MS F回归分析 1 222.486 222.486 56.75384 残差23 90.16442 3.920192总计24 312.6504Coefficients 标准误差t Stat P-value Intercept -0.82952 0.723043 -1.14726 0.263068 各项贷款余额(亿元)0.037895 0.00503 7.533515 1.18E-07请利用以上结果:1)写出回归直线方程。

解:写出回归直线方程。

(5分)回归方程为:y = -0.8295 + 0.037895 x回归系数表示,贷款余额每增加1亿元,不良贷款平均增加0.037895亿元2)对回归方程进行拟合优度检验。

方法一:判定系数r2判定系数的实际意义是:在不良贷款取值的变差中,有71.16%可以由不良贷款与贷款余额之间的线性关系来解释,或者说,在不良贷款取值的变动中,有71.16%是由贷款余额所决定的。

也就是说,不良贷款取值的差异有2/3以上是由贷款余额决定的。

可见不良贷款与贷款余额之间有较强的线性关系。

方法二:估计标准误差计算公式为,在EXCEL结论中可读出Sy为1.9799,反映实际观察值在回归直线周围的分散状况。

方法三:残差图分析由残差分析图可见,该残差图属于较满意的模式。

所以该回归方程拟合较好。

3)对方程进行显著性检验(总体模型检验及回归系数检验)。

总体模型检验:步骤一,提出假设: H0: b1=0 H1:b1≠0步骤二,确定合适的统计量和抽样分布。

因为对总体模型进行检验,所以用F检验。

步骤三:选择显著性水平a,确定临界值。

a=0.05,Fa=4.28步骤四:确定决策法则,计算检验统计量的值计算检验统计量F:步骤五:作出统计决策因为F=56.753844>Fa =4.28,所以以0.05的显著性水平,有足够的证据拒绝零假设。

或:确定显著性水平a=0.05,并根据已知条件得到P 值为1.18E-07 作出决策:P 远小于 a,拒绝H0,线性关系显著 回归系数检验:提出假设H0:b1 = 0 H1:b1 ¹ 0从已知条件中得到检验的统计量,对应的P 值为1.18E-07 由于P 值远小于显著性水平a ,拒绝H0,表明不良贷款与贷款余额之间有线性关系2、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。

现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:假定食品包重服从正态分布,要求:(1) 确定该种食品平均重量95%的置信区间。

解:已知:50=n ,96.1205.0=z 。

样本均值为:32.1015050661===∑=nf Mx ki ii克, 样本标准差为:634.14988.1301)(12==--=∑=n f x Ms ki ii克。

由于是大样本,所以食品平均重量95%的置信区间为:453.032.10150634.196.132.1012±=⨯±=±ns z x α即(100.867,101.773)。

(2) 如果规定食品重量低于100克属于不合格,采用假设检验方法检验该批食品的重量是否符合标准要求?(05.0=α,96.105.0=z ,写出检验的具体步骤)。

答:提出假设:100:0=μH ,100:1≠μH计算检验的统计量:712.550634.110032.1010=-=-=n sx z μ由于96.1712.5205.0=>=z z ,所以拒绝原假设,该批食品的重量不符合标准要求。

3、一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如(1) 根据这个列联表计算的女学生的列百分比分别为( D )A 51.7%和48.3%B 57.4%和42.6%C 30%和70%D 35%和65%(2) 根据这个列联表计算的男女学生反对上网收费的期望频数分别为( D ) A 48和39 B 15和14 C 25和19 D 102和81(3) 如果根据上述列联表计算的相关系数|ϕ |=0,则表明( D )A 男学生全部赞成,女学生全部反对B 男学生和女学生全部赞成C 男学生和女学生全部反对D 男女学生与对这项举措的态度没有关系(4) 如果要检验男女学生对上网收费的看法是否相同,卡方检验统计量的自由度是( A ) A 1 B 2 C 3 D 4(5) 这个列联表的最右边一行为( B )A 列边缘频数B 行边缘频数C 条件频数D 总频数(6) 请检验对上网收费的看法与男女学生性别是否独立。

已知:显著性水平α=0.05,。

解:H0: π1 = π2 H1: π1π2不相等α = 0.05Df=(2-1)(2-1)=16176.011=-=∑∑==ijij ij ej ri e e f t决策:在α = 0.05的水平上不能拒绝H0结论:可以认为男女学生对上网收费的看法相同4、一家管理咨询公司为不同的客户举办人力资源管理讲座。

每次讲座的内容基本上是一样的,但讲座的听课者,有时是中级管理者,有时是低级管理者。

该咨询公司认为,不同层次的管理者对讲座的满意度是不同的,对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准从1——10,10代表非常满意):7857 9 68 8 57 10 79 9 410 88经计算得到下面的方差分析表:差异源SS df MS FP-valueF crit组间0.00083.68组内18.9 1.26总计48.5 17(1)请计算方差分析表中的F值。

(10分)解:设不同层次的管理者的平均满意度评分分别为μ1,μ2 μ3提出假设:H0 : μ1 = μ2 =μ3,H1 : μ1, μ2 ,μ3 不相等差异源SS df MS F P-value F crit组间29.6 2 14.8 11.76 0.0008 3.68组内18.9 15 1.26总计48.5 17(2)请用α = 0.05的显著性水平进行方差分析。

相关主题