统计学作业Document number【980KGB-6898YT-769T8CB-246UT-18GG08】统计学第一次作业(2012年3月15日)注意:作业全部为课后习题,请将必要的推导过程写出,不能只写答案。
本次作业共包括前四章的14道题目,个别题目有删减:第一章?统计学的性质1-3答:(1)对于简单随机抽样,置信度为95%的置信区间公式为:表:历年盖洛普对总统选举的调查结果(n=1500)年度共和党民主党民主党候选人P*(1-P)/n 95%置信度总体比例的置信区间(%)实际选举结果(%)1960 尼克松49% 肯尼迪51% 51± 肯尼迪1964 戈德沃特36% 约翰逊64% ☆64± 约翰逊1968 尼克松57% 汉弗莱50% 50± 汉弗莱1972 尼克松62% 麦戈文38% 38± 麦戈文1976 福特49% 卡特51% 51± 卡特1980 里根52% 卡特48% ☆48± 卡特(2)注☆:实际选举结果证明错误的置信区间2-2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下:18 20 16 6 16 17 12 14 16 1814 14 16 9 20 18 12 15 13 1616 2l 2l 9 16 20 14 14 16 16第二章?描述性统计学2-2答:1) 将数据分组,使组中值分别为6,9,12,15,18,21,作出X的频数分布表;解:(1)数据分组如下:表:丈夫所受教育年限X频数分布表(n=30)分组编号组下、上限组中值 X值(年)频数(f)相对频率( f / n )累积频率(%)1 [,) 6 6 12 [,) 9 9、9 23 [,) 12 12、12、13 34 [,) 15 14、14、14、14、14、15、16、16、16、16、16、16、16、16、16 155 [,) 18 17、18、18、18 46 [,) 21 20、20、20、21、21 52) 作出频数分布的直方图;解:(图)丈夫所受教育年限X数据直方图(单位:年;n=30)3) 问年的教育在第几百分位数上13年呢?解:年的教育,累积频率为%,前面有%个样本,所以在第10个百分位数上;13年的教育,累积频率为%,前面有%个样本,所以在第20个百分位数上。
2-62-13答:解:表:美国九十年代两个5年失业率表(假设1990年~1999年总人口稳定)年度失业率(%)X 相对频率f/n X - (X - )2 (X - )2 *f/n19901991199219931994X - (X - )2 (X - )2 *f/n19951996199719981999前5年间:平均失业率(%):=∑X =*+*+ *+*+ * = ;方差:S2 = * ∑(X - )2 * = * =;标准差:S = = ;后5年间:平均失业率(%):=∑X =*+ *+ *+ *+ * = ;方差:S2 = * ∑(X - )2 * = * = ;标准差:S = = ;表:美国九十年代失业率表(假设1990年~1999年总人口稳定,n=10)年度失业率(%)X 相对频率f/n X - (X - )2 (X - )2 *f/n199019911992199319951996199719981999总共10年间:平均失业率(%):=∑X = *+*+ *+*+ *+*+ *+ *+ *+ *=;方差:S2 = * ∑(X - )2 * = * = ;标准差:S = =;比较这三组均值和方差,发现这都与分组情况相关。
分组会影响到均值和方差。
第三章?概率分布3-5答:使用概率树进行计算,结果如下:表:射击了两次时失败的次数X的概率分布(有总结经验提高命中率)X P(X)(累加过程) P(X)(合计) P(X)累积(%)12 ** + **4888100表:射击了三次时失败的次数X的概率分布(有总结经验提高命中率)X P(X)(累加过程) P(X)(合计) P(X)累积(%)123 **** + ** + **** + ** + ****3-9答:1)求X的概率分布解:表:2004年北京某高校本科新生所拥有的电子邮箱数X概率及其它计算(n= 2820人)X f P(X) X*P(X) ( X - μ)2 (X-μ)2*P(X)0 430 01 4902 7003 4804 2906 4302)求平均电子邮箱数解:3)求标准差解:μ≡ ∑X * P(X) =σ2 ≡ MSD ≡∑(X-μ)2*P(X) =σ =3-12答:1) 样本中至少有一半人是“经常听”的;解:将问题转化为求二项分布n=8,π=,时求k=4时的二项分布右侧尾部累积概率,查P574表,得: P=2) 样本中没有一个人是“不听”的;解:先求二项分布n=8,π=,时求k=1时的二项分布右侧尾部累积概率,查P573表,得:P1=则样本中没有一个人是“不听”的概率为:P2=1 – P1 = 1 – =3) 样本中恰好有3个人是“偶尔听”的。
解:问题转化为计算二项分布n=8,π=,时求k=3的二项分布概率,查P572表,得:Pr (X=3) =3-133-17答:1) Pr (X<,如果=5,=2;解:使用公式将正态分布标准化:Z =Z = ;Pr ( X < ) = Pr ( Z < ) =1- Pr ( Z > )= =2)Pr (X<860),如果=500,=300;解:Z = ;Pr ( X < 860 ) = 1 - Pr ( X > 860 ) = 1 - Pr ( Z > ) = 1 – =3) Pr <X<,如果=10,=;解:Z1 = - 1;Z2= 1;Pr ( < X < )= Pr ( -1 < Z < 1 )= Pr ( Z > -1 ) - Pr ( Z > 1 )= 1 - Pr ( Z > 1 ) - Pr ( Z > 1 )= 1 – 2* Pr ( Z > 1 )= 1 – 2*=4) Pr (10<X<11),如果=,=.解:Z1 = - ;Z2= ;Pr ( 10 < X < 11 )= Pr (- < Z < )= Pr ( Z > - ) - Pr ( Z > )= 1 - Pr ( Z > ) - Pr ( Z > )= 1 ––=3-19答:1) 得分在450~550之间的参赛者的百分比;解:将X1=450、X2=550标准化:Z1 = = = ;Z2 = = = ;问题是求Pr ( 450 < X < 550 );Pr ( 450 < X < 550 ) = Pr ( Z > Z1 ) - Pr ( Z > Z2 ) = Pr ( Z > ) - Pr ( Z > )= – =2) 第75百分位上的得分;解:由Pr ( Z > Z3 ) = 1 – = ,反查正态分布表得知:Z3 = ,则X3 = Z3 * σ + μ = *100 + 410 = 477;3) 第25百分位上的得分;解:由Pr ( Z > Z4 ) = 1 – = > ,可以知道Z4在数学期望的左侧,右侧对称的是Pr ( Z > ),反查正态分布表得知:Z4 = - ,则X4 = Z4 * σ + μ = - *100 + 410 = - 67 + 410 = 343;4) 以上两个四分位数间的间距。
解:四分位差为:477 – 343 = 133第四章?抽样4-7答:解:按照正态近似性定理,近似地服从正态分布,其期望值= μ =,标准误差SE = σ = 3 = 。
先将受教育水平X = 7年、9年,按μ =,SE =对X值进行标准化,得:Z1 = = (- )/ = - 2 Z2 = = / =因此,问题转化为Pr ( 7< X < 9 ) = Pr (Z1< Z < Z2 ) Pr (Z1< Z < Z2) = Pr ( -2 < Z ) - Pr ( Z > ) = 1 - Pr ( X > 2 ) – Pr ( Z > ) = 1 - – = 4-9 4-23 4-24第一章 统计学的性质(1题)1-3、近年来,美国6次总统选举预测情况如下,其中括号内的数表示盖洛普在选举前对1500位选民的民意调查结果(注意:此题目相对书上原题有所删减):1) 答:对于简单随机抽样,置信度为95%的置信区间公式为:表:历年盖洛普对总统选举的调查结果(n=1500)年度 共和党 民主党 民主党候选人P*(1-P)/n 95%置信度总体比例的置信区间 (%) 实际选举结果 (%)1960 尼克松49% 肯尼迪51% 51± 肯尼迪1964 戈德沃特36% 约翰逊64% ☆64± 约翰逊1968 尼克松57% 汉弗莱50% 50± 汉弗莱1972 尼克松62% 麦戈文38% 38± 麦戈文1976 福 特49% 卡 特51% 51± 卡 特1980 里 根52% 卡 特48% ☆48± 卡 特2) 对照下面所给出的真正选举结果,对错误的置信区间(即没能把真正的比例 包括在内的)打上星号标志。
第二章描述性统计学2-2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下:18 20 16 6 16 17 12 14 16 1814 14 16 9 20 18 12 15 13 1616 2l 2l 9 16 20 14 14 16 161) 将数据分组,使组中值分别为6,9,12,15,18,21,作出X的频数分布表;2) 作出频数分布的直方图;3) 问年的教育在第几百分位数上2-6、在2000年北京申办奥运会有关调查中,某单位20名员工的一个样本表明,他们亲身参加过的与北京申奥有关的活动的件数为3,3,0,1,3,3,5,2,4,0,0,3,6,1,0,7,3,2,1,21) 作频数分布图;2)求平均数、中位数和众数;3)如果另一单位的20名员工参加活动的件数的均值为,中位数为2,众数为2,那么这个样本参加活动的总数是多少2-13、在20世纪90年代,美国的失业率如下表:计算以下各期间的平均失业率和标准差:1) 1990~1994的前5年间;2) 1995~1999的后5年间;3) 1990~1999的全部10年间,这一答案与1)、2)的答案之间有什么联系第三章概率分布3-5、某战士射击的命中率为60%。