第一章绪论一、填空1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。
2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。
3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。
4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。
5、中位数eM可反映总体的集中趋势,四分位差DQ.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。
6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。
四、计算题1、某班的经济学成绩如下表所示:43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么?(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布?(3)上四分位数和下四分位数所在区间?4、对成年组和青少年组共500人身高资料分组,分组资料列表如下:成年组青少年组按身高分组(cm) 人数(人) 按身高分组(cm) 人数(人)150~155 155~160 160~165 165~170 22108954370~7575~8080~8585~9026833928170以上32 90以上24合计300 合计200要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。
(2)说明成年组和青少年组平均身高的代表性哪个大?为什么?6、设甲、乙两单位职工的工资资料如下:甲单位乙单位月工资(元)职工人数(人)月工资(元)职工人数(人)600以下600-700 700-800 800-900 900-1000 1000-1100 2410764600以下600-700700-800800-900900-10001000-11001241265合计30 合计30要求:试比较哪个单位的职工工资差异程度小。
8、一家公司在招收职员时,首先要通过两项能力测试。
在A 项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?KEY:1、(1)77,80.5,68.5,87.25(2)83,18.75,0.173(3)中位数,是数据分布明显左偏又是顺序数据。
(4)左偏身高(cm) 频数f 组中值xy yf y^2 (y^2)f150~155 22 152.5 -2 -44 4 88 155~160 108 157.5 -1 -108 1 108 160~165 95 162.5 0 0 0 0 165~170 43 167.5 1 43 1 43 170以上32 172.5 2 64 4 128 合计300 -45 367令162.55x a x y b --==450.15300yf y f ∑==-=-∑ 162.55*(0.15)161.75x a by =+=+-=22367 1.223300y f y f ∑===∑标准差: 22 1.0957y y y σ=-=51.09575.4x y b σσ==⨯= 标准差变异系数:5.47840.03387X 161.75C σσ===成人组的平均身高为161.75cm ,标准差为5.4784cm ,标准差系数为0.03387。
青少年组 身高(cm)频率f 组中值 y yf y^2 (y^2)f70~7526 72.5 -2 -52 4 104 75~8083 77.5 -1 -83 1 83 80~8539 82.5 0 0 0 0 85~9028 87.5 1 28 1 28 90以上24 92.5 2 48 4 96 合计200 -59 311令82.55x a x y b --==590.295200yf y f ∑==-=-∑ 82.55*(0.295)81.025x a by =+=+-=22311 1.555200y f y f ∑===∑标准差: 22 1.2116y y y σ=-=51.09576.x y b σσ==⨯=标准差变异系数: 6.0580.074767X 81.025C σσ===成人组的平均身高为81.025cm ,标准差为6.058cm ,标准差系数为0.074767。
(2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。
6、解:)(67.8663026000);(70.8193327050元 元乙甲=====∑∑x f xf x)(05.124);(14.138元= 元=乙甲σσ%31.1467.86605.124%;85.1670.81914.138=== =乙甲V V差异程度小,所以乙单位职工工资 乙甲V V > 第二章 统计量及其分布 习题 一、填空题1、简单随机抽样样本均值X 的方差取决于 样本量 和总体方差_,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 4 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =__32。
(注:20.99(17)33.4χ=,20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)3、若(5)X t ,则2X 服从_F(1,5)______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于____0.21_______。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 样本量 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 正态分布 。
四、计算题1、从正态总体2(52,6.3)N 中随机抽取容量为36的样本,要求: (1)求样本均值x 的分布;(2)求x 落在区间(50.8,53.8)内的概率;(3)若要以99%的概率保证|52|2x -<,试问样本量至少应取多少?这个简答题,我到时候发照片给你们吧!第三章 参数估计 习题一、填空题1、无偏性、 有效性 和 一致性 是对估计量最基本的要求。
2、总体2~(,)X N μσ,123(,,)X X X 是来自X 的一个容量为3的样本,三个μ的无偏估1231212311132111,,33355236X X X X X X X X +++++计量中,最有效的一个是321313131X X X ++。
3、在一批货物中,随机抽出100件发现有16件次品,这批货物次品率的置信水平为95%的置信区间为 (0.088,0.232)。
4、若总体X 的一个样本观测值为0,0,1,1,0,1,则总体均值的矩估计值为 0.5 ,总体方差的矩估计值为 0.25 。
5、小样本,方差2σ未知,总体均值的区间估计为 12Sx t nα-±。
四、计算题1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米。
请确定该苗圃中树苗平均高度的置信区间,置信水平95%。
1、解:01.262642.896.1622/1±=⨯±=±-ns z x α该苗圃中树苗平均高度的置信水平为95%的置信区间为(59.99,64.01)厘米。
第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 拒真错误 和 纳伪错误2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 双侧检验 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 单侧检验3、假设检验有两类错误,分别是 拒真错误也叫第一类错误,它是指原假设H0是 真实的,却由于样本缘故做出了 拒绝 H0的错误;和 纳伪错误 叫第二类错误,它是指原假设H0是 假 的, 却由于样本缘故做出 接受 H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 显著性水平 。
5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 小概率原理。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为 下面有答案7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为H 0:t≥1000 H 1:t <1000(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β 增大9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 有 (有,没有)达到该标准。
6、1.25>21α-z二、 计算1、下面是某个随机选取20只部件的装配时间(单位:分)设装配时间的总体服从正态分布,参数均未知)=(05.0α,可否认为装配时间的均值为10? 2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。
一直这种原件的寿命服从正态分布,标准差为100小时。
试求在显著性水平为0.05下,确定厂家的声明是否可信? 4、在一批产品中抽 40 件进行调查,发现次品有 6 件,试按显著水平为 0.05 来判断该批产品的次品率是否高于 10 %。
KEY:1、假设检验分双边假设检验与单边假设检验,进行假设检验时要注意由问题所问进行区分。
由题设知总体),(~2σμN X ,2,σμ均未知,要求在水平)=(05.0α下检验假设10:,10:10≠=μμH H(1) 因2σ未知,采用t 检验,取检验统计量为:n sx t 0μ-=-(2) 由于n=20,-x =10.2,s=0.51,05.0=α,()0930.2)19(1025.02==-t n t α(3) 绝对域为:()12-≥-=-n t n s x t αμ(4) 经计算0930.275.1<=t 即检验统计量不落在拒绝域内,故在水平05.0=α下接受原假设H 0,即认为装配时间均值可认为是10。