《统计学原理》作业三(第五~第七章)一、判断题1、在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大。
(×)2、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
(√)3、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。
(×)4、抽样误差是由于抽样的偶然因素而产生的误差,这种误差既可以避免,也可以控制其大小。
(×)5、抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。
( ×)6、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(×)7、抽样成数的特点是,样本成数越大,则成数方差越大。
(×)8、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(×)二、单项选择题1、在一定的抽样平均误差条件下(A )。
A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度2、反映样本指标与总体指标之间的平均误差程度的指标是(C )。
A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差3、抽样平均误差是( D )。
A、全及总体的标准差B、样本的标准差C、抽样指标的标准差D、抽样误差的平均差4、当成数等于(C )时,成数的方差最大。
A、1B、0C、0.5D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C )。
A、等于78%B、大于84%C、在此76%与84%之间D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(B )。
A、甲厂比乙厂大B、乙厂比甲厂大C、两个工厂一样大D、无法确定7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(A)。
A、抽样极限误差B、抽样平均误差C、抽样误差系数D、概率度8、如果变量x 和变量y 之间的相关系数为 1,说明两变量之间( D )。
A、不存在相关关系B、相关程度很低C、相关程度显著D、完全相关9、相关关系中,两个变量的关系是对等的,从而变量x 对变量y 的相关,同变量y 对变量x 的相关( C )。
A、完全不同B、有联系但不一样C、是同一问题D、不一定相同10、一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是( C )。
A、直线相关B、完全相关C、非线性相关D、复相关11、当所有的观察值y都落在直线y=a+bx上时,则x与y之间的相关系数为(B)。
12、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y c=30+60x,意味着劳动生产率每提高2千元时,工人工资平均增加( B )。
A、60元B、120元C、30元D、90元13、如果变量x 和变量y 之间的相关系数为-1,说明两个变量之间是(B )。
A、高度相关关系B、完全相关关系C、完全不相关D、低度相关关系14、价格不变的条件下,商品销售额和销售量之间存在着(D )。
A、不完全的依存关系B、不完全的随机关系C、完全的随机关系D、完全的依存关系三、多项选择题1、影响抽样误差大小的因素有(ABCD )。
A、抽样调查的组织形式B、抽取样本单位的方法C、总体被研究标志的变异程度D、抽取样本单位数的多少E、总体被研究标志的属性2、在抽样推断中(ACD )。
A、抽样指标的数值不是唯一的B、总体指标是一个随机变量C、可能抽取许多个样本D、统计量是样本变量的涵数E、全及指标又称为统计量3、从全及总体中抽取样本单位的方法有(BC )。
A、简单随机抽样B、重复抽样C、不重复抽样D、概率抽样E、非概率抽样4、在抽样推断中,样本单位数的多少取决于(ABCE )。
A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样方法5、总体参数区间估计必须具备的三个要素是(BDE )。
A、样本单位数B、样本指标C、全及指标D、抽样误差范围E、抽样估计的置信度6、在抽样平均误差一定的条件下(AD )。
A、扩大极限误差的范围,可以提高推断的可靠程度B、缩小极限误差的范围,可以提高推断的可靠程度C、扩大极限误差的范围,只能降低推断的可靠程度D、缩小极限误差的范围,只能降低推断的可靠程度E、扩大或缩小极限误差范围与推断的可靠程度无关7、判定现象之间有无相关关系的方法是(ABCD)。
A、对客观现象作定性分析B、编制相关表C、绘制相关图D、计算相关系数E、计算估计标准误8、相关分析特点有( BCDE )。
A、两变量不是对等的B、两变量只能算出一个相关系数C、相关系数有正负号D、两变量都是随机的E、相关系数的绝对值介于0和1之间9、下列属于负相关的现象是( ABD )。
A、商品流转的规模愈大,流通费用水平越低B、流通费用率随商品销售额的增加而减少C、国民收入随投资额的增加而增长D、生产单位产品所耗工时随劳动生产率的提高而减少10、变量x 值按一定数量增加时,变量y 也近似地按一定数量随之增加,反之亦然,则x 和y 之间存在( AE )。
A、正相关关系B、直线相关关系C、负相关关系D、曲线相关关系E、非线性相关关系四、填空题1、根据样本各单位标志值或标志属性计算的综合指标称为统计量。
2、利用样本资料认识总体的数量特征,有两种途径即参数估计和假设检验。
3、根据样本各单位标志值或标志属性计算的综合指标称为统计量,它是样本变量的函数,用来作为总体参数的估计值。
4、从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。
5、常用的抽样组织形式有简单随机抽样,类型抽样、等距抽样、整群抽样四种。
6、在重复抽样的条件下,抽样平均误差与N 成反比,与S 成正比。
7、相关系数是测定变量之间相差密切程度和方向的代表性指标。
8、完全相关的关系即函数关系,其相关系数为 1 。
9、若变量x与y为完全线性相关,则相关系数|r|= 1或-1 ;若x与y完全没有直线相关,则相关系数|r|= 0 。
五、简答题1、什么是抽样推断?抽样推断都有哪几方面的特点?答:抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的统计分析方法。
特点:(1)是由部分推算整体的一种认识方法论;(2)建立在随机取样的基础上;(3)运用概率估计的方法;(4)抽样推断的误差可以事先计算并加以控制。
2、什么是抽样误差?影响抽样误差大小的因素有哪些?答:抽样误差是指由于抽样的偶然因素使样本各单位的结构不足以代表总体各单位的机构,而引起抽样指标和全及指标之间的绝对离差。
影响抽样误差大小的因素有:总体各单位标志值的差异程度、样本的单位数、抽样方法和抽样调查的组织形式。
3、什么是参数和统计量?各有何特点?答:参数是一个全及指标,它反映了全及总体某种数量特征;统计量即样本指标,它反映了样本总体的数量特征。
其特点是:全及指标是总体变量的函数,但作为参数其指标值是确定的、唯一的,是由总体各单位的标志值或标志属性决定的;而统计量是样本变量的函数,是总体参数的估计值,其数值由样本各单位标志值或标志属性决定,统计量本身也是随机变量。
4、什么是抽样平均误差和抽样极限误差?二者有何关系?答:抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。
即它反映了抽样指标与总体指标的平均离差程度。
抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。
抽样平均误差大,说明样本指标对总体指标的代表性低;反之则说明样本指标对总体指标的代表性高。
抽样极限误差是指用绝对值形式表示的样本指标与总体指标偏差的可允许的最大范围。
它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。
它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。
两者的关系:抽样平均误差是反映抽样误差一本水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标。
联系:Δ= t·μ即极限误差是在抽样平均误差的基础上计算得到的.5、相关分析与回归分析有何区别与联系?一、相关分析与回归分析的联系相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。
相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。
只有当变量方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。
二、相关分析与回归分析的区别1.相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分。
在回归分析中,变量之间的关系是不对等的。
2.在相关分析中所有的变量都必须是随机变量;而在回归分析中,自变量是确定的,因变量才是随机的,即将自变量的给定值代入回归方程后,所得到的因变量的估计值不是唯一确定的,而会表现出一定的随机波动性。
3.相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小,由于变量之间是对等的,因此相关系数是唯一确定的。
而在回归分析中,对于互为因果的两个变量 ,则有可能存在多个回归方程。
六、计算题1、某企业生产一批零件,随机重复抽取400只做使用寿命试验。
测试结果平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。
根据以上资料计算平均数的抽样平均误差和成数的抽样平均误差。
解:平均数的抽样平均误差为:15400300===nx σμ (小时)成数的抽样平均误差为: 025.040140010===p0078.0400)025.01(025.0)1(=-=-=n p p p μ 答:平均数的抽样平均误差为15小时,成数的抽样平均误差为0.0078。
2、外贸公司出口一种食品, 规定每包规格不低于150克,现在用重复抽样的方法抽取其中的100包进行检验,其结果如下:要求:(1)以(2)以同样的概率保证估计这批食品合格率范围。
(1)已知:100=n ,%73.99)(=t F ,3=t30.15010015030===∑∑fxf x (克)872.03.1501002259085)(222=-=-=x x σ (克)0872.0100872.0===n x σμ 26.00872.03=⨯==∆x x t μx x x X x ∆+≤≤∆-26.030.15026.030.150+≤≤-X 即 56.15004.150≤≤X (2)已知:100=n ,701=n ,%73.99)(=t F ,3=t %70%100100701=⨯==n n p%58.4100)7.01(7.0)1(=-=-=n p p p μ %74.13%58.43=⨯==∆p p t μ p p p P p ∆+≤≤∆-%74.13%70%74.13%70+≤≤-P 即 %74.83%26.56≤≤P答:(1)以99.73%的概率估计这批食品平均每包重量的范围为150.04—150.56克,大于150克,所以平均重量达到规格要求;(2)以同样的概率保证估计这批食品合格率范围为56.26%—83.74%3、单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下:68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 7671 60 91 65 76 72 76 85 89 9264 57 83 81 78 77 72 61 70 87要求:(1)根据上述资料按成绩分成以下几组:60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工? 解:(1)分配数列77%105.95%3085%5.3775%1565%5.755=⨯+⨯+⨯+⨯+⨯==∑∑ffxx (分)54.10404440)(2==-=∑∑ffx x σ(分) 67.14054.10===n x σμ 34.367.12=⨯==∆x x t μ全体职工业务考试成绩的区间范围是:66.7334.377=-=∆-=x x 下限(分) 3.8034.377=+=∆+=x x 上限(分)全体职工业务考试成绩的区间范围是73.66—80.3(3)160)234.3(54.102222222=⨯=∆=xt n σ(人) 答:(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围为73.66—80.3;(3)若其它条件不变,将允许误差范围缩小一半,应抽取160名职工。