关于标准差与抽样平均误差的关系:标准差公式:1.总体的标准差:方差δ^2=[(x1-x)^2 +(x2-x)^2 +......(x n-x)^2]/n (用N表示更好)(x为平均数)标准差 = sqrt([(x1-x)^2 +(x2-x)^2 +......(x n-x)^2]/n)2.对样本而言:方差s^2=[(x1-x)^2 +(x2-x)^2+......(x n-x)^2]/(n-1)(x为平均数)3.样本标准差= sqrt([(x1-x)^2 +(x2-x)^2+......(x n-x)^2]/(n-1) )备注:如是总体,标准差公式根号内除以n如是样本,标准差公式根号内除以(n-1)因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)抽样平均误差(Sampling average error)什么是抽样平均误差抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
由于从一个总体可能抽取之个样本,因此抽样指标(如平均数、抽样成数等),就有多个不同的数值,因而对全及指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。
抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体总数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。
抽样平均误差的计算:(一)样本平均数的平均误差以μx表示样本平均数的平均误差,表示总体的标准差。
根据定义:1、当抽样方式为重复抽样时,样本标志值是相互独立的,样本变量x与总体变量X同分布。
所以得:(1)它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。
例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。
则抽样平均误差为多少?解:根据题意可得:(件)总体标准差(件)抽样平均误差(件)2、当抽样方式为不重复抽样时,样本标志值不是相互独立的,根据数理统计知识可知:(2)当总体单位数N很大时,这个公式可近似表示为:(3)与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,而总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。
如前例,若改用不重复抽样方法,则抽样平均误差为:(件)在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。
(二)抽样成数的平均误差总体成数P可以表现为总体是非标志的平均数。
即E(X)=P,它的标准差。
根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。
1、在重复抽样下(4)2、在不重复抽样下(5)当总体单位数N很大时,可近似地写成:(6)当总体成数未知时,可以用样本成数来代替。
例2:某企业生产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。
解:根据题意,在重复抽样条件下,合格率的抽样平均误差为:在不重复抽样条件下,合格率的抽样平均误差为:抽样调查练习题一、填空题1. 抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2. 采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-n+1)。
3. 只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4. 参数估计有两种形式:一是点估计,二是区间估计。
5. 判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6. 我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7. 常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8. 对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。
若Δ扩大一倍,则抽样单位数为原来的1/4。
9. 如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.,抽样平均误差是20.41。
(xxxXx t μμ-=∆=)10. 在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题1. 抽样误差是抽样调查中无法避免的误差。
(√)2. 抽样误差的产生是由于破坏了随机原则所造成的。
(×)3. 重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√)4. 在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)5. 抽样调查所遵循的基本原则是可靠性原则。
(×)6. 样本指标是一个客观存在的常数。
(×)7. 全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。
(×)8. 抽样平均误差就是抽样平均数的标准差。
(×) 三、 单项选择题1. 用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C )A. 2倍B. 3倍C. 4倍D. 5倍2. 事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D )A. 分层抽样B. 简单随机抽样C. 整群抽样D. 等距抽样3. 计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B ) A. 最小一个 B. 最大一个 C. 中间一个 D. 平均值4. 抽样误差是指(D )A. 计算过程中产生的误差B. 调查中产生的登记性误差C. 调查中产生的系统性误差D. 随机性的代表性误差 5. 抽样成数是一个(A )A. 结构相对数B. 比例相对数C. 比较相对数D. 强度相对数 6. 成数和成数方差的关系是(C )A.成数越接近于0,成数方差越大 B.成数越接近于1,成数方差越大 C.成数越接近于0.5,成数方差越大 D.成数越接近于0.25,成数方差越大 7. 整群抽样是对被抽中的群作全面调查,所以整群抽样是(B )A. 全面调查B. 非全面调查C. 一次性调查D. 经常性调查8. 对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)222x t n ∆=σ22222σσt N N t n x+∆=A. 4%B. 4.13%C. 9.18%D. 8.26%9. 根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是 (A )A. 甲产品大B. 乙产品大C. 相等D. 无法判断10. 抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B )A. 甲企业较大B. 乙企业较大C. 不能作出结论D. 相同四、 多项选择题 抽样调查中的抽样误差是(ABCDE )A. 是不可避免要产生的B. 是可以通过改进调查方法来避免的C. 是可以计算出来的D. 只能在调查结果之后才能计算E. 其大小是可以控制的 2. 重复抽样的特点是(AC )A. 各次抽选相互影响B. 各次抽选互不影响C. 每次抽选时,总体单位数始终不变 D 每次抽选时,总体单位数逐渐减少E. 各单位被抽中的机会在各次抽选中相等 3. 抽样调查所需的样本容量取决于(ABE )xA. 总体中各单位标志间的变异程度B. 允许误差C. 样本个数D. 置信度E. 抽样方法4. 分层抽样误差的大小取决于(BCD )A. 各组样本容量占总体比重的分配状况B. 各组间的标志变异程度C. 样本容量的大小D. 各组内标志值的变异程度E. 总体标志值的变异程度五、 名词解释 1.抽样推断 2.抽样误差3.重复抽样与不重复抽样4.区间估计 六、 计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下: (1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
22222σσt N N t n x +∆=33.203860122300===∑∑fxf x ()()00.2080~66.199667.4133.2038~67.4133.203826.2196.133.2038~26.2196.133.203826.216089.271136066.16466.1646033.1626833222+-⨯+⨯-+≤≤-======-=∑∑xx x t x X t x nffx x μμσμσ(2) N=3000, n(s ≧2000) = 38 n (s <2000)=22P= 38/60 = 0.633, δ= sqrt (pq )= (0.232)^0. 5 = 0.482 μx = δ/n^0.5 = 0.0622x x t x X t x μμ+≤≤- 0.6333- 2*0.0622~ 0.6333+2*0.0622 ,即0.5089~ 0.7577乘以3000,则估计人数在:1526 ~2273之间1-NORMDIST(2000,2038,21.26,TRUE) =2.对一批产品按不重复抽样方法抽选200件,其中废品8件。
又知道抽样总体是成品总量的1/20,当概率为95.45%时,可否认为这一批成品的废品率低于5%?3.某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?P=93% p (1-p )=0.93×(1-0.93)=0.0651()()件)(660009.05859.003.00651.03)1(2222==⨯=∆-=p p t n 651 件要求以95.45%的置信度估计该企业职工平均支出和总支出的置信区间。
.02.19598.192,45.9502.195~98.19251.02194~51.0219451.026.0200525220010400801204080601201942003880080120140802301202221元之间元和在该企业职工的平均支出%的把握程度保证下在至区间估计抽样平均误差组间方差样本平均数⨯+⨯-=∆+∆-======+⨯+⨯====+⨯+⨯==∑∑=x x i x i i ki ii x x nnn n xn x σμσσ5.有一连续生产企业,一昼夜中每小时抽5分钟产品进行全面调查,测得该产品的平均使用寿命为160小时,样本平均数的群间方差为62小时,试以95.45%的把握推断全天产品的平均使用寿命。