当前位置：文档之家› 商学院-6第6章 3抽样调查(6)

商学院-6第6章 3抽样调查(6)

上述总体均值、总体标准差、比例均称为总体的参数，参数是总体的数值特征
假如随机抽取了一个容量为30的样本，根据样本资料可以计算以下统计量：
序号 1 工资 49094.3
是否参加过培训 Yes No
Yes
x xi / n 1554420 / 30 51814 （元）
2
3
53263.9
案例：为了加强与顾客的沟通，深入了解客户需
求，以解决客户遇到的问题，改进公司的产品质
量，优化供水服务，A市自来水公司决定进行客
户满意度调查，要求在2个月时间内完成调查报
告。
A市共有自来水用户200万户，在短短两个月时间内必须完成客户调查并出具调查报告，你如何完成这项工作？
案例1解析：A市共有自来水用户200万户，我们可
二、正态分布及其重要意义
标准正态分布表
三、中心极限定理及其重要意义
• 大数定律论证了抽样平均数趋近于总体平均数的趋势，这为抽样推断提供了重要依据。但是：

抽样平均数和总体平均数的离差究竟有多大？离差不超过一定范围的概率究竟有多少? 离差的分布状况怎样？
• 大数定律和正态分布没有给出任何这方面的信息。
sx 1 xx n 1

2
s
n很大
1 xx n

2
n0 n1 1 p ⒋ 样本成数：p , q n n
s ⒌ 样本单位是非标志的标准差： p =
⒍ 样本单位是非标志的方差：s p
2
p (1 - p )
= p (1 - p )
例：某大公司人事部经理整理其2500个员工的档案，发现其中有 1500人参加了公司培训。档案中记录了每个人的年薪，因此可以计算这2500名员工的平均年薪及标准差。
第六章抽样与参数估计
第一节第二节第三节第四节
抽样估计的含义抽样调查的基本概念抽样调查的数理基础抽样推断的方法
统计推断的过程
总体
样本
样本统计量例如：样本均值、比例、方差
什么是抽样推断？
例1: 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。 120个样本平均里程： 36,500公里新轮胎平均寿命
P
P1 P
当P 0.5时， P有最大值
⒍ 是非标志总体的方差：
P P1 P
2
指根据样本单位的标志值计算的用样本指标以估计和推断相应总体指标的综合指标，又被称为估计量或统计量。
设样本中 n 个样本单位某项标志的标志值分别为 x1 , x2 , xn ，其中具有和不具有某种属性的样本单位数目分别为 n1和 n0 个，则
指样本单位的抽取不受主观因素及其他系统性因素的影响，每个总体单位都有均等的被抽中机会
抽样推断具有以下特点：非全面调查目的是推断总体的数量特征按随机原则抽取样本单位
抽样推断的结果具有一定的可靠程度，抽样误差可以事先计算并控制
节省调查费
调查速度快调查结果准确可靠
应用范围广
抽样调查的应用范围不可能进行全面调查时对于具有破坏性的产品质量检测只能进行抽样调查对某些现象进行全面调查，在经济上不合算，在资料上未必能保证，也只能采用抽样调查。对于时效性要求较高的某些调查对全面调查资料进行补充修正时
Va l i d
25 40 41 43 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 65 66 67 T o ta l
从全部学生中随机抽取 20人组成样本并计算平均体重：
样本一：52.35 样本二：50.26 样本三：53.19 …
中心极限定理的重要意义
• •
N n 第四，样本分布的标准差为： x n N 1
这是在有限总体场合下使用的公式，其中：
N n N 1 ，称为修正因子。
•
当N趋向于无穷大时，其值趋近于1，在允许重复抽样的条件下，总体在任何时候都成为无限总体，这时： N n x n N 1
49643.5
s

(x i x )2 /(n 1) 325009260 / 29
…
29
…
51300.7
…
No
3347 .72 （元）
p 19 / 30 0.63
30
45580.8
Yes
抽样估计就是要通过样本来估计总体参数。比较：总体均值： = 51800元总体标准差： = 4000元参加公司培训计划的比例为： P =1500/2500=0.60
.3
.2 .1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
体重 Va l i d Pe rce n t .8 2 .5 .8 2 .5 4 .1 .8 1 .7 .8 2 .5 1 3 .2 2 .5 2 .5 4 .1 4 .1 8 .3 .8 1 .7 1 .7 .8 1 5 .7 1 0 .7 9 .9 1 .7 3 .3 .8 1 .7 1 0 0.0 Cu m ul a ti ve Pe rce n t .8 3 .3 4 .1 6 .6 1 0 .7 1 1 .6 1 3 .2 1 4 .0 1 6 .5 2 9 .8 3 2 .2 3 4 .7 3 8 .8 4 3 .0 5 1 .2 5 2 .1 5 3 .7 5 5 .4 5 6 .2 7 1 .9 8 2 .6 9 2 .6 9 4 .2 9 7 .5 9 8 .3 1 0 0.0
真
Freq u e n cy 1 3 1 3 5 1 2 1 3 16 3 3 5 5 10 1 2 2 1 19 13 12 2 4 1 2 121
值:51.18
Pe rce n t .8 2 .5 .8 2 .5 4 .1 .8 1 .7 .8 2 .5 1 3 .2 2 .5 2 .5 4 .1 4 .1 8 .3 .8 1 .7 1 .7 .8 1 5 .7 1 0 .7 9 .9 1 .7 3 .3 .8 1 .7 1 0 0.0
代表性误差
抽样方法重复抽样
抽出个体特点又被称作重置抽样、有放回抽样登记特征放回总体继续抽取
同一总体单位有可能被重复抽中，而且每次抽取都是独立进行
抽样方法不重复抽样
抽出个体又被称作不重置抽样、不放回抽样登记特征继续抽取
特点
同一总体中每个单位被抽中的机会并不均等，在连续抽取时，每次抽取都不是独立进行
⒈ 样本平均数（又叫样本均值）： ⒉ 样本单位标志值的标准差：s ⒊ 样本单位标志值的方差：
2
x
x
i 1
n
i
n
1 xx n 1

2
1 s xx n 1

2
当样本容量很大时，1/n,与1/(n-1)相差不大，样本方差的公式，可以直接除以n,此时与总体的方差计算公式一致。
是最为常用的抽样方法，用于无限总体和许多有限总体样本单位的抽样。
第六章
抽样与参数估计
第一节第二节第三节第四节
抽样估计的含义抽样调查的基本概念抽样调查的数理基础抽样推断的方法
一、大数定律
大数定律表明：如果随机变量总体存在着有限的平均数和方差，则对于充分大的抽样单位数n，可以几乎趋近于1的概率，来期望抽样平均数与总体平均数的绝对离差为任意小。大数定律对于抽样推断的意义：从理论上解释了样本与总体之间的内在联系，即随着抽样单位数n的增加，抽样平均数有接近于总体平均数的趋势。
序号 1 2 3 … 工资 48000.3 53000.9 49600.5 …
是否参加过培训 Yes No Yes … yes
No
总体均值：
=51800元
总体标准差： =4000元参加公司培训计划的比例为： P =1500/2500=0.60
2499
2500
52347.6
45980.9
测试
推断
例2：某党派想支持某一候选人参选美国某州议员，为了决定是否支持该候选人，该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制： 400个样本支持人数： 160 推断
支持该候选人的选民占全部选民的比例
抽样调查，又称抽样推断按照随机抽样原则抽取总体中的部分单位进行调查，用部分单位的指标数值作为代表，对总体的指标数值作出具有一定可靠程度的估计与推断，从而认识总体的一种统计方法。
中心极限定理的重要意义
中心极限定理研究的是变量和的分布和变量平均数的分布。它论证了以下几点：
第一，如果总体很大，而且服从正态分布，则样本平均数的分布也服从正态分布；第二，如果总体很大，但不服从正态分布，只要样本足够大（ n≥30 ），样本平均数的分布也趋近于正态分布。第三，样本平均数分布的平均数，等于总体的平均数。
中心极限定理
（图示）
中心极限定理：设从均值为，方差为 2的一个任意总体中抽取容量为n的样本，当n充分大时，样本均值的抽样分布近似服从正态分布。
一个任意分布的总体当样本容量足够大时(n >30) ，样本均值的抽样分布逐渐趋于正态分布
X
为了验证中心极限定理，举例：
【例】设一个总体，含有4个元素（个体），即总体单位数 N=4。4 个个体分别为 X1=1、 X2=2、 X3=3 、 X4=4 。总体的均值、方差及分布如下:
总体分布
.3
总体平均数： X 1 2 3 4 2.5 4
( X X )2 N
.2 .1 0 1 2 3 4

e商务文档

商学院-6第6章 3抽样调查(6)

相关文档推荐：