当前位置:文档之家› 商学院-6第6章 3抽样调查(6)

商学院-6第6章 3抽样调查(6)


上述总体均值、总体标准差、比例均称为总体的参数, 参数是总体的数值特征
假如随机抽取了一个容量为30的样本, 根据样本资料可以计算以下统计量:
序号 1 工资 49094.3
是否参加过培 训 Yes No
Yes
x xi / n 1554420 / 30 51814 (元)
2
3
53263.9
案例:为了加强与顾客的沟通,深入了解客户需
求,以解决客户遇到的问题,改进公司的产品质
量,优化供水服务,A市自来水公司决定进行客
户满意度调查,要求在2个月时间内完成调查报
告。
A市共有自来水用户200万户,在短短两个月 时间内必须完成客户调查并出具调查报告,你如 何完成这项工作?
案例1解析:A市共有自来水用户200万户,我们可
二、正态分布及其重要意义
标准正态分布表
三、中心极限定理及其重要意义
• 大数定律论证了抽样平均数趋近于总体平 均数的趋势,这为抽样推断提供了重要依 据。但是:

抽样平均数和总体平均数的离差究竟有多大? 离差不超过一定范围的概率究竟有多少? 离差的分布状况怎样?
• 大数定律和正态分布没有给出任何这方面 的信息。
sx 1 xx n 1


2
s
n很大
1 xx n


2
n0 n1 1 p ⒋ 样本成数:p , q n n
s ⒌ 样本单位是非标志的标准差: p =
⒍ 样本单位是非标志的方差:s p
2
p (1 - p )
= p (1 - p )
例:某大公司人事部经理整理其2500个员工的档案,发现其中有 1500人参加了公司培训。档案中记录了每个人的年薪,因此可以 计算这2500名员工的平均年薪及标准差。
第六章 抽样与参数估计
第一节 第二节 第三节 第四节
抽样估计的含义 抽样调查的基本概念 抽样调查的数理基础 抽样推断的方法
统计推断的过程
总体
样 本
样本统计量 例如:样本均 值、比例、方 差
什么是抽样推断?
例1: 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。 120个 样本 平均里程: 36,500公里 新轮胎 平均寿命
P
P1 P
当P 0.5时, P有最大值
⒍ 是非标志总体的方差:
P P1 P
2
指根据样本单位的标志值计算的用 样本指标 以估计和推断相应总体指标的综合 指标,又被称为估计量或统计量。
设样本中 n 个样本单位某项标志的标志值 分别为 x1 , x2 , xn ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n0 个,则
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样推断具有以下特点: 非全面调查 目的是推断总体的数量特征 按随机原则抽取样本单位
抽样推断的结果具有一定的可靠程 度,抽样误差可以事先计算并控制
节省调查费
调查速度快 调查结果准确可靠
应用范围广
抽样调查的应用范围 不可能进行全面调查时 对于具有破坏性的产品质量检测只 能进行抽样调查 对某些现象进行全面调查,在经济 上不合算,在资料上未必能保证,也只 能采用抽样调查。 对于时效性要求较高的某些调查 对全面调查资料进行补充修正时
Va l i d
25 40 41 43 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 65 66 67 T o ta l
从全部学生中随机抽取 20人组成样本并计算平 均体重:
样本一:52.35 样本二:50.26 样本三:53.19 …
中心极限定理的重要意义
• •
N n 第四,样本分布的标准差为: x n N 1
这是在有限总体场合下使用的公式,其中:
N n N 1 ,称为修正因子。

当N趋向于无穷大时,其值趋近于1,在允许重 复抽样的条件下,总体在任何时候都成为无限总 体,这时: N n x n N 1
49643.5
s

(x i x )2 /(n 1) 325009260 / 29

29

51300.7

No
3347 .72 (元)
p 19 / 30 0.63
30
45580.8
Yes
抽样估计就是要通过样本来估计总体参数。 比较: 总体均值: = 51800元 总体标准差: = 4000元 参加公司培训计划的比例为: P =1500/2500=0.60
.3
.2 .1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
体 重 Va l i d Pe rce n t .8 2 .5 .8 2 .5 4 .1 .8 1 .7 .8 2 .5 1 3 .2 2 .5 2 .5 4 .1 4 .1 8 .3 .8 1 .7 1 .7 .8 1 5 .7 1 0 .7 9 .9 1 .7 3 .3 .8 1 .7 1 0 0.0 Cu m ul a ti ve Pe rce n t .8 3 .3 4 .1 6 .6 1 0 .7 1 1 .6 1 3 .2 1 4 .0 1 6 .5 2 9 .8 3 2 .2 3 4 .7 3 8 .8 4 3 .0 5 1 .2 5 2 .1 5 3 .7 5 5 .4 5 6 .2 7 1 .9 8 2 .6 9 2 .6 9 4 .2 9 7 .5 9 8 .3 1 0 0.0

Freq u e n cy 1 3 1 3 5 1 2 1 3 16 3 3 5 5 10 1 2 2 1 19 13 12 2 4 1 2 121
值:51.18
Pe rce n t .8 2 .5 .8 2 .5 4 .1 .8 1 .7 .8 2 .5 1 3 .2 2 .5 2 .5 4 .1 4 .1 8 .3 .8 1 .7 1 .7 .8 1 5 .7 1 0 .7 9 .9 1 .7 3 .3 .8 1 .7 1 0 0.0
代表性误差
抽样方法 重复抽样
抽出 个体 特点 又被称作重置抽样、有放回抽样 登记 特征 放回 总体 继续 抽取
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
抽样方法 不重复抽样
抽出 个体 又被称作不重置抽样、不放 回抽样 登记 特征 继续 抽取
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行
⒈ 样本平均数(又叫样本均值): ⒉ 样本单位标志值的标准差:s ⒊ 样本单位标志值的方差:
2
x
x
i 1
n
i
n
1 xx n 1


2
1 s xx n 1


2
当样本容量很大时,1/n,与1/(n-1)相差不大, 样本方差的公式,可以直接除以n,此时与总 体的方差计算公式一致。
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。
第六章
抽样与参数估计
第一节 第二节 第三节 第四节
抽样估计的含义 抽样调查的基本概念 抽样调查的数理基础 抽样推断的方法
一、大数定律
大数定律表明: 如果随机变量总体存在着有限的平均数 和方差,则对于充分大的抽样单位数n,可以 几乎趋近于1的概率,来期望抽样平均数与总 体平均数的绝对离差为任意小。 大数定律对于抽样推断的意义: 从理论上解释了样本与总体之间的内在 联系,即随着抽样单位数n的增加,抽样平均 数有接近于总体平均数的趋势。
序号 1 2 3 … 工资 48000.3 53000.9 49600.5 …
是否参加过 培训 Yes No Yes … yes
No
总体均值:
=51800元
总体标准差: =4000元 参加公司培训计划的比例为: P =1500/2500=0.60
2499
2500
52347.6
45980.9
测试
推断
例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众 占全部登记投票人总数的比例。由于时间及财力的限制: 400个 样本 支持人数: 160 推断
支持该候选人 的选民占全部 选民的比例
抽样调查,又称抽样推断 按照随机抽样原则 抽取总体中的部分 单位进行调查,用部分单位的指标数值 作为代表,对总体的指标数值作出具有 一定可靠程度的估计与推断,从而认识 总体的一种统计方法。
中心极限定理的重要意义
中心极限定理研究的是变量和的分布和 变量平均数的分布。 它论证了以下几点:
第一,如果总体很大,而且服从正态分布,则样 本平均数的分布也服从正态分布; 第二,如果总体很大,但不服从正态分布,只要 样本足够大( n≥30 ),样本平均数的分布也趋 近于正态分布。 第三,样本平均数分布的平均数,等于总体的平 均数。
中心极限定理
(图示)
中心极限定理:设从均值为,方差为 2的一个任意总 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从正态分布。
一个任意分 布的总体 当样本容量足够 大时(n >30) , 样本均值的抽样 分布逐渐趋于正 态分布
X
为了验证中心极限定理,举例:
【例】设一个总体,含有4个元素(个体),即总体单 位数 N=4。4 个个体分别为 X1=1、 X2=2、 X3=3 、 X4=4 。总体的均值、方差及分布如下:
总体分布
.3
总体平均数: X 1 2 3 4 2.5 4
( X X )2 N
.2 .1 0 1 2 3 4
相关主题