当前位置:文档之家› 优选第五章抽样与抽样估计

优选第五章抽样与抽样估计

• 如果采用不重复抽样, 则m~HG(n, NP,N), E(m)=nP, D(m)=nP(1-P)(N-n)/(N-1)。因此 E(p)=P, D(p)=P(1-P)/n (N-n)/(N-1)。
概率抽样和非概率抽样
➢ 概率抽样(probability sampling)也叫随机抽 样(random sampling), 即抽样时遵循随机原 则。基本的组织方式有:简单随机抽样、分层 (stratified)随机抽样、系统(systematic)随机 抽样、整群(cluster)随机抽样。
n
ai
xiai 不全为0,
i 1
也服从正态分布,且
n
E
ai
i
i 1
n
V
ar
a2 i
2。
i
i 1
设 x1, xn 相互独立,都服从
标准正态分布,则它们的平均
x 数x 1 n 与它们的离均差 n i1 i
n
平方和

2相互独立,
i 1
n

xix
2 ~
2 n 1。
i 1
x x 设 ,, 是取自正态总体N , 2 的样本,
Y ~ 2 (n),则 X 的分布密度函数f x
Y n
由下式给出,称服从具有n个自由
度的t分布,记作t(n)。
x
f
x
n 1 2
n n
2
1
x2 2
n1
2
3. F分布
若连续型随机变量X与Y独立,且
X
X
~
2 (n1), Y
~
2 (n2 ),则ξ
n1 Y
n2
的分布密度函数由下式给出,称
➢ 随机误差是抽样调查所特有的。抽样估计中的 抽样误差就是指由于抽样的随机性而产生的估 计量与被估计的总体参数之间的代表性误差。
✓ 由于总体参数的未知性,某次具体抽样结果的实际抽 样误差是无法计算的。
✓ 但由于对确定的总体和确定的抽样方案,估计量的取 值存在一定的分布规律,因此可以从所有可能的样本 来考察抽样误差。抽样平均误差则是反映确定的抽样 方案下所有可能抽样实际误差绝对值的一般水平的统 计指标。
• 样本中具有某种特征的单位占全部样本单位的 比例称作样本比例,记作p。
• 如:民众对某项政策的支持率为P。随机选择n 个人询问他们是否支持某政策,结果有m个回 答支持,则p=m/n为样本支持率。
• 采用重复抽样时,m~B(n,P), E(m)=nP, D(m)=nP(1-P)。因此E(p)=P, D(p)=P(1-P)/n。
优选第五章抽样与抽样估计
2020/9/8
宁波大学商学院 郑建华
1
• 说出以下问题的总体和总体单位:
• (1)研究某部门职工收入的水平?
• (2)对某厂某月生产的电视机进行质量 检查?
• (3)研究某地区农村居民家庭的生活水 平?
• (4)研究“十五大”以来宁波市居民家 庭生活条件发生的变化?
• (5)测定一个物件的精确重量?检查某 种新型纱线的拉力强度?
• 避免系统误差,统计推断时可以计算和控制抽 样误差。
➢ 非概率抽样:根据经验或需要,主观选取若干 总体单位构成样本。
抽样误差
➢ 统计调查误差:调查结果与真实值间的差异。 按来源有登记性误差和代表性误差之分。
• 登记误差:观察、登记、测量、计算等引起。 可存在于一切调查中。
• 代表性误差:用样本资料对总体特征进行推断 时所引起的。有系统误差(非随机因素引起) 和随机误差(随机因素引起)之分。
• 2. 样本与统计量
➢总体的一部分,或者从总体中抽取的部 分单位所构成的整体,称为总体的一个 样本(sample)。样本中包含的总体单位 数称为样本容量,常用n表示。
• 有大样本和小样本之说。样本是不确定 的。
➢根据样本资料确定的数量指标,称为统 计量(statistic),或者说统计量是样本 资料的函数(不含有未知数)。
xi
x
2
n
xi
x
2
i1
i1
n
xi
2
x
2
2 n 2 1 2 n 1
i1 / n
设 x1,, xn 是取自正态总体
N , 2 的样本,x、s分别
是样本的平均数和标准差,
则t x ~ tn 1。
s/ n
证明: x ~ N 0,1
/ n
1
n
则有:
2
x
~
N
,
n

x ~ N 0,1
/ n
x x 设 ,, 是取自正态总体N , 2 的样本,则有:
1
n
1 n 2
xix
2
~
2 n 1
i1
n
x与
xix
2相互独立。
i 1
x x 证明 ,, 取自正态总体N , 2 ,且相互独立
1
n
1 n
2
i1
xix
2
n
✓ 对于无偏估计量,抽样平均误差定义为估计量的标准 差。他是可以计算的。
✓ 在一定的概率保证程度下,抽样实际误差的可能取值 的允许范围(称为抽样极限误差)也是可以计算和控 制的。
✓ 抽样误差率(极限误差/估计量)与抽样精度的概念。
5.2 常用的抽样分布
1. χ2 分布

N=7

N为自由度
N=11
1 n 2
xix
2
~
2 n 1
i1
且,相互独立
T
/ n
1
~
tn
1
x
x
而T
/ n
in1
xi
x
2
n1
1/ n
n
xi
x
2
i 1
n1
x ~ tn 1
s/ n
x 1/ n x
s s/ n
5. 样本比例数的抽样分布
• 总体中具有某种特征的个体数占总体单位总数 的比例称作总体比例,记作P。
2
如果X1
,
X
2
,,
X
为相互独立的标准
n
正态分布的随机变量,则 2 X i 2
称为具有n个自由度的 2 分布,记作
2 n。密度函数为
1
x e f
x
2
n
2 2
n 1 x
2
2
0
x0 x0
2. t分布
概率密度 标准正态分布
t-分布
0
若连续型随机变量X和Y独立,X ~ N (0,1),
概率密度
ξ服从第一自由度为n1,第二自由
x
度为n2的F分布,简记为F
n1
,
n

2
f
x
n1
2
n
2
n1
2
n2
2
n1 n2
n1
2
x
n1
2
1
1
n1 n2
n n
1 2
2 x
,
x
0
0
x0
4. 正态分布的有关性质
设 x1,, xn 相互独立,xi 服从
正态分布N , 2 ,则它们
i
i
的线性函数
➢ 总体某一方面数量特征(称为总体的一个指标) 的数值虽然是客观存在的确定的常数,但又是 未知的,因此也称为总体参数(parameter)。
• 比如:职工总体可以从不同的方面进行认识, 总平均工资,工资的总标准差,不同学历层次 的工资水平及其差异程度,所占的比例,工资 总量等。
• 总体的数量特征是对个体的数量特征或属性特 征进行计数、加总或运算的结果。如总量、平 均量、比例数、方差或标准差等是常用的总体 参数。
相关主题