当前位置:文档之家› 第五章___抽样与抽样估计

第五章___抽样与抽样估计


宁波大学商学院 郑建华
13
x x 设 , , 是取自正态总体N , 2 的样本,
1
n
则有:
2
x
~
N
,
n

x ~ N 0,1
/ n
2020/3/23
宁波大学商学院 郑建华
14
x x 设 , , 是取自正态总体N , 2 的样本,则有:
1
n
1 n 2
xix
2
~
2 n 1
i1

P(L < < U )=1-
• (水L平, (U)测称不为准置的信概区率间),,1一-般称等为于置5信%度或,1%。称为显著
2020/3/23
宁波大学商学院 郑建华
25
总体均值的区间估计
1. 当总体方差σ2已知时总体均值的区间估计
4
• 2. 样本与统计量
➢总体的一部分,或者从总体中抽取的部 分单位所构成的整体,称为总体的一个 样本(sample)。样本中包含的总体单位 数称为样本容量,常用n表示。
• 有大样本和小样本之说。样本是不确定 的。
➢根据样本资料确定的数量指标,称为统 计量(statistic),或者说统计量是样本 资料的函数(不含有未知数)。
抽样序号 1 2 3 4 5 6 7 8 9 10 寿命(小时) 1050 1100 1080 1120 1200 1250 1040 1130 1300 1200
计算得样本算术平均数=1147,作为总体数学期望的估计值
例2 : 若样本 x1, xn 取自均匀分布
f
x,
1
0
0 x
其它
问在矩法下是多少?
• 一个总体中包含的总体单位的个数,称为 总体的容量,一般用N表示。存在有限总 体和无限总体之分。
2020/3/23
宁波大学商学院 郑建华
2
• 说出以下问题的总体和总体单位:
• (1)研究某部门职工收入的水平?
• (2)对某厂某月生产的电视机进行质量 检查?
• (3)研究某地区农村居民家庭的生活水 平?
• (4)研究“十五大”以来宁波市居民家 庭生活条件发生的变化?
• (5)测定一个物件的精确重量?检查某 种新型纱线的拉力强度?
2020/3/23
宁波大学商学院 郑建华
3
➢ 总体某一方面数量特征(称为总体的一个指标) 的数值虽然是客观存在的确定的常数,但又是 未知的,因此也称为总体参数(parameter)。
L
2
n 2
2
n 2
n
4 i 1
i
2
x 1 n 2
0
i
i 1
x
n 2
2
n 2
n
4 i 1
i
2
0
x 解得
ˆ x x
ˆ 1 n
ni i 1
2
1
n
n i1
i
2
2020/3/23
宁波大学商学院 郑建华
24
二、区间估计
• 所谓区间估计(interval estimate)就是以一定的可靠性给 出被估计参数的一个可能的取值范围。
度的t分布,记作t(n)。
x
f
x
n 1 2
n n
2
1
x2 2
n1
2
2020/3/23
宁波大学商学院 郑建华
11
3. F分布
若连续型随机变量X与Y独立,且
X
X
~
2 (n1), Y
~
2 (n2 ),则ξ
n1 Y
n2
的分布密度函数由下式给出,称
概率密度
ξ服从第一自由度为n1,第二自由
n
x与
xix
2相互独立。
i 1
x x 证明 , , 取自正态总体N , 2 ,且相互独立
1
n
1 n
2
i1
xix
2
n
xi
x
2
n
xi
x
2
i1
i1
n
xi
2
x
2
2 n 2 1 2 n 1
i1 / n
2020/3/23
宁波大学商学院 郑建华
15
设 x1, , xn 是取自正态总体
2020/3/23
宁波大学商学院 郑建华
5
概率抽样和非概率抽样
➢ 概率抽样(probability sampling)也叫随机抽 样(random sampling), 即抽样时遵循随机原 则。基本的组织方式有:简单随机抽样、分层 (stratified)随机抽样、系统(systematic)随机 抽样、整群(cluster)随机抽样。
• 用点估计估计参数,即使是无偏有效的估计量,也会 由于样本的随机性,使得由样本计算出的估计值并不
恰恰是真值。而且即使等于真值,由于真值未知,我
们也不能肯定这种相等。那么,究竟相差多少?于是
问题等价为:在给定可靠程度下,指出被估计参数所 在的可能值的范围,就是参数的区间估计问题。
• 具体作法是:
找出两个统计量L(x1,…,xn)与U (x1,…,xn),使
i
i
的线性函数
n
ai
xiai 不全为0,
i 1
也服从正态分布,且
n
E
ai
i
i 1
n
V
ar
a2 i
2。
i
i 1
设 x1, xn 相互独立,都服从
标准正态分布,则它们的平均
x 数x 1 n 与它们的离均差 n i1 i
n
平方和
xix
2相互独立,
i 1
n

xix
2 ~
2 n 1。
i 1
2020/3/23
s/ n
x 1/ n x
s s/ n
2020/3/23
宁波大学商学院 郑建华
16
5. 样本比例数的抽样分布
• 总体中具有某种特征的个体数占总体单位总数 的比例称作总体比例,记作P。
• 样本中具有某种特征的单位占全部样本单位的 比例称作样本比例,记作p。
• 如:民众对某项政策的支持率为P。随机选择n 个人询问他们是否支持某政策,结果有m个回 答支持,则p=m/n为样本支持率。
x
度为n2的F分布,简记为F
n1
,
n

2
f
x
n1
2
n
2
n1
2
n2
2
n1 n2
n1
2
x
n1
2
1
1
n1 n2
n n
1 2
2 x
,
x
0
0
x0
2020/3/23
宁波大学商学院 郑建华
12
4. 正态分布的有关性质
设 x1, , xn 相互独立,xi 服从
正态分布N , 2 ,则它们
x
xf
x,
dx
0
x
1dx
1
0
xdx
1
1 2
2
02
又 在矩法23
宁波大学商学院 郑建华
22
• 最大似然法是选择这样的估计量^作为的估计 值,以便使观察结果(x1,……,xn)出现的可能性 (概率)最大。
• 对于离散型变量,就是要选择^使L(; x1,……,xn )=p(x1, )p(x2, )…p(xn, )最大。
• 采用重复抽样时,m~B(n,P), E(m)=nP, D(m)=nP(1-P)。因此E(p)=P, D(p)=P(1-P)/n。
• 如果采用不重复抽样, 则m~HG(n, NP,N), E(m)=nP, D(m)=nP(1-P)(N-n)/(N-1)。因此 E(p)=P, D(p)=P(1-P)/n (N-n)/(N-1)。
23
已知~N(,2),以一组样本观察值估计的参数

n
L i 1
1
e 2
2
xi 2 2
2
1
2
n
n
2
1
2
2
e
1
2
2
n
xi 2
i 1
x ln L n ln 1 n ln
2 2 2
2
1 2
n
2 i1
i
2
x ln L 1 n
2
i
i 1
ln
x
✓ 抽样误差率(极限误差/估计量)与抽样精度的概念。
2020/3/23
宁波大学商学院 郑建华
8
5.2 常用的抽样分布
2020/3/23
宁波大学商学院 郑建华
9
1. χ2 分布

N=7

N为自由度
N=11
2
如果X1 ,
X
2
,
,
X
为相互独立的标准
n
正态分布的随机变量,则 2 X i 2
称为具有n个自由度的 2 分布,记作
• 避免系统误差,统计推断时可以计算和控制抽 样误差。
➢ 非概率抽样:根据经验或需要,主观选取若干 总体单位构成样本。
2020/3/23
宁波大学商学院 郑建华
6
抽样误差
➢ 统计调查误差:调查结果与真实值间的差异。 按来源有登记性误差和代表性误差之分。
• 登记误差:观察、登记、测量、计算等引起。 可存在于一切调查中。
2 n。密度函数为
1
x e f
x
2
n
2 2
n 1 x
2
2
相关主题