第五章 抽样理论解析
2 X
2 N n
n ( N 1
)
定理四:如果总体是正态分布,期望值为,方差2,则样 本均值也是正态分布,期望值为,方差为2/n。 定理五:假设总体为期望值为,方差2的一个分布(不一定是 正态分布),则样本均值标准化后的随机变量
X Z / n
有渐近正态分布。 定理五为中心极限定理的结论。
样本统计量
我们可以从总体总取随机样本,然后使用这 些样本,从而获得对总体参数进行估计或假 设检验所需的值。 为了估计总体参数,要从样本获得一个称为 样本统计量的量,简称为统计量。数学上, 一个容量为n的样本的统计量是随机变量 X1,X2,…,Xn的函数。
抽样分布
我们可以看到,从样本X1,X2,…,Xn计算的一个样本 统计量是这些随机变量的一个函数,它本身也是一 个随机变量。一个样本统计量的概率分布常称为该 统计量的抽样分布 换个角度,我们也可以考虑从总体中抽取样本容量 为n的各种可能样本。对每一个样本计算这个统计 量。用这种方法获得统计量的分布,这就是它的抽 样分布。 从抽样分布当然可以计算期望值、方差、标准差、 矩等等。标准差有时也称为标准误差。
随机样本
如何选取样本是统计推断的一个重要问题。 我们从总体中抽样所作的结论的可靠性依赖 于样本是否选取得当,是否能充分代表总 体。 从有限总体抽样保证总体的每一成员有同等 机会进入样本,这样的抽样叫随机抽样。
总体参数
当描述总体的随机变量X的概率分布f(x)(概率函数和 密度函数)已知时,我们认为总体是已知的。例如, 倘若X是正态分布,我们就说总体是正态分布的,或者说有 一个正态总体。 在f(x)中会有一些量,如正态分布中的、,或者二项式分 布中的p等等。这些量常成为总体参数。当总体已知时,这 些总体参数都是已知的。 当总体的概率分布f(x)不是完全清楚时,对f(x)虽然有一些概 念,可以做出某些假设,但f(x)的总的状况仍会是一个重要 问题。例如,我们知道某一分布是正态分布,但不知道均值 和方差,希望对它们作出统计推断。
例子
1 我们希望提取天津市25-35岁成年人(总体) 身高的信息,现仅从这个总体中选择10000 个体(样本)作考察。 2 我们希望提取某一方向来的宇宙线的动量 (总体),然后现仅选择其中10000个事例的动 量(样本)作为考察,我们根据样本的分布从而 推断出此方向宇宙线的动量期望值和方差 (统计推断)。
X ,有
E( X ) X
其中是总体的期望值。
定理二:如果总体是无限的,进行随机抽样,或者 总体是有限的,进行有放回抽样,则均值的抽样分 2 布的方差记为 X , 有
2 E (( X ) 2 ) X
2
n
定理三:如果总体容量为N,抽样是无放回的,样 本量n<=N,定理二中的式子换成则
样本均值
设X1,X2,…,Xn记样本容量为n的随机样本,它们是 独立同分布的随机变量。样本均值也是一个随机变 量,记为
X 1 X 2 ... X n X n
均值的抽样分布
设f(x)是一给定总体的概率分布,从中抽出一个容 量为n的样本,自然会寻找样本统计量样本均值的 概率分布,这个分布叫样本均值的抽样分布。 定理一:均值抽样分布的期望值记为
2
n
当n值较大时(n>=30),它很接近2,要得到无偏估计量, 这要定义 2 2 2 ( X X ) ( X X ) ... ( X X ) n 2 2 2 n ˆ S S 1 n 1 n 1 这样有E(S2)=2。
S S S S , S S
1 2 1 2 1 2
2 S1
2 S2
பைடு நூலகம்
这两个样本的选择相互无任何联系,也就是说样本是独立的
如果我们对两样本(独立的)统计量的和感兴趣,那 么S1和S2之和的抽样分布的期望值和方差为:
2 2 S S S S , S S S S
无放回抽样
如果我们从一个罐子中抽取一个物体,在下一次抽 取前,可以有将该物体放回或不放回两种选择。前 一种选择中一个特定的物体可以一次再次地被抽 中,而后一种选择中,一个物体仅能抽中一次。总 体的每一成员可以被抽中多次的抽样称为有放回抽 样,仅能抽中一次的称为无放回抽样。 对一个有限总体作有放回抽样,理论上可以考虑为 无限总体,因为任何样本量的样本均可以选择,而 不会穷尽总体。对一个非常大的有限总体抽样时, 实用上常考虑为无限总体抽样。
1 2 1 2 1 2 1 2
样本方差
设X1,X2,…,Xn是容量为n的随机样本,我们定义一个样本 方差,这个随机变量为 ( X 1 X ) 2 ( X 2 X ) 2 ... ( X n X ) 2 2 S n 当一个统计量的期望等于对应的总体参数时,我们称这个统计量 时该参数的无偏估计量,其值是一个无偏估计。然而 n 1 2 E (S 2 ) S
第五章 抽样理论
总体、样本和统计推断
在实践中,我们常想从一大群个体或实物中 提取有用的结论,所要考察的整个一大群被 称为总体。但全部考察可能是困难的,甚至 不可能,所以我们仅考察总体的一部分,这 部分称为样本。我们的目的是从样本发现的 结果推断总体的某种事实,这一过程称为统 计推断。获得样本的过程称为抽样。
比例的抽样分布
假设一个总体是无限的,具有二项式分布,其成功 概率为p。从这个总体中抽取容量为n的一切可能样 本,对每一样本可以确定一个统计量,即事件成功 的比例P,我们可以获得这样的比例抽样分布,它 的期望值P和方差P由下式给出:
P p, P
pq n
p(1 p) n
差与和的抽样分布
假设我们给定两个总体,从第一个总体抽出一个容量n1的样 本,算出一个统计量S1,S1有一个抽样分布,其期望值和 标准差分别为 S1 和 S1。类似地,从第二个总体抽出一个容 量为n2的样本,算出统计量S2,其期望值和标准差分别为 S2 和 S2 从两个总体抽取这两个样本的可能组合,可以获 得差S1-S2的分布,称之为统计量差的抽样分布,这个抽样 分布的期望值和标准差分别记为