当前位置:文档之家› 1-3 基本概念与抽样分布

1-3 基本概念与抽样分布

经过一次抽样否,样本(X1,X2,…,Xn)又是 一组确定的样本值(x1,x2,…,xn)。
上页
下页
返回
由于抽样的目的是为了对总体进行统计推断, 为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法. (2). 简单随机样本
最常用的一种抽样方法叫作“简单随机抽 样”,它要求抽取的样本满足下面三点:

例题 值1 样本 32 中位数 31 样本均值 36.5 样本极差 37 值2 65 值3 28 值4 35 值5 30 值6 29
上页
下页
返回
4. 经验分布函数
(1). 定义
当给定次序统计量的一组值 定义对
称Fn(x)为总体X的经验分布函数。为样本值不 超过x的频率。 上页 下页 返回
经验分布函数Fn(x)从样本直观得到描述性分布.
上页
下页 返回
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机向量.
但是,一旦取定一组样本,得到的是n个具 体的数 (X1,X2,…,Xn),称为样本的一次观察值, 简称样本值 .
上页
下页 返回
样本具有两重性: 10. 随机性 样本(X1,X2,…,Xn)本身是随机向量。
20. 相对确定性
若n2>2
EX不依赖于第 一自由度n1.
上页
下页
返回
20. 若n1=1时,F~F(1, n2)= t 2(n2).
30. 极限分布 若X~F(n1,n2), n2>4,则
上页
下页
返回
40. 分解定理: 设X1, … ,Xn~N(0,σ2)且相互独立,
是柯赫伦(Cochran)分解定理的具体应用, 它也在方差分析中有重要作用。
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
国产轿车每公里耗油 量的全体就是总体
上页
下页 返回
由于每个个体的出现是随机的,所以相应 的数量指标的出现也带有随机性. 从而可以把 这种数量指标看作一个随机变量,因此随机变 量的分布就是该数量指标在总体中的分布. 这样 总体就可以用一个随机变量及其分布来描述.
上页
下页
返回
(3). T变量的性质:
10. T ~ t(n)为具有自由度为n的t分布的随机变 量,则T的数字特征具有如下性质: 当 n =1时, T ~ t(n)实际上是柯西分布,任何 阶矩均不存在;
当n >2, E(T)=0; D(T)=n / (n-2) . 且有
上页
下页
返回
事实上
上页
下页
返回
它反映了总体k 阶矩 的信息
它们均是随机变量
样本k-阶中心矩
它反映了总体k 阶 中心矩的信息
k=1,2,…
上页
下页 返回
k=1时, A1称为样本均值
样本均值 k=2时, B2称为样本方差
它反映了总体 均值的信息 它反映了总体 方差的信息
更加常用简称为 样本方差
样本方差
上页
下页
返回
(2). 矩的性质
其在方差分析中有很重要的作用。
上页
下页 返回
40. 极限分布
应用Lindeberg中心极限定理可得:
上页
下页
返回
3. t -分布 (1). 定义: 设X~N(0,1) , Y~ 2(n), 且相互独立,则称随机 变量 记为T~t(n). 所服从的分布为自由度为 n的 t 分布,也称为t变量. (2). T变量的密度函数为:
数学定义: n个随机变量X1,X2,…,Xn独立同分 布(X与同分布),则称(X1,X2,…,Xn)来自总体X的容 量为n的简单随机样本,简称为样本.
简单随机样本是应用中最常见的情形,今后, 当说到“X1,X2,…,Xn是取自某总体的样本”时, 若不特别说明,就指简单随机样本.
上页
下页 返回
3. 总体、样本、样本值的关系 事实上我们抽样后得到的资料都是具体的、 确定的值. 如我们从某班大学生中抽取10人测量 身高,得到10个数,它们是样本取到的值而不是 样本. 我们只能观察到随机变量取的值而见不到 随机变量.
上页
下页
返回
2、 2 分布
是由正态分布派生出来的一种分布. (1). 定义 设 X1, … ,Xn~N(0,1)且相互独立,则称随机变量:
所服从的分布为自由度为 n 的 n为独立随机正态变量的个数, 也称为
上页
下页 返回
其中 Γ(x)为伽玛(Gamma)函数
可由数归 法得到
具有如下性质:
上页
下页
也称为F变量 服从自由度为n1及 n2 的F-分布,n1称为第一自 由度, n2称为第二自由度,记作 F~F(n1, n2) . 由定义可见, ~F(n2, n1)
上页
下页 返回
(2). 若X~F(n1,n2), X的概率密度为
(3). F变量的性质 10. 若X~F(n1,n2),X的数学特征:
上页
下页
返回
上页
下页
返回
(2). 最小、最大的分布
另外,(X(1),X(2),…,X(n))联合密度
上页
下页
返回
(3). 中位数、样本极差
中位数
样本极差 次序统计量、中位数、样本极差都是统计量。 极差可以反映样本值变化的程度或离散程度。
上页
下页 返回
例1. 用Excel计算下列样本中位数、均值、方 差、标准差、极差.
则称 x是X (概率分布)的 -上侧分位点.
特别地; (1).正态分布
查表P355页表1.
上页
下页
返回
查表P362页表4.
(3). T~ t(n) 学生氏分布
查表P360页表3.
上页
下页
返回
(4).F ~ F(m,n)
查表P366页表5.
上页
下页
返回
例1

上页
下页
返回
例2

上页
下页
返回
样本直方图可以描述. (2). 经验分布函数的性质 10. 具有通常分布函数的三个性质,图形呈跳跃上升; 20. Fn(x)是一个随机变量;
上页
下页
返回
30. 经验分布函数Fn(x)与总体分布函数F(x)的关系
格列汶科(Glivenko)定理:
上页
下页
返回
三、 抽样分布
统计量既然是依赖于样本的,而后者又是随 机变量,故统计量也是随机变量,因而就有一定 的分布,这个分布叫做统计量的“抽样分布” . 精确抽样分布 (小样本问题中使用) 抽样分布 渐近分布
10.随机性: X1,X2,…,Xn每个结果等可能被抽取。 20.代表性: X1,X2,…,Xn中每一个与所考察的总体 有相同的分布; 30.独立性: X1,X2,…,Xn是相互独立的随机变量,每 个样本值互不干扰。
上页
下页 返回
由简单随机抽样得到的样本称为简单随机样 本,它可以用与总体独立同分布的n个随机变量 X1,X2,…,Xn表示.
X1,X2,…,Xn是来自总体X~
则有
上页
下页
返回
30. 的说明
又相互独立
上页
下页
返回
2. 两个正态总体
情形
定理 3.
上页
下页
返回

也有

上页
下页
返回

统计四大分布的定义、基本性质以及 上述抽样分布定理在后面的学习中经常 用到,要理解,牢记!!
上页
下页 返回
五、分位点
下面给出概率分布的上侧分位数(分位点)的定义, 它在计算统计查表时经常使用. 1. 定义 设X是随机变量,对(0,1),若存在x使
上页
下页
返回
总体(理论分布) ? 样本 样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质. 样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
上页
下页 返回
实际上,样本的分布与总体分布的关系如下 定理1. 若总体的分布函数为F(x),则其简单随 机样本的联合分布函数为
§3 基本概念与抽样分布
一、基本概念 二、统计量 三、抽样分布 四、抽样分布定理 五、分位点
一、基本概念
1. 总体 一个统计问题总有它明确的研究对象. 研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体

研究某批灯泡的质量
上页
下页 返回
然而在统计研究中,人们关心总体仅仅是关心 其每个个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
统计中,总体这个概念的要旨是:
总体就是一个随机变(向)量或其概率分布.
数理统计研究的内容: 总体相应随机变(向)量
的概率分布及数字特征.
上页
下页 返回
2. 样本
(1). 抽样、样本、样本值 为推断总体分布及各种特征,按一定规则从 总体中抽取若干个体进行观察试验,以获得有关 总体的信息,这一抽取过程称为 “抽样”,所 抽取的部分个体称为样本. 样本中所包含的个体 数目称为样本容量. 从国产轿车中抽5辆 进行耗油量试验 样本容量为 5
上页
下页
返回
二、统计量
1. 定义
由样本值去推断总体情况,需要对样本值进行 “加工”,这就要构造一些样本的函数,它把样 本中所含的(某一方面)的信息集中起来.
设(X1,X2,…,Xn)为总体X的一个样本, f(X1,X2,…,Xn) 是一个不含任何有关总体分布未知参数的函数,称 为此总体的一个统计量,它是完全由样本决定的量. 统计量实际上也是一个随机变量,它是一个 随机向量的函数。
相关主题