当前位置:
文档之家› 样本与抽样分布--基本概念.ppt
样本与抽样分布--基本概念.ppt
若总体X是连续型的. 为了获取密度函数f(x),
可选取包含样本观测值的区间(a1,al],并填表绘图:
分布密度估计表
频数 频率 密度估
区间划分 ni ni / n 计值 yi
(a0 , a1]
n1
n1 / n
n1 / n a1 a0
(a1 , a2 ]
n2
n2 / n
n2 / n a2 a1
满足上述要求的样本称为简单随机样本, 获取 简单随机样本的方法称为简单随机抽样。
今后,凡提到的样本都是指简单随机样本。
二、统计量与样本矩
对总体X 推断前需要对样本进行加工或提炼
定义 设 X1, X2, … , Xn 是来自总体X 的样本, 如果函数φ(x1, x2, …, xn)为x1, x2 , …, xn 的一个实 值函数, 且φ 中不包含任何未知参数, 那么称
样本均值 样本方差
1 n
X n i1 Xi
S 2
1 n1
n
(Xi
i 1
X )2
样本标准差
S
1 n1
n i 1
(Xi
X )2
样本k阶原点矩
Mk
1 n
n i 1
X
k i
(k 1, 2, ...)
样本k
n
(Xi
i 1
X )k
(k 1, 2,...)
分布如下表, 试依据这些资料作出成绩频率直方图.
成绩分布表
分布密度估计表
得分范围
得分 人数
频数 频率 密度估
区间划分 ni ni / n 计值 yi
(40,50]
2
(40,50] 2 2/150 2/1500
(50,60] 14
(50,60] 14 14/150 14/1500
(60,70] 32
(60,70] 32 32/150 32/1500
统计量间的关系: M1
X
,
M
2
M2
X2
n1 n
S2
三、经验分布函数与直方图
为了获得总体X 的分布, 先引入一个定义 定义1 设X1, X2, …, Xn是来自总体X 的一个容 量为n的样本, 把它们依大小顺序排列为
X(1) , X(2) ,, X(n) 则称其为样本次序统计量。
由此 样本最大值统计量为 X max X (n)
Fn(x) 1
Fn
(
x)
k n
,
x(k ) x x(k1)
1 , x x(n)
(k=1,2,···,n-1)
O x(1) x(2) … x(n) x
显然, Fn(x)具有分布函数的特征, 且根据大数定律, Fn ( x) P F ( x) (n ), 所以当n较大时, F ( x) Fn ( x). 故通常称 Fn(x)为X 的 经验分布函数.
节目录
第七章 样本与抽样分布
7.1 基本概念 7.2 基本分布 7.3 正态总体的抽样分布
从本章开始, 我们将讲述数理统计的基本内容. 与概率论一样,数理统计是研究随机现象统计规 律性的一门数学学科. 它是以概率论为基础, 由实 际观测资料出发, 研究如何合理地采集或收集资料 并根据观测得到的资料对随机变量的分布数字特 征等作出科学的推断.
x1 , x2 ,, xn 为X1, X2, … , Xn 的一个观测值, 简称 样本观测值
抽样(抽取样本)目的:
通过获取样本(X1, X2, … , Xn)的有限信息 对总体X的概率分布及其各种特征进行推断
抽样要求:
1o 代表性: X1, X2, … , Xn 与总体X 有相同的分布 2o 独立性: X1, X2, … , Xn 是相互独立的随机变量
如:某厂 生产灯泡 的寿命的 全体就是 一个总体
灯泡的寿命
如:每个灯 泡的寿命就 是一个个体
每个个体的出现带有随机性,因此代表总体取 值的变量都是一个随机变量,通常用X(或Y,Z)表示. 总体的概率分布就是随机变量X的概率分布.故今 后将不区分总体与相应的随机变量.常称作总体X. 《数理统计》研究的宗旨:
寻找总体X 的概率分布及其各种特征
F(x) 1
寻求:
EX , DX ,Cov( X ,Y )
E(X kY l )
O
x
E[( X EX )k (Y EY )l ]
从总体X 中抽取一个个体, 就是对总体X 进行 一次试验 (观测), 从总体X 中随机的抽取n个个体:
X1, X2,, Xn 就是对总体X进行了一组试验. 通常把由这n个试 验组成的试验组称为总体X的一个样本(或子样), 样本中个体的数目n称为样本容量,其中的Xi叫样本 的第 i 个分量. 对Xi的一次观测值,记之为xi ,并称
T ( X1, X 2 ,, X n () 是随机变量)
为一个统计量. 若 x1, x2 , …, xn 为样本观测值, 则称
t ( x1, x2 ,, xn )是统计量T 的一个观测值.
例1 当总体期望已知时,有下述统计量:
S 2
1 n
n
(Xi
i 1
)2
常用的统计量
总区间划分要求6~17个, 每区间至少含1个观测值.
频 率 ni P 概 率 ai f ( x)d x
n
ai1
f (x) yi
(al1,al ]
nl
nl / n
nl / n al al1
O
a0 a1 a2 a3 … al-1 al x 频率直方图
例2 从某校升学考卷中随机抽取150份, 其成绩
定义 可知
样本最小值统计量为
样本中值统计量为
X min X (1) Me X ([n/ 2]1)
样本级差为
R X(n) X(1)
取次序统计量的一组观测值 x(1) , x(2) ,, x(n) 则对任意的实数 x, 事件{X ≤x} 发生的频率为
0 , x x(1)
《数理统计》研究的问题:怎样选择有效的 抽样方法采集数据(抽样), 并利用抽样获得的有 限数据, 对被研究的随机现象的规律性作出尽可能 精确而可靠的结论(推断).
7.1 基本概念
一、总体与样本 二、统计量与样本矩 三、经验分布函数与直方图
一、总体与样本
总体(母体):研究对象(取实值)的全体. 个体:组成总体的每个元素.
(70,80] 43
(70,80] 43 43/150 43/1500
(80,90] 39
(80,90] 39 39/150 39/1500
(90,100] 20
(90,100] 20 20/150 20/1500
根据分布密度估计表即可画出频率直方图.