当前位置:文档之家› 统计量及其分布

统计量及其分布

但实际中,情况往往并非如此,一个随机现象所 服从的分布可能是完全不知道的,或者知道其分布概 型,但是其中的某些参数是未知的。
例5.0.1 某公司要采购一批产品,每件产品不
是合格品就是不合格品,但该批产品总有一 个不合格品率 p 。由此,若从该批产品中随 机抽取一件,用 X 表示这一件产品的不合格 数,不难看出 X 服从一个二点分布b(1 , p),
第五章 统计量及其分布
§5.1 总体与样本 §5.2 样本数据的整理与显示 §5.3 统计量及其分布 §5.4 三大抽样分布 §5.5 充分统计量
引言
随机变量及其所伴随的概率分布全面描述了随机 现象的统计性规律。
概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都 是在这已知的基础上得出来的。
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
XLeabharlann 01p0.983
0.017
X
0
1
p
0.915
0.085
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
这是一个容量为10的样本的观测值, 对应的总体为该厂生产的瓶装啤酒的净含量。
完全样本
例5.1.4 考察某厂生产的某种电子元件的寿命,选 了100只进行寿命试验,得到如下数据:
表5.1.2 100只元件的寿命数据
寿命范围 ( 0 24] (24 48] (48 72] (72 96] (96 120] (120 144] (144 168] (168 192]
但分布中的参数 p 是不知道的。一些问题:
• p 的大小如何;
• p 大概落在什么范围内; • 能否认为 p 满足设定要求
(如 p 0.05)。
数理统计的任务则是以概率论为基础, 根据试验所得到的数据,对研究对象的客观 统计规律性做出合理的推断。
• 服从怎样的分布; • 分布中的参数;
学科分支:抽样调查、实验设计、回归 分析、多元统计分析、非参数统计、贝叶斯 方法,等等。
若总体 X的分布函数为 F(x)
则样本( X1, X 2,L , X n ) 的联合分布函数为
F (x1, x2 ,L , xn ) P( X1 x1, X 2 x2 L X n xn )
P( X1 x1)P( X 2 x2 )L P( X n xn )
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
在本书中,无论是样本还是其观测值,样本一般均用 x1, x2,… xn 表示,大家要注意从上下文中加以识别。
例5.1.3 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒 净含量均为640克。现从某厂生产的啤酒中随机 抽取10瓶测定其净含量,得到如下结果: 641, 635, 640, 637, 642, 638, 645, 643, 639, 640
➢ 独立性: 样本中每一样品的取值不影响其
它样品的取值 -- x1, x2, …, xn 相互独立。
用简单随机抽样方法得到的样本称为 简单随机样本,也简称样本。
于是,样本 x1, x2, …, xn 可以看成是 独立同分布( iid ) 的随机变量, 其共同分布即为总体分布。
iid——independent identical distribution
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
元件数 6 3 3 5 5 3 5 1
寿命范围 (384 408] (408 432] (432 456] (456 480] (480 504] (504 528] (528 552]
>552
元件数 4 4 1 2 2 3 1 13
表5.1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求:
➢ 随机性: 总体中每一个个体都有同等机会
被选入样本 -- xi 与总体X有相同的分布。
§5.1 总体与个体
在数理统计中,把研究对象的全体称为总体 (population)或母体,而把组成总体的每个单元 称为个体。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
例5.1.1 考察某厂的产品质量,将产品只分为 合格品和不合格品,以0记合格品,以1记不 合格品,则
总体 ={该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数}
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
在抽取过程中,每抽取一个个体,就是对总体X进
行一次随机试验,每次抽取的n个个体 X1, X 2 ,L , X n ,
称为总体X的一个容量为n的样本(sample)或子 样;其中样本中所包含的个体数量称为样本容量。样本 中的个体称为样品。
5.1.2 样本
样本具有两重性:
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
相关主题