当前位置:
文档之家› 第五章 数理统计的基本概念n
第五章 数理统计的基本概念n
n
样本( X1X 2, , X n )的联合密度函数为 f (xi )
2020/11/15
i 1
21
例:设Xk来自于参数为k的指数分布,k 1, 2, , n,
且相互独立,求(X1, X 2,
,
X
)的联合分布函数
n
解 由于Xk来自于参数为k的指数分布,
所以 FXk ( xk ) 1 ek xk , xk 0
• 依据推断形式不同,统计推断可分为估计和假设检验两 种,它们构成了统计学的基础 。
• 依据不同的理论模型,统计推断可分为许多不同的分支 学科。比如,参数和非参数、线性和非线性、方差分析、 回归分析、时间序列分析、多元统计分析等等。
• 依据对概率的不同解释,统计推断可分为频率统计和贝
叶斯统计。对某件事情发
生机会的信念
频率的稳定值
统计推断与概率论的区别
• 在概率论中,我们研究的随机变量的分布都是假设已 知的,在这一前题下去研究它的性质、特点和规律性。 例如求出它的数字特征,讨论随机变量函数的分布, 介绍常用的各种分布等。
• 统计推断以概率论为理论基础,根据试验或观察得到 的数据,来研究随机现象,对研究对象的客观规律性 作出种种合理的估计和判断。
2020/11/15
15
• 容量为 n 的样本在观察之前为一个n 维 随机向量 ( X1,X2,…,Xn),当 n 次 观察一经完成,我们就得到由一组实数
组成的 n 维向量 (x1,x2,…,xn) ,
它是n 维随机向量(X1,X2,…,Xn )的 一次实现。
2020/11/15
16
由于我们是利用样本观察来对总体的分布进行推 断,因而从总体中抽取样本进行观察时必须是随机的。 所以对于随机抽样来说,对其某一次观察结果而论, 是完全确定的一组值,但它又是随每次抽样观察而改 变的,由于我们要依据这一观察结果进行分析推断, 并研究比较各种推断方法的好坏,因而一般考虑问题 时,就不能把看为确定的数值,而应该看作为随机向 量X= (X1,X2, …,Xn) ,称它为容量是n的样本,因而 对样本也有分布可言。
2020/11/15
4
例1 • 某市场分析人员搜集一个消费者的样本,
要求样本中每个人回答对某商品的观点。 从得到的这些样本数据中,市场分析人员 必须做出这种商品有无足够需求量的决定。 若存在足够需求,分析人员还要选择包括 设计、价格及市场范围。所有这些问题都 可以从调查的样本数据所提供的信息中得 到回答。
为什么要学数理统计
数理统计是运用概率论的基础知识,更侧重于应用随 机现象本身的规律性来考虑资料的收集整理和分析,建 立有效的数学方法,从而找出相应的随机变量的分布律 或它的数字特征,对所关心的问题作出估计与检验。
概率论中的一个最基本的假设就是:研究对象的分布 已知。而在实际中,我们往往不知道随机变量,的确切 分布,这就是数理统计所讨论问题的应用背景,它需要 用已有的部分信息去推断整体情况。
(1) 代表性:X1, X2 ,, Xn中每一个与总体 X 有相同的分布. (2) 独立性:X1, X2,, Xn 是相互独立的随机变量.
则称 ( X1, X2 , , Xn ) 为n的简单随机样本.
获得简单随机样本的抽样方法称为简单随机抽样.
2020/11/15
20
• 样本的分布
定理: 设( X1, X2,, Xn)为来自总体X的样本.
例2 • 某百货公司对购买的一批电灯泡进行抽样
检验。在检验的基础上决定是否接受这批 灯泡。这种检验可能从这批灯泡中抽取15 只作为样本,检验样本的废品数和平均使 用寿命。是否接受的决定建立在观察到的 废品数和平均使用寿命上。
• 在以上两个例子中,都需要在不确定情况下对总体状 态进行预测或决策,之所以产生不确定性,是因为我 们无法拥有进行预测或决策所需的全部信息(总体数 据)。在使用不完全信息(样本数据)进行预测和决策 时,必须借助于一种叫做统计推断的统计方法。
2020/11/15
30
设( x1, x2 ,, xn )是样本( X1, X 2 ,, X n ) 的观察值 则称f ( x1, x2 ,, xn )是 f ( X1, X2,, Xn ) 的观察值
注 1统计量 f ( X1, X2,, Xn )是随机变量; 2°统计量用于统计推断,故不应含任何关
(1)若总体X的分布函数为F(x),则样本( X1X 2, , X n )
n
的分布函数为 F(xi ) i 1
(2)若X为离散型随机变量,概率分布律为P( X xk )
n
pk ,则样本( X1X 2, , X n )的联合分布律为 pki i 1
(3)若X为连续型随机变量,概率分布律为f (x),则
2020/11/15
2
• 当然统计学中研究的问题要比这个例子 复杂得多。
• 现代统计学所提供的各种统计方法,作 为在不确定情况下进行预测和决策的重 要辅助工具,被广泛地应用于所有出现 定量数据且需要对它们进行分析和解释 的问题中(称这类问题为统计问题)。
2020/11/15
3
• 在对什么是统计学做详细解释之前,我 们先考查两个需要应用统计方法的问题, 从这些问题中我们希望大家能领悟出统 计问题的基本要素。
数理统计的基本任务是:根据从总体中抽取的样本,
利用样本的信息推断总体的性质.
2020/11/15
17
总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的样本值。如我们从全班同学中抽取10人测 量身高,得到10个数,它们是样本值而不是样 本。我们只能观察到随机变量的取值而见不到 随机变量。
1
π3 (1 x12 )(1 x22 )(1 x32 ) , x1 , x2 , x3 R
2020/11/15
P133 例5.2 23
• 直方图与经验分布函数
2020/11/15
24
2020/11/15
25
2020/11/15
26
例 某食品厂生产听装饮料,现从生产线上随机抽取5听 饮料,称得其净重(克)为: 351 347 355 344 351
Ii
1, 0,
{Xi {Xi
xx}}不 发发 生生, 则
Fn( x)
n( x).
n
2020/11/15
28
2020/11/15
29
§5.2 统计量
由样本推断总体情况,需要对样本值进行 “加工”,这就需要构造一些样本的函数,它把样 本中所含的信息集中起来. • 统计量
来自总体X的样本X1,X2, …,Xn的函数g (X1,X2, …,Xn) ,若是连续的且不含任何未知 参数,则称为一个统计量。
• 随机样本与样本值
样本的定义: 从总体X中,随机地抽取n个个体:X1, X2,, Xn
称为总体X的一个样本,记为 ( X1, X2 , , Xn ) 样本中所包含个体的总数n称为样本容量.
样本值: 每一次抽取所得到的n个具体数值:( x1 , x2 , , xn )
称为一个样本值(观察值)。
样本与抽样分布
• 统计推断就是通过从总体中抽取一部分个体, 根据获取的数据来对总体分布得出推断的。
• 被抽出的部分个体叫做总体的一个样本。
• 显然,样本就是总体的一个有限子集。
• 若将总体定义为随机变量 X ,总体分布就是 随机变量 X的概率分布,总体数量特征就是随 机变量 X 的数字特征。
• 这时,从总体中抽取一个个体,就是对总体X 进行一次观察并记录其结果。
x 355
2020/11/15
27
注 1° k为样本中不超过x的样本的最大个数,
即在n次重复独立试验中,事件 { X x}
发生的次数. ( x(1) x(2) x(k) x,有k个样品的取值 x)
2 Fn( x)为事件{X x}的频率.
n
事实上,令 n( x) Ii,其中
i 1
( X1, X2 , X3 )的联合概率密度.
解 因为Xi自于柯西分布,所以Xi 的密度函数是
pXi
(
xi
)
1 π
1
1 xi2
,
xi (i 1,2,3)
所以
(
X1
,
X
2
,
X
3
)
的联合概率密度是:
3
p( X1,X2,X3 )( x1, x2 , x3 ) pXi ( xi )
i 1
1
• 通过上面的例子大家对统计问题应该有了初步的了解。 下面我们将介绍上面例子中涉及到的几个统计学的基 本概念,这些概念是对统计学的本质和特征的概括和 反映,是统计思维网络上的结点。掌握了这些基本概 念后,大家对统计问题会有更深刻的认识和理解。
2020/11/15
7
概括地讲,数理统计研究以有效的方式 采集、 整理和分析受到随机因素影响的数据,并对所考 察的问题做出推断和预测,直至提供依据和建议.
数理统计研究内容十分广泛,其中一类重要的问题便 是统计推断.统计推断是利用试验数据对研究对象的性质 作出推断,其中有两个重要方面:参数估计和假设检验。
2020/11/15
1
• 例如,要了解全班同学的身高情况,先 要测量并记录班上每个同学的身高,然 后用记录下来的身高数据计算全班同学 的平均身高。这里的第一步就是搜集数 据,第二步就是从搜集到的数据集中获 取信息。平均身高正是反映全班同学身 高状况的重要信息。
• 在统计推断中,我们研究的随机变量的分布是未知的, 或者是不完全知道的,人们是通过对研究的随机变量 进行重复独立的观察,得到许多观察值,对这些数据 进行分析,从而对所研究的随机变量的分布作出种种 推断。
第五章 数理统计的基本概念
总体与样本 统计量 数理统计中几个常用分布 抽样分布定理