当前位置：文档之家› 概率论与数理统计课件(第六章)

概率论与数理统计课件(第六章)

2、 t 分布 t（n）若 X~N（0，1），Y~ 2 （n），且相互独立，则 X 随机变量 T Y n 服从自由度为 n 的 t 分布，记为 T~t（n）. t 分布 t（20）的密度函数曲线和 N（0，1）的曲线形状相似.理论上 n 时，T~t（n） N（0，1）.
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -6
1. 样本具有随机性：每一个样品Xi与总体X具有相同的分布
（要求总体中每一个个体都有同等机会被选入样本） 2. 样本具有独立性：x1,x2,…,xn是相互独立的随机变量（即要求样本中每一个样品的取值不影响其他样品的取值）
[说明]：后面提到的样本均指简单随机样本，由
概率论知，若总体X具有密度函数f(x)，则样本
一些常用的统计量
2、表示变异程度的统计量—标准差、方差和极差样本方差：设 x1 , x2 ,..., xn 为取自总体的样本，则 n 1 2 称为样本方差 s2 ( X X ) i n 1 i 1 它是各个数据与均值偏离程度的度量。
样本标准差：样本方差的算术平方根 s 称为样本标准关。 . 极差：样本中最大值与最小值之差.
样本标准差
s s 2 133.9368 11.5731
3.
表示分布形状的统计量—偏度和峰度 1 n 1 3 偏度： g1 3 ( X i X ) 峰度： g 2 4 s i 1 s
4 ( X X ) i i 1
n
偏度反映分布的对称性：g1 >0 称为右偏态，此时数据位于均值右边的比位于左边的多；g1 <0 称为左偏态，情况相反；而 g1 接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量，正态分布的峰度为 3，若 g2 比 3 大很多，表示分布有沉重的尾巴，说明样本中含有较多远离均值的数据，因而峰度可用作衡量偏离正态分布的尺度之一.
1 n k k 阶原点矩： Vk X i n i 1 1 n k 阶中心矩： U k ( X i X ) k n i 1
4.
几个在统计中常用的概率分布
．正态分布 N ( , )
2 ( x )2
2
1 1 2 e 密度函数： p( x) 分布函数： F ( x) 2p 2p 2 其中为均值，为方差， < x < .
则来自这一总体的简单随机样本
x1 , x2 ,..., xn 的联合概率密度为
n
xi n e i1 , x 0(i 1,2,...,n) f X ( x1 ) f X ( x2 ) f X ( xn ) i 0, 其他
例4：考虑电话交换台一小时内的呼唤次数X,求来自这一总体的
i 1 i 1
n
i 1 n
i 1
2

都不是统计量。
一些常用的统计量
1、表示位置的统计量—平均值和中位数样本均值：设 x1 , x2 ,..., xn 为取自总体的样本， 1 n 其算术平均值称为样本均值，记为 X X i n i 1 中位数：将数据由小到大排序后位于中间位置的那个数值.
第六章统计量及其抽样分布
6.1 引言 6.2 总体和样本 6.3 统计量及其分布
6.1引
言
在我们的现实生活中，许多问题的不确定现象都是由随机因素的影响所造成的通常情况下，需要经过对实际中大量数据的处理或理论分析，可以确定这些随机因素所要服从的概率分布，根据其概率分布规律利用一些统计方法可对所研究的问题做出估计、推断和预测具体地讲，数理统计方法是研究从一定总体中随机抽取一部分（称为样本）的性质，来推断和预测总体的性质的一类有效方法
简单随机样本 x1 , x2 ,..., xn 的样本分布。解：由概率论知识，X服从泊松分布P(λ),其分布律为
p X ( x) p{ X x}
则来自这一总体的简单随机样本
x
x!
e ( 0)
x1 , x2 ,..., xn 的联合分布律为
p X ( x1 ) p X ( x2 ) p X ( xn )
注：对多数实际问题，总体中的个体是一些实在的人或物。比如，我们要研究某大学的学生身高情况，则该大学的全体学生构成问
题的总体，而每个学生即是一个个体。
事实上，每个学生都有许多特征：性别、年龄、身高、体重等等，而在该问题中，我们关心的只是该校学生的身高如何，对其他的特征不予考虑。这样，每个学生（个体）所具有的数量指标值——身高就是个体，而将所有的身高全体看成总体。
再来看一个例子：某公司要采购一批产品，每件产品要么是正品，要么是次品。若设这批产品的次品率为p(一般是未知的), 则从该批产品中随机抽取一件，用X表示抽到的次品数，不难看出X服从0-1分布。当分布中的参数p是不知道的。而p的大小决定了该批产品的质量，它直接影响采购行为的经济效益，因此人们对p提出一些问题，例如，“p 的大小是多少？”，“p大概落在什么范围内”

i 1
xi
n
x1! x2! xn !
e n
§6.3 统计量及其分布
样本来自总体，样本观测值中含有总体的各种信息，但
这些信息较为分散，有时显得杂乱无章。为将这些分散在
样本中的有关总体的信息集中起来以反映总体的各种特征，需要对样本进行加工，其中最常用的一种方法就是构造关于样本的函数，不同的函数反映总体的不同特征。
概率论与数理统计之间的关系：
数理统计学是一门研究怎样去有效地收集、整理和分析带
有随机性的数据，以对所考察的问题做出推测和预测，直至
采取一定的决策和行动提供依据和建议的数学分支学科。统计方法的数学理论要用到很多近代数学知识，如函数论、
拓扑学、矩阵代数、组合数学等等，
但关系最密切的是概率论，故可以这这样说：概率论是数
例如：某单位收集到20名青年人某月的娱乐支出费用数据 79 84 84 88 92 93 94 97 98 99 100 101 101 102 102 108 110 113 118 125 样本均值 X 99.4 样本方差
n 1 s2 ( X i X )2 n 1 i 1 1 [(79 99.4) 2 (84 99.4) 2 (125 99.4) 2 ] 20 1 133.9368
（x1,x2,…,xn）具有联合密度函数：
f n ( x1 , x2 ,, xn ) f ( x1 ) f ( x2 ) f ( xn ) f ( xi )
i 1
n
例3：设某种电灯泡的寿命X服从指数分布E(λ),其概率密度为
e x , x 0 f X ( x) x0 0,
0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0
0
5
10
15Biblioteka 20当随机变量 ~ (n)，对给定的
2 2
（0 < < 1)称满足P{ 2 2 (n)} 的 2 (n) 为自由度为n的卡方分布的分位数。
注：分位数的值可以人表中查到。
例如：n 10, 0.05, 20.05 (10) 18.307
这样一来，若抛开实际背景，总体就是一堆数，这堆
数中有大有小，有的出现机会多，有的出现机会少，因此
用一个概率分布去描述和归纳是恰当的从这个意义上看，总体就是一个分布，而其数量指标就是服从这个分布的随机变量，以后说“从总体中抽样” 与“从某分布中抽样”是同一个意思。
例1：考察某厂的产品质量，将其产品只分为合格品
称为总体的一个样本，n称为样本容量，或简称样本量，
例2：啤酒厂生产的瓶装啤酒规定净含量为640g,由于随机性，事实上不可能使得所有的啤酒净含量均为640g。现从
某厂生产的啤酒中随机抽取10瓶测定其净含量，得到如下
结果：641 635 640 637 642 638 645 643 639 640 这是一个容量为10的样本的观测值，对应的总体为该厂生产的瓶装啤酒的净含量。
以标准正态变量为基石而构造的三个著名统计量在实际中有着广泛的应用。这是因为这三个统计量不仅有明确背景，而且其抽样分布的密度函数有明显表达式，它们被称为统计中的“三大抽样分布”
1、 2 分布（卡方分布）
若随机变量 X1，X2，„ Xn 相互独立，都服从标准正态分布 N（0，1），则随机变量 2 2 Y= X 12 X 2 X n 服从自由度为 n 的 2 分布，记为 Y~ 2 （n）. Y 的均值为 n，方差为 2n.
定义：设数
x1 , x2 ,..., xn 为取自总体的样本，若关于样本的函
T T ( x1, x2 ,...,xn ) 中不含有任何未知参数，则称T为统
计量。统计量的分布称为抽样分布。例如：若x1,x2,…,xn为样本，则 xi , xi 2 都是统计量；
n n
而当 ,
未知时， ( xi )2 , xi
与不合格品，并以0记合格品，以1记不合格品，则
总体={该厂生产的全部合格品与不合格品}={由0或1组成的一堆数} 设P表示这堆数中1的比例（不合格品率），则该总
体可由一个二点分布表示
X P 0 1-P 1 P
不同的P反映了总体的差异。
比如：两个生产同类产品的工厂的产品总体分布为：
X P
0
0.983
1
0.017
X
P
0
0.915
1
0.085
显然第一个工厂的产品质量优于第二个工厂，但
是在实际中，分布中的不合格品率是未知的，如何对
之进行估计是统计学要研究的问题。
二、样本样本：为了了解总体的分布，我们从总体中随机地抽取n

e商务文档

概率论与数理统计课件(第六章)

相关文档推荐：