当前位置:文档之家› 概率论与数理统计课件(第六章)

概率论与数理统计课件(第六章)


2、 t 分布 t(n) 若 X~N(0,1) ,Y~ 2 (n) ,且相互独立,则 X 随机变量 T Y n 服从自由度为 n 的 t 分布,记为 T~t(n). t 分布 t(20)的密度函数曲线和 N(0,1)的 曲线形状相似.理论上 n 时,T~t(n) N(0,1).
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -6
1. 样本具有随机性:每一个样品Xi与总体X具有相同的分布
(要求总体中每一个个体都有同等机会被选入样本) 2. 样本具有独立性:x1,x2,…,xn是相互独立的随机变量(即 要求样本中每一个样品的取值不影响其他样品的取值)
[说明]:后面提到的样本均指简单随机样本,由
概率论知,若总体X具有密度函数f(x),则样本
一些常用的统计量
2、表示变异程度的统计量—标准差、方差和极差 样本方差: 设 x1 , x2 ,..., xn 为取自总体的样本,则 n 1 2 称为样本方差 s2 ( X X ) i n 1 i 1 它是各个数据与均值偏离程度的度量。
样本标准差:样本方差的算术平方根 s 称为样本标准关。 . 极差:样本中最大值与最小值之差.
样本标准差
s s 2 133.9368 11.5731
3.
表示分布形状的统计量—偏度和峰度 1 n 1 3 偏度: g1 3 ( X i X ) 峰度: g 2 4 s i 1 s
4 ( X X ) i i 1
n
偏度反映分布的对称性:g1 >0 称为右偏态,此时数据位 于均值右边的比位于左边的多;g1 <0 称为左偏态,情况相反; 而 g1 接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多 远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一.
1 n k k 阶原点矩: Vk X i n i 1 1 n k 阶中心矩: U k ( X i X ) k n i 1
4.
几个在统计中常用的概率分布
. 正态分布 N ( , )
2 ( x )2
2
1 1 2 e 密度函数: p( x) 分布函数: F ( x) 2p 2p 2 其中 为均值, 为方差, < x < .
则来自这一总体的简单随机样本
x1 , x2 ,..., xn 的联合概率密度为
n
xi n e i1 , x 0(i 1,2,...,n) f X ( x1 ) f X ( x2 ) f X ( xn ) i 0, 其他
例4:考虑电话交换台一小时内的呼唤次数X,求来自这一总体的
i 1 i 1
n
i 1 n
i 1
2

都不是统计量。
一些常用的统计量
1、 表示位置的统计量—平均值和中位数 样本均值:设 x1 , x2 ,..., xn 为取自总体的样本, 1 n 其算术平均值称为样本均值,记为 X X i n i 1 中位数:将数据由小到大排序后位于中间位置的那个数值.
第六章 统计量及其抽样分布
6.1 引言 6.2 总体和样本 6.3 统计量及其分布
6.1引

在我们的现实生活中,许多问题的不确定现象都是由随机 因素的影响所造成的 通常情况下,需要经过对实际中大量数据的处理或理论分 析,可以确定这些随机因素所要服从的概率分布,根据其概 率分布规律利用一些统计方法可对所研究的问题做出估计、 推断和预测 具体地讲,数理统计方法是研究从一定总体中随机抽取一 部分(称为样本)的性质,来推断和预测总体的性质的一类 有效方法
简单随机样本 x1 , x2 ,..., xn 的样本分布。 解:由概率论知识,X服从泊松分布P(λ),其分布律为
p X ( x) p{ X x}
则来自这一总体的简单随机样本
x
x!
e ( 0)
x1 , x2 ,..., xn 的联合分布律为
p X ( x1 ) p X ( x2 ) p X ( xn )
注:对多数实际问题,总体中的个体是一些实在的人或物。比如, 我们要研究某大学的学生身高情况,则该大学的全体学生构成问
题的总体,而每个学生即是一个个体。
事实上,每个学生都有许多特征:性别、年龄、身高、体重 等等,而在该问题中,我们关心的只是该校学生的身高如何,对 其他的特征不予考虑。这样,每个学生(个体)所具有的数量指 标值——身高就是个体,而将所有的身高全体看成总体。
再来看一个例子: 某公司要采购一批产品,每件产品要么是正品,要 么是次品。若设这批产品的次品率为p(一般是未知的), 则从该批产品中随机抽取一件,用X表示抽到的次品数, 不难看出X服从0-1分布。当分布中的参数p是不知道的。 而p的大小决定了该批产品的质量,它直接影响采购行 为的经济效益,因此人们对p提出一些问题,例如,“p 的大小是多少?”,“p大概落在什么范围内”

i 1
xi
n
x1! x2! xn !
e n
§6.3 统计量及其分布
样本来自总体,样本观测值中含有总体的各种信息,但
这些信息较为分散,有时显得杂乱无章。为将这些分散在
样本中的有关总体的信息集中起来以反映总体的各种特征, 需要对样本进行加工,其中最常用的一种方法就是构造关 于样本的函数,不同的函数反映总体的不同特征。
概率论与数理统计之间的关系:
数理统计学是一门研究怎样去有效地收集、整理和分析带
有随机性的数据,以对所考察的问题做出推测和预测,直至
采取一定的决策和行动提供依据和建议的数学分支学科。 统计方法的数学理论要用到很多近代数学知识,如函数论、
拓扑学、矩阵代数、组合数学等等,
但关系最密切的是概率论,故可以这这样说:概率论是数
例如:某单位收集到20名青年人某月的娱乐支出费用数据 79 84 84 88 92 93 94 97 98 99 100 101 101 102 102 108 110 113 118 125 样本均值 X 99.4 样本方差
n 1 s2 ( X i X )2 n 1 i 1 1 [(79 99.4) 2 (84 99.4) 2 (125 99.4) 2 ] 20 1 133.9368
(x1,x2,…,xn)具有联合密度函数:
f n ( x1 , x2 ,, xn ) f ( x1 ) f ( x2 ) f ( xn ) f ( xi )
i 1
n
例3:设某种电灯泡的寿命X服从指数分布E(λ),其概率密度为
e x , x 0 f X ( x) x0 0,
0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0
0
5
10
15Biblioteka 20当随机变量 ~ (n),对给定的
2 2
(0 < < 1)称满足P{ 2 2 (n)} 的 2 (n) 为自由度为n的卡方分布的分位数。
注:分位数的值可以人表中查到。
例如:n 10, 0.05, 20.05 (10) 18.307
这样一来,若抛开实际背景,总体就是一堆数,这堆
数中有大有小,有的出现机会多,有的出现机会少,因此
用一个概率分布去描述和归纳是恰当的 从这个意义上看,总体就是一个分布,而其数量指标 就是服从这个分布的随机变量,以后说“从总体中抽样” 与“从某分布中抽样”是同一个意思。
例1:考察某厂的产品质量,将其产品只分为合格品
称为总体的一个样本,n称为样本容量,或简称样本量,
例2:啤酒厂生产的瓶装啤酒规定净含量为640g,由于随机 性,事实上不可能使得所有的啤酒净含量均为640g。现从
某厂生产的啤酒中随机抽取10瓶测定其净含量,得到如下
结果:641 635 640 637 642 638 645 643 639 640 这是一个容量为10的样本的观测值,对应的总体为该厂生产 的瓶装啤酒的净含量。
以标准正态变量为基石而构造的三个著名统计量在实 际中有着广泛的应用。这是因为这三个统计量不仅有 明确背景,而且其抽样分布的密度函数有明显表达式, 它们被称为统计中的“三大抽样分布”
1、 2 分布(卡方分布)
若随机变量 X1,X2,„ Xn 相互独立,都服 从标准正态分布 N(0,1) ,则随机变量 2 2 Y= X 12 X 2 X n 服从自由度为 n 的 2 分布,记为 Y~ 2 (n). Y 的均值为 n,方差为 2n.
定义:设 数
x1 , x2 ,..., xn 为取自总体的样本,若关于样本的函
T T ( x1, x2 ,...,xn ) 中不含有任何未知参数,则称T为统
计量。统计量的分布称为抽样分布。 例如:若x1,x2,…,xn为样本,则 xi , xi 2 都是统计量;
n n
而当 ,
未知时, ( xi )2 , xi
与不合格品,并以0记合格品,以1记不合格品,则
总体={该厂生产的全部合格品与不合格品}={由0或1组成的一堆数} 设P表示这堆数中1的比例(不合格品率),则该总
体可由一个二点分布表示
X P 0 1-P 1 P
不同的P反映了总体的差异。
比如:两个生产同类产品的工厂的产品总体分布为:
X P
0
0.983
1
0.017
X
P
0
0.915
1
0.085
显然第一个工厂的产品质量优于第二个工厂,但
是在实际中,分布中的不合格品率是未知的,如何对
之进行估计是统计学要研究的问题。
二、样本 样本:为了了解总体的分布,我们从总体中随机地抽取n
相关主题