常用分布与统计分析方法
Bernoulli试验:连续n次独立地重复一个试验,每次试验结果只有两 个不同的结果A和B,它们出现的概率分别是p和q,且p+q=1。
设n重Bernoulli试验中事件A出现的次数为X,显然X为离散型随 机变量。则X的概率分布为:
k k nk PX k Cn p q
k 0,1,2,..., n
3、构造检验统计量W Xi:第i次试验的结果, Xi =1 表示出现正面,Xi =0表示出现反面
Y Xi
i 1
100
(100次试验中出现正面的次数)
Z 100 Y
W Y Z
(100次试验中出现正反面的次数)
(100次试验中出现正反面之差的绝对值)
2008-7-12
Introduction to Statistics----Mathematical Modeling
显然,样本均值、样本方差都属于统计量。 通常用样本均值、样本方差作为总体均值、总体方差的无偏估计量。 无偏估计:当n取得充分大,样本均值、样本方差分别逼近总体均值 和总体方差。
2008-7-12
Introduction to Statistics----Mathematical Modeling
2008-7-12
Introduction to Statistics----Mathematical Modeling 根据样本值推断总体性质——参数估计
样本均值 x :
1 n x xi n i 1
样本方差s:
2 1 n s xi x n 1 i 1 2
或
2 1 n s xi x (当n较大时) n i 1 2
Poisson分布(Poisson distribution) 设X为离散型随机变量,X的概率分布为:
e k PX k , k!
0为常数,k 0,1,2,...
称X服从参数为的Poisson分布,记为X~P()。
2008-7-12
Introduction to Statistics----Mathematical Modeling 常用的连续型分布
收敛,则称E(X)为随机变量X的均值或数学期望。
小结: E(X)反映随机变量X的统计平均性质,代表随机变量取值的一般水平 或集中的位置,略去了随机变量概率分布规律的具体细节。
2008-7-12
Introduction to Statistics----Mathematical Modeling 方差(variance)
设随机变量X的均值为E(X),则:
X的方差:D X E X E X X的标准差或均方差:
对于离散型随机变量X,其方差为:
2
D X
D X xi E X pi
2 i 1
对于连续型随机变量X,其方差为:
D X
x E X px dx
Introduction to Statistics----Mathematical Modeling
数学建模培训
(概率统计模型部分)
常用分布与统计分析方法
2008-7-12
Introduction to Statistics----Mathematical Modeling
概率统计的基本概念 与 常用的概率分布
遵从正态分布的随机变量X,其正态分布函数为:
1 P( X x) 2
x
e
t 2
2 2
dt
x
=0; 2=1时,称为标准正态分布,记为X~N(0,1)。
2008-7-12
Introduction to Statistics----Mathematical Modeling 正态分布的若干性质
2
2008-7-12
Introduction to Statistics----Mathematical Modeling
计算D(X)的简单公式:
D X E X
E X
2
2
小结: D(X)反映随机变量X的相对于均值E(X)的偏离程度,代表随机变量取 值的分散性,也是统计平均的性质。
正态分布完全由其均值和方差2决定;
正态分布的概率密度函数曲线呈对称的“钟形”;
经验规则(3 准则):
P x 0.6826
P x 2 0.9545 P x 3 0.9973
2008-7-12
Introduction to Statistics----Mathematical Modeling
3. 总体和样本
总体X (population)
研究对象的某种特征值的全体组成的集合。用X表示。
样本X1, X2, …, Xn (sample)
在总体中选取部分有代表性的子集称为(随机)样本。 一个样本是来自总体X的一组相互独立同X分布的随机变量。
xi:质点i的坐标;pi: 质点i的质量 E(X): 质心坐标
2008-7-12
Introduction to Statistics----Mathematical Modeling
连续型随机变量的均值 设X为连续型随机变量,它的概率密度函数为p(x) ,若
E X xpx dx
2008-7-12
Introduction to Statistics----Mathematical Modeling
6. 正态分布(Normal distribution)
设随机变量X的概率密度为:
1 p( x) e 2
x 2
2 2
x
其中-<<+ ,>0均为常数。称X服从参数为,的正态分布,记 作X~N(,2). :均值; :方差
x2 x1 ba
其中x1, x2[a, b], x1<x2。
2008-7-12
Introduction to Statistics----Mathematical Modeling
指数分布(exponential distribution) 设X为连续型随机变量,X的概率密度为:
e x p x 0
•样本值x1, x2, …, xn
从总体X随机抽取的一组观测值,常用x1, x2, …, xn来表示样本或样 本值。
2008-7-12
Introduction to Statistics----Mathematical Modeling
4. 统计量及其参数估计
统计量(statistical quantity)
离散型随机变量 X的所有可能取值是有限个或可列个。 连续型随机变量 最常见的一类非离散型随机变量。
2008-7-12
Introduction to Statistics----Mathematical Modeling 概率密度函数 (PDF, probability density function)
设X1, X2, …, Xn为总体X的一个样本,g(x1, x2, …, xn)为连续函数, 则称g(x1, x2, …, xn) 为一个统计量。 显然,统计量g(x1, x2, …, xn)也是一个随机变量。
总体X的数字特征——参数
总体均值:刻划总体的平均取值 总体方差2:刻划总体取值的分散(涨落)程度
2. 随机变量的数字特征
均值(mean) 或数学期望(mathematical expectation)
离散型随机变量的均值 设离散型随机变量X的分布律为:
P X xi pi ,
若
i 1,2,3,...
E X xi pi
i 1
收敛,则称E(X)为随机变量X的均值或数学期望。
x0 x0
其中 0为常数
称X服从参数为的指数分布。
2008-7-12
Introduction to Statistics----Mathematical Modeling
分布( distribution) 设X为连续型随机变量,X的概率密度为:
1 x x e x0 p x x0 0
5. 统计推断的两类问题—— 参数估计和假设检验
参数估计问题
假定总体X的分布函数形式已知,对其中的某些参数进行估计。 估计方法:矩估计法、最小二乘法、最大似然法,……
假设检验问题
从样本值出发,判断关于总体分布的某种假设是否成立。
假设检验问题举例
为验证一硬币是否匀称(即正反两面出现的概率是否相等),做投 掷试验。假定试验结果有以下两个: (1)正面55次,反面45次; (2)正面40次,反面60次。 如何判断改硬币是否匀称?
x
p( x) F x
P(x)的性质:
p ( x) 0
p( x)dx 1
2008-7-12
Introduction to Statistics----Mathematical Modeling 常用的离散型分布
二项分布(binomial distribution)
0, 0
其中,均为常数,称X服从参数为,的分布,记为X~ (, )。
t 1e t dt
0
正态分布(normal/Gaussion distribution) (见后)
2008-7-12
Introduction to Statistics----Mathematical Modeling
对连续型随机变量,考察事件{a<X<b}的概率。若存在非负的可 积函数p(x),使得:对任意的a, b(a<b),都有