当前位置:文档之家› 概率统计法建模

概率统计法建模


2
S2
1
2 i 1
2 2 ( X X ) ~ ( n 1); i
n
定理 设总体 X ~ N ( , ), X 1 , X 2 ,, X n 是取自
概率统计法
2015.5.27
概率统计法
一、方法原理 二、基础概念 三、建模过程 四、应用案例
一方法原理
实际系统中,许多系统过程或过程包含着随 机因素和随机事件,其特征可用随机变量 来描述,而概率分布是用数值表示的随机 事件或因素的函数,它反映了这些随机变 量的变化规律。利用概率统计学中的概率 分布及其数字特征建立随机系统或过程的 数学模型谓之概率统计法。这种方法的实 质就是通过理论分析和实验研究寻求适合 于系统随机特征的概率分布。在概率统计 建模中,贝叶斯定理占有相当重要的位置。
f (t ) d t ,
则称 X 为连续型随机变量 , 其中 f ( x ) 称为 X 的概率
S


x2
f ( x)d x 1
f ( x)d x
S1
1
o
x1
x1 x 2
S1
x
正态分布(或高斯分布)
定义 设连续型随机变量X 的概率密度为 1 f ( x) e , x , 2 πσ 其中 μ, σ (σ 0) 为常数, 则称 X 服从参数为 μ, σ 的正态分布或高斯分布 , 记为 X ~ N ( μ, σ 2 ).
P Ai P( Ai ). i 1 i 1
(2)条件概率的相关内容 在事件B, 已经发生条件下, 事件A发生的概率,称为 事件A在给定事件B的条件下的条件概率, 简称A对B的 条件概率, 记作P(A|B).
P(AB) P(A | B) = P(B)
设 A, B 是两事件 , 如果满足等式 P ( AB ) P ( A) P ( B ) 则称事件 A, B 相互独立, 简称 A, B 独立.
全概率公式
定理 设试验 E 的样本空间为 S , A 为 E 的事件, B1 , B2 ,, Bn为 S 的一个划分, 且 P ( Bi ) 0( i 1, 2,, n), 则 P ( A) P ( A B1 ) P ( B1 ) P ( A B2 ) P ( B2 ) P ( A Bn ) P ( Bn )
测量误差, 人的生理特征尺寸如身高、体重等 ;
正常情况下生产的产品尺寸: 直径、长度、重量 高度等都近似服从正态分布.
(4)随机变量的数学期望 1. 离散型随机变量X有分布律: P{=xk}=pk(k=1,2,…) 若级数k xkpk 绝对收敛, 则称这个级数为随机变量 X的数学期望, 简称期望或均值, 记为EX, 即 EX=kxkpk 2. 设 X 是连续型随机变量,其密度函数为 f ( x ), 如果 xf ( x )dx
3. 报童的诀窍
4. 考试成绩的标准分
5. 大数定律和中心极限定理
1.概率论的基本知识
(1)概率的公理化定义 设E是随机试验, 是它的样本空间。对于E中的每一 个事件A赋予下一个实数,记为P(A)。 若P(A)满足以下三个条件: (1) 非负性: 对每一个事件, 有 P(A)0; (2) P()=1; (3) 可列可加性: 设A1,A2,…是两两互不相容的事件,则
服从自由度为n的t分布, 记为T~t(n).
2 分布的分位点
对于给定的正数 , 0 1, 称满足条件 P { ( n)}
2 2
2
( n )
f ( y )dy
2 的点 ( n) 为 2 ( n) 分布的上 分位点.
对于不同的 , n, 可以通过查表求 得上 分位点的值.
x1 X ~ p1
x2 xn p2 pn
X
pk
x1 p1
x2 xn p2 pn
定义 如果对于随机变量 X 的分布函数 F ( x ) , 存在
非负函数, 使对于任意实数 x 有 F ( x ) 密度函数, 简称概率密度 .
f ( x)
x
n
, i 1,2,, n.
称此为贝叶斯公式.
(3)随机变量 设E是随机试验, 样本空间为。若对于每一个样 本点∈ 都有唯一的实数X()与之对应, 称X()为 随机变量。 随机变量常用, , , X, Y, Z等表示。
红色 白色
X (e )
S 0
1
R
定义
设离散型随机变量X 所有可能取的值为
上述抽取过程称为抽样, 所抽取的部分个体称为样本。 样本中所含个体数目称为样本的容量.
简单随机抽样 1. 代表性:X 1 , X 2 ,, X n 与所考察的总体具有相同 的分布; 2. 独立性: X 1 , X 2 ,, X n 是相互独立的随机变量.
由简单随机抽样得到的样本称为简单随机样本, 它


绝对收敛, 定义 X的数学期望为
E ( X ) xf ( x )dx .


(5)随机变量的方差 随机变量的离差的平方的数学期望称为随机变量 的方差, 记作D。 随机变量的方差的计算D=E(-E)2 离散型随机变量的分布律为P{=xk}= pk,k=1,2,… 则 的方差为 D= k(xk-E)2pk
( x)
/2 /2
u / 2 O
u / 2
x
4. F分布 随机变量X与Y 相互独立, X~ 2(m), Y~2(n), 称
X m F Y n
服从自由度为(m,n)的F分布, 记为F~F(m,n).
正态总体的样本均值与样本方差的分布
定理
设总体 X ~ N ( , ), X 1 , X 2 ,, X n 是取
二 基础概念
基本概念,条件概率、全概率公式、贝叶斯定理 随机变量:概率密度,分布函数,数字特征(期望、 方差),
常用随机变量分布:二项分布、泊松分布、正态 分布、指数分布和埃尔朗分布 中心极限定理和大数定理 常用统计分布 参数估计:点估计(矩估计,最大释然估计)、区 间估计 假设检验
三 建模过程
连续型随机变量的概率密度函数为f(x), 则的方差为
D ( x E )2 f ( x)dx

大数定律
设1,2,…, n是相互独立的随机变量序列, 具有相同的 数学期望和方差,即 Ei=, Di=2, i=1,2,…,n 1 n P i 1. 则对任给>0,有 lim n n i 1
1. 如何有效地收集、整理有限的数据资料;
2. 如何对所得数据资料进行分析、研究,从而对研究对 象的性质、特点做出合理的推断——统计推断。
1. 数理统计的基本概念
通常把具有一定共性的研究对象的全体称总体, 总体确定后,称组成总体的每一个成员为个体. 按一定规则从总体中抽取若干个体进行观察, 观察可得到关于总体 X 的一组数值 x1 , x2 ,, xn ,
2
2
自 X 的一个样本,
X (1) X ~ N ( , / n); ( 2)U ~ N (0,1). / n 2 定理 设总体 X ~ N ( , ), X 1 , X 2 ,, X n 是取
自 X 的一个样本,X 与 S 2 分别为该样本的样本均 值与样本方差,则有
n1
( x μ )2 2σ 2
已知 X ~ N ( μ, σ 2 ), 求 P{c X d }.
d μ c μ P {c X d } . σ σ
( x ) 1 ( x ).
正态分布的应用与背景
正态分布是最常见最重要的一种分布,例如
i 1
n
i
X)
2
2 1 3. 样本标准差 S ( Xi X ) n 1 i 1
几个在统计中常用的分布: 1. 正态分布 若连续型随机变量的概率密度为 ( x )2 1 2 2 f ( x) e , x 2 其中和为常数,且>0,则称服从参数为和2的正态 分布,记为~N(,2). 正态随机变量时的分布函数为
20 20 50 P( 70) P (2.84) 0.9977. 7.053 49.75 49.75
1. 数理统计的基本概念 2. 置信区间 3. 假设检验
通过观察收集数据, 然后进行整理、分析, 并用 概率论的知识对分布F, f , p或参数 作出估计、推断 —数理统计的一些基本内容。 数理统计的任务:
可用与总体独立同分布的 n 个相互独立的随机变量 X 1 , X 2 ,, X n 表示.
设 X 1 , X ,, X n 为总体 X 的一个样本, 样本的任一不含总体分布未知参数的函数为该样本
的统计量. 1. 样本均值 X 1
X n
i 1 n
n
i
2. 样本方差 S 2 1
(X n 1
中心极限定理
中心极限定理是棣莫佛在十八世纪首先提出的,至
今其内容已经非常丰富量服从什么分布, 大量 这种随机变量的和的分布都可以用正态分布近似.
设随机变量X1,X2, …,Xn相互独立, 服从同一分布,且 EXi=, DXi=2<+, i=1,2,…,
xk ( k 1,2,), X 取各个可能值的概率, 即事件 { X xk } 的概率, 为 P { X xk } pk , k 1, 2,. 称此为离散型随机变量X 的分布律.
说明
(1) pk 0, k 1,2,;
( 2) pk 1.
k 1

离散型随机变量的分布律也可表示为
全概率公式
说明 全概率公式的主要用处在于它可以将一个 复杂事件的概率计算问题,分解为若干个简单事件 的概率计算问题,最后应用概率的可加性求出最终 结果.
相关主题