统计学1.概率基本概念
§ 2,随机变量与概率分布的基本概念 ,
一,离散型随机变量 1,随机变量(Random Variable) ,随机变量( ) 2,离散型随机变量(Discrete Random Variable) ,离散型随机变量( ) 3,离散型随机变量的概率 , 4,离散型随机变量的概率分布(Probability Distribution) ,离散型随机变量的概率分布( ) 5,离散型随机变量的累积概率(Cumulative Probability) ,离散型随机变量的累积概率( ) P(X ≤ x)的概率称为随机变量 的累积概率. ( 的累积概率. )的概率称为随机变量X的累积概率 6,离散型随机变量的累积概率分布 , (Cumulative Probability Distribution )
(2)连续分布的随机变量在(连续)区间上取值,且只有在 )连续分布的随机变量在(连续)区间上取值, 这些区间上其概率值才能为正值, 这些区间上其概率值才能为正值,在连续型随机变量的任意 取值点(离散点) 其概率值均为零. 取值点(离散点)上,其概率值均为零. (3)连续型随机变量的概率分布,与离散型随机变量的概率 )连续型随机变量的概率分布, 分布相对应. 分布相对应. (4)连续型随机变量的累积概率分布,与离散型随机变量的 )连续型随机变量的累积概率分布, 累积概率分布相对应. 累积概率分布相对应. 9,两个随机变量的联合概率分布 , (1)两个离散型随机变量的联合概率分布 ) 令P(X=i)=P(Ai),i=1,2,,n; P(Y=j)=P(Bi),i=1,2,,m ( ) ( ( ) ( 联合概率的一般表达式: 联合概率的一般表达式 P(X=i,Y=j)= P(Ai, Bj) ( ) (
/Y
/ X
f (x, y) (x y) = fY ( y ) f (x, y) ( y x) = fX (x)
12,相互独立的随机变量 , 离散型: 若对所有的 ,j,有 若对所有的i, , 离散型 P(X=i / Y= j)=P(X=i) ( ) ( ) 或 P(X=i,Y= j)=P(X=i)P(Y=j) ( , ) ( ) ( ) 则称随机变量X与 是相互独立的 则称随机变量 与Y是相互独立的
f ( x, y ) = f X ( x) fY ( y )
则称X与 是相互独立的随机变量 是相互独立的随机变量. 则称 与Y是相互独立的随机变量. 离散型和连续型的随机变量相互独立的条件和定义,可用 离散型和连续型的随机变量相互独立的条件和定义, 的随机变量相互独立的条件和定义 统一表达为: 累积概率统一表达为 累积概率统一表达为:
P ( X ≤ x, Y ≤ y ) = P ( X ≤ x) P (Y ≤ y )
§ 3. 典型概率分布
1,两点分布(0-1分布) ,两点分布( 分布 分布) 如 投一枚硬币,出现正面概率是p,出现反面概率是1-p, 投一枚硬币,出现正面概率是 ,出现反面概率是 , 可以表示为 P(X=1)=p, P(X=0)=1-p ( ) , ( )
(2)两个连续型随机变量的联合概率密度分布 ) 联合概率密度分布与离散型随机变量的联合概率分布相对应. 联合概率密度分布与离散型随机变量的联合概率分布相对应 一般表达式: 是一个二元函数. 一般表达式 f (x, y), 是一个二元函数 (3) 两个离散型随机变量的累积概率分布与两个连续型随机 变量的累积概率分布相对应. 变量的累积概率分布相对应 离散型的累积概率是概率的求和关系; 离散型的累积概率是概率的求和关系 连续型的累积概率是概率密度的积分关系; 连续型的累积概率是概率密度的积分关系 如: 二维随机变量 ( X, Y )的累积概率分布 的累积概率分布
F(x, y) = P( X ≤ x,Y ≤ y) =
F ( x, y ) = P ( X ≤ x, Y ≤ y ) =
X i ≤x,YJ ≤ y
y x
∑ p( X ,Y )
i j
∞∞
∫ ∫ f (u, v)dudv
10,边际分布 , 离散型: 离散型:
P ( X = i) =
∑ P( X
j =1
P ( X = i, Y = j ) P ( X = i Y = j) = , i = 1, 2 L P (Y = j )
若对某个固定的i,P(X= i)>0,有
P ( X = i, Y = j ) P (Y = j X = i ) = , j = 1, 2 L P ( X = i)
连续型:
fX fY
P (B ) =
∑
n
P ( BA
k =1
k
) =
Байду номын сангаас
∑
n
k =1
P ( B A k )P ( A k )
三,贝叶斯公式(Bayes'Rule) 贝叶斯公式( ) 1,贝叶斯公式 ,
P ( B Ak ) P ( Ak ) P ( Ak B ) P ( Ak B ) = = n , P( B) ∑ P( B Ak )P( Ak )
x
F ( x) =
∞
∫ f (u )du
或者 F ′( x ) = f ( x )
7,均值(Mean) ,均值( ) = E(X ) = 离散型: 离散型: 连续型: 连续型: = E ( X ) = 8,方差(Variance) ,方差( ) 离散型: σ 离散型: 连续型: 连续型: σ
2
k =1
P(B) > 0
其中: 是对样本空间S的一个划分 的一个划分, 其中:A1,A2, An是对样本空间 的一个划分, Ak是 其中任意一个事件. 其中任意一个事件.
四,相互独立的随机事件的概率公式 1,相互独立定义 , 对任意两个事件A, , 对任意两个事件 ,B,且P(B)>0, 若P(A|B)=P(A), ( ) 则称事件A与 是相互独立的 是相互独立的. 则称事件 与B是相互独立的 注意: 独立与不相容的区别. 注意 独立与不相容的区别 若两个事件A, B相互独立 则有 相互独立, 若两个事件 相互独立 P(A|B)=P(A), P(B)>0; ( ) P(B|A)=P(B), P(A)>0; ( ) P(AB)=P(A|B)P(B)=P(A)P(B)
7,概率运算的主要性质(Properties of Probability) ,概率运算的主要性质( ) 的对立事件, (1)设A是A的对立事件,则 P(A)=1-P(A). ) 是 的对立事件 ( ) ( ). (2)对任意两个事件 和 B ,有 )对任意两个事件A P(A∪B)= P(A)+ P(B)- P(AB) ( ∪ ) ( ) ( ) ( ) (3)若事件 B,则 P(A)≤ P(B). )若事件A , ( ) ( ). 8,等概率随机实验(Equally Likely Outcomes) ,等概率随机实验( ) 满足: ,实验的基本事件个数有限; 满足:1,实验的基本事件个数有限; 2,基本事件出现的概率相等. ,基本事件出现的概率相等. 如:投均匀硬币;投骰子等等 投均匀硬币;
5,连续型随机变量的累积概率分布函数 , 连续型随机变量小于等于每一个可能的实验结果x( 连续型随机变量小于等于每一个可能的实验结果 (用数字 表示结果)的概率, 表示结果)的概率,函数表达为 F(x)=P(X ≤ x) ( ) ( ) 6,连续型随机变量的概率密度函数(Probability Density ,连续型随机变量的概率密度函数( Function) ) 连续型随机变量的概率密度函数是这样一个数学函数式: 连续型随机变量的概率密度函数是这样一个数学函数式: 在该曲线下面任何一个区间的面积,等于随机变量X在该 在该曲线下面任何一个区间的面积,等于随机变量 在该 区间上取值的概率. 区间上取值的概率. 注:离散型:累积概率是概率的求和关系; 离散型:累积概率是概率的求和关系; 连续型:累积概率是概率密度的积分关系, 连续型:累积概率是概率密度的积分关系,有
服从两点分布, 若X 服从两点分布,则记 X ~ B(1,p). ( , ). 2,二项分布(Binomial Distribution) 二项分布( 二项分布 ) 次硬币(又称贝努利实验) 正面出现k次 如抛 n 次硬币(又称贝努利实验), 正面出现 次(0≤ k ≤ n) ≤ ) 的概率为
连续型: 连续型: 定义1,若连续型随机变量X与Y的条件密度分布满足: 定义 ,若连续型随机变量 与 的条件密度分布满足: 的条件密度分布满足
f X / Y ( x y ) = f X ( x ), 或 f Y / X ( y x ) = f Y ( y )
定义2,若连续型随机变量 与Y的条件密度分布满足: 若连续型随机变量X与 的条件密度分布满足 的条件密度分布满足: 若连续型随机变量
i =1 +∞
∑
∞
xi pi
∞
∫
xf ( x ) dx
= D(X ) =
= D(X ) =
∑
+∞
∞
i =1
( xi )2 pi
( x ) 2 f ( x ) dx
2
∞
∫
9,离散分布与连续分布的区别与对应关系 , (1)离散分布的随机变量在离散点取值(可以是有穷多个, 也可以是无穷多个离散点),并在这些点上存在概率值.
二,连续型随机变量 1,连续型随机变量( Continuous Random Variable ) ,连续型随机变量( 该随机变量的取值域为一个连续区间. 该随机变量的取值域为一个连续区间. 一个连续区间 2,连续型随机变量的概率 , 连续型随机变量只在区间上取值,其概率值才可能为正值: 连续型随机变量只在区间上取值,其概率值才可能为正值: 0 < P(x1 ≤ X ≤ x2) ≤ 1 连续型随机变量取任何离散点的概率为零. 连续型随机变量取任何离散点的概率为零. 3,连续型随机变量的累积概率( Cumulative Probability ) ,连续型随机变量的累积概率( 注:与离散型随机变量累积概率的表达相同. 与离散型随机变量累积概率的表达相同. 4,连续型随机变量的累积概率分布 , ( Cumulative Probability Distribution )