实验数据分析方法
参数估计的精度下降。
设将x的变化范围分成了N个间隔
ni :第i个间隔内的事例数
N
ni n
i 1
pi :某事例落入第i个间隔的概率
N个事例分布于N个间隔内,每个间隔内的事例数为n1、n2、…nN 的概率满足多项式分布:
12.2 用ML方法进行参数估计的步骤
L (n1, n2
nN
| ) n!
ˆn ,当 n 时。 3. 无偏性(unbiassedness)
在某些特殊情况下,ML估计式是无偏的,即E(ˆ)
在一般条件下,ML估计式不满足无偏性:E(ˆ) ,但其偏差 o( 1 )
n
故当样本容量 n 时,ML估计式总是无偏的。
12.3 ML估计式的特性
1. 广义似然函数(Generalized Likelihood Function)
总事例数n也是随机变量,服从平均值为υ的泊松分布:
在实验条件一定的条件下,事例的产生率为常数,
在时间t内获得n个事例的概率为泊松分布。
观测到n个事例,且测量量为x1、x2、…xn的联合概率为
L (n, x | ) ne L ( x | ) ne
12.2 用ML方法进行参数估计的步骤
1. 信号事例: J X
KK
在不变质量为m0处出现共振态X的弹性散射振幅可用BreitWigner公式描述:
BW
m m0 i 2
:X的宽度,m0:X的静质量,m:K+K-的不变质量
(1)如果较小
BW
2
(m m0 )2 2
Re(W
(z)) / CBW
N amp
BW1
e BW ik1
k 1
k
k2
2
Camp
N BW
(1 k ) fback Cback k 1
其中:CBW、Camp、Cback为归一化常数,保证 f (m | )dm 1
k :第k个窄共振峰事例数/总事例数
R(m, m)
1 2
exp[
1 2
(m
m)2
2]
:质量分辨率
因此,窄共振峰的p.d.f为
BW 2 R(m, m)dm
1 Re(w(z))
2
w(z) ez2 erfc(iz)
z m m0 i
2 2 2
12.2 用ML方法进行参数估计的步骤
2. 当样本容量n时,ML估计式满足正态分布方差容易 计算;
3. 用ML方法可较容易地得到参数的估计式;
本章内容:
1. 最大似然原理; 2. 用ML方法求解参数估计问题的步骤; 3. ML估计式的特性; 4. 如何计算ML估计值的方差; 5. 利用似然函数进行区间估计
第十二章 最大似然法
(Maximum Likelyhood Method)
0 ln L = A( )[t b( )]
充分必要条件
6. 渐近正态性(Asympototic normality)
在样本容量很大时,θ的ML估计值满足渐近正态分布,其平均值
为θ的真值θ0,方差为最小方差限(MVB)。
第十二章 最大似然法
(Maximum Likelyhood Method)
12.1 最大似然原理
12.1 最大似然原理
(一) 似然函数的定义
p.d.f:f(x|) 测量量:x = {x1, x2, …, xn }
n
L(x | ) f (xi | ) i 1
L(x | )d x 1
(二) 最大似然原理
未知参数的最佳估计值ˆ 应满足如下的条件:
i. ii.
对ˆ 位于于给定的的允一许组取测值量范值围,;ˆ使L取极大值:
L(x |ˆ) L(x | )
12.1 最大似然原理
(三)估计值 ˆ的求法
似然方程:
L(x | )
n i 1
f (xi , ) 0
极大值条件: 2L(x |) 2
ˆ
0
因为lnL是L的单调上升函数,lnL和L具有相同的极大值点, 所以,LlnL, 求和运算比乘积运算容易处理
似然方程: ln L(x | )
n
ln
i 1
f (xi , ) 0
极大值条件: 2 ln L(x |)
2
0
ˆ
如果有k个位置参数, = {1, 2, …, k} k阶似然方程
n i 1
1 ni
P ni i
Pi Pi ( ) xi f ( x | )dx
xi :间隔的宽度
取对数并只保留与θ有关的项
N
lnL (n1, n2 nN | ) ni Pi ( ) i 1
分间隔的似然函数(Binned Likelihood Function)
(1) N很大,xi 很小, L ( x | ) L (n1, n2 nN | )
物理系统的特性:某些量的理论概率分布函数 实验的条件:分辨率、探测效率
ML方法中所需的p.d.f
例:不变质量谱分析:e+e-J/K+K-
• 通过测量K+K-的动量,可得到K+K-的不变质量 分布,对该分布进行统计分析,可得到衰变过程 中产生的共振态的信息;
• 描述不变质量m的分布的p.d.f应包含对该分布有 贡献的物理过程
n!
n!
n i 1
f (xi | )
广义似然函数, = ( )
优点:n对θ增加了附加的限制 条件:ν必须能够精确确定
12.2 用ML方法进行参数估计的步骤
2. 数据分类情况下的似然函数
对实验数据进行分间隔处理,(如作成直方图)然后用ML方法对分类 后的数据进行处理。
优点:减小了数据量,使得对L 的计算速度加快 缺点:由于将原 L 简化为少量的几个“平均”pdf的乘积,使得
:Namp个相干共振峰事例数/总事例数
BES分析软件BWFIT程序中使用的p.d.f
(二)构造似然函数
12.2 用ML方法进行参数估计的步骤
设对某物理系统进行了n次测量,x1、x2、…xn
n
ln L ( x | ) ln f ( xi | ) i 1
根据需要可对 L (x | ) 进行变化:
实验数据处理方法
第三部分:统计学方法
第十二章 最大似然法
(Maximum Likelihood method)
第十二章 最大似然法
(Maximum Likelihood Method)
点估计的方法之一,是参数估计中常用的方法,具有以下的特点:
1. 在一定的条件下,ML估计式满足一致性、无偏性、有效 性等要求;
参量来求LF的极大值,则所得θ的估计值亦为ˆ
L
|
ˆ
0
L
|
ˆ
如果
|
ˆ
0
,则有
L
|
ˆ
0
L
| ˆ( )
ˆ( ) (ˆ)
2. 一致性(consistency)
在一般条件下,ML估计值满足一致性条件,即
2
k-1:相位差
k-1:第k个相干的共振峰事例数/第一个相干的共振峰的
事例数
12.2 用ML方法进行参数估计的步骤
2. 本底事例:相空间本底、粒子误判本底、其它衰变道本底等
fback (m, ) ~
f
ps
(m,
)
mm a x
1
mm in
1
Nb
bi
Pi
(
x)
i 1
4
实验结果包含质量分辨率和探测效率的影响, ~ ,故
必须对理论公式进行修正
BW 2 BW 2(m)R(m, m)dm
12.2 用ML方法进行参数估计的步骤
其中:
(m):效率函数,因(m)随m的变化较小,故(m)~常数 R(m,m´):分辨率函数,真值为m时,获得测量值m´的概率
(1)如果较大,宽共振峰
因为>> ,所以R(m,m´)~ (m-m´)
如果在衰变过程中存在着多个宽共振,则可能存在仙湖干涉
的现象,设有Namp个相干的共振峰,则描述这些共振峰的
p.d.f为
N amp
2
~ BW1
e BW k1
k 1
k
k 2
BWk
k m m0k i
2. 用CERN程序MINUIT求解函数 f ln L 的极小值,得
θ的估计式 ˆ 及其误差
例:估计粒子的平均寿命
探测K0粒子的产生和衰变。假定探测器无限大,则K0粒子在
t时刻衰变的p.d.f
f (t | ) 1 et /
0t
12.2 用ML方法进行参数估计的步骤
τ:粒子的平均寿命,为未知参数。K0的飞行时间ti
ti
L
c
LE pc
L:飞行距离,p:动量,E:能量,c:光速
对于n个观测事例:
L (t | ) n 1 eti
i 1
ln L = n ( ln ti ) n ( 1 ti ) 0
i=1
i=1 2
ˆ
1 n
fps(m,):相空间函数
Pi(x):i阶Legendre多项式
x 1 m mmin mmax mmin
bi:未知参数