玻尔兹曼分布的严格推导
f ( ξ) Σ i1, i2, …, i n = 1 x i1 x i2 …x i n
n
m +1
k
足: ( 10)
( xi ∏ j =1
Σ i =1
n
2W -
j
(
1 1 2 ω i e α + βεi εi
) )
= -N
( 15 )
引理 的 详 细 证 明 可 以 参 考 数 学 分 析 的 相 关 [3 -5 ] . 书籍
图2
3 个公式的近似效果图( 对数图)
n 较小时式 ( 3 ) 有严重的偏差, 从图 2 可以看出, 尤 n 1 , ( 3 ) 0 , 其在 接近 时 由于式 的数值可能小于 对 数坐标下的图像甚至出现不可导的点 , 效果很差. 式( 4 ) 的误差就要小得多, 在 n 不大时有小的误差. 而式( 5 ) 的精度就更高, 从实际图和对数图上, 都无 法看出明显的偏差. 由于近似水平上的差异, 本文将给出基于精度 较高的式 ( 5 ) 的推导和结果,给出基于式 ( 4 ) 的结 不再涉及精度较低的式( 3 ) . 果, 对原问 题 进 行 化 简, 使用较高精度的近似式 ( 5 ) 时, 有 h( a1 , a2 , …, an ) ≡ln[ f( a1 , a2 , …, an) ]= ln N! -Σ
在统计物理中, 对于玻尔兹曼最概然分布, 通常 都是使用拉格朗日乘子法, 推导出需要的分布形式. 但是一般教科书
[1 , 2 ]
秩与其系数矩阵的秩相同即可.
为了保留直观的物理图像而舍
2
问题简化
a2 , …, a n ) 的表达式中含有阶乘和指 注意 f( a1 ,
弃了推导过程中的严密性. 例如在处理二阶导数时, [3-5 ] 和 n 元函数微分学的基本理论 存在出入, 使得 “最概然” 3 个字略显底气不 玻尔兹曼最概然分布的 足. 这样的推导也许会让一部分初学者产生疑惑. 本文的工作, 正是试图通过严格的数学方法, 在理论 , 保证玻 上证明玻尔兹曼最概然分布的“最大概率 ” 尔兹曼最概然分布的严格, 使得初学者和教育者在 发现这个问题的时候有所参考.
Σ
ai ln ωi -
g ( a1 , a2 , …, a n ) = Nln N -
n
Σ
n i =1
a i ln a i +
n -1 ( 7) Σ i = 1 a i lnω1 - 2 ln( 2 π) a2 , …, a n ) 何时取到最大值. 原问题转化为求 g( a1 ,
4
重要引理
3
传统教材对玻尔兹曼分布推导的漏洞
1
问题描述
为了让文章具有完整性, 这里首先将玻尔兹曼 最概然分布要处理的问题表述如下: 假设有 N 个可 位于 n 个可以不同的能级上, 每个能 以分辨的粒子, a2 , …, a n , 能 量 为 ε1 , 级上占 据 的 粒 子 数 为 a1 , …, …, ε2 , εn , 简并度为 ω1 , ω2 , ω n ,体系总能量为 ε,什么分布出现的概率最大? 用数学化的语言来说就是: 设 a1 ,a2 ,…,a n ∈
摘要: 在运用较高精度的斯特林公式基础上, 利用拉格朗日不定乘子法, 结合带拉格朗日余项的 n 元泰勒展开式, 以兰伯 特 W 函数的形式, 给出了精度更高的一种玻尔兹曼最概然分布及其严格的理论推导, 并附带给出较低精度的斯特林公式下的 推导结果. 此方法可以很容易推广到玻色分布和费米分布中去 . 关键词: 玻尔兹曼分布; 拉格朗日不定乘子法; 斯特林公式; n 元泰勒展开式; 兰伯特 W 函数 中图分类号: O 414. 2 文献标识码: A 文章编号: 1000-0712 ( 2015 ) 03-0060-06
5
玻尔兹曼分布的严格化证明
下面推导需要用到兰伯特 W 函数. 若 W( z) 满足 z = W ( z ) e W( z) , ( 11 )
= -ε ( 16 ) 1 2 ω i e α + βεi a2 , …, a n ) = h ( a1 , a2 , …, an ) + 证明: 令 H( a1 , 2W -
的. 这只需要判定两个条件联立对应的增广矩阵的
收稿日期: 2014 - 02 - 08 ; 修回日期: 2014 - 09 - 30
作者简介: 陈凌蛟( 1992 —) , 男, 江苏南京人, 东南大学吴健雄学院 2011 级本科生.
第3 期
陈凌蛟, 等: 玻尔兹曼分布的严格推导
61
分布的推导及其漏洞. 传统的统计物理 在研究玻尔兹曼分布时, 常常利用式( 3 ) ,将原问题转化为求 s( a1 , a2 , …, an ) = Nln N -
a2 , …, an ) = φ1 ( a 1 , a2 , …, an ) = φ2 ( a 1 , 设
Σ i =1
n
ai - N = 0 εi ai - ε = 0 ( 12 )
Σ i =1
h( a1 , a2 , …, an ) = N + ( 9)
(
1 ln N - 2 ai ln ωi -
DOI:10.16854/ki.1000-0712.2015.03.005
第 34 卷第 3 期 2015 年 3 月
大 学 物 理 COLLEGE PHYSICS
Vol. 34 No. 3 Mar. 2015
玻尔兹曼分布的严格推导
1 2 陈凌蛟 , 侯吉旋
( 1. 东南大学 吴健雄学院, 南京 211189 ; 2. 东南大学 物理系, 南京 211189 )
n i =1
ln N - Σ ln a + (N+ 1 (a + 1 2) 2)
n i =1 i i n i =1
ln( ai ! ) +Σ
n i =1
ai ln( ωi ) ≈
n -1 ln( 2π) ( 6) 2 a2 , …, a n ) 何时取到最大值. 原问题转化为求 h( a1 , 而在使用近似式( 4 ) 时, 可以类似地得到
Σ
n
i =1
(
)
( 14 )
k
Σ k =1
1 k!
( xi Σ ∏ i , i , …, i = 1 x i x i … x i j =1
1 2 n 1 2 n
n
f ( x0 )
k
j
- x0 ij ) + -x )
0 ij
其中 W 为兰伯特 W 函数的单值分支 W0 , α和β满
n
1 ( m + 1) !
[1 , 2 ]
Σ
n i =1
ai ln ai +
Σ
n i =1
ai ln ωi ( 8)
2]是这一类方法的代表, 何时取到最大值. 文献[ a2 , …, a n ) 在条件 论证思路清晰明了: 要寻找 s ( a1 ,
图1 3 个公式的近似效果图
式( 1 ) 下的极值点, 只需直接使用拉格朗日乘子法, 建立拉格朗日方程, 联立求解,就可以得出结果. 其优点在于论证简洁清楚, 结果一目了然, 具有相当 但是存在几处漏洞. 的启发性, 1 ) 使用的斯特林公式过于粗糙. 文献[ 2] 的证 明利用了式( 3 ) 做模型近似, 如前文所述, 这是一个 较粗糙的近似. 基于这一模型获得的结果精度难以 a2 , …, a n 不很大的情况下, 这 保证. 尤其在 N,a1 , 种估计和实际的分布情况差距很大 . 2 ) 解的存在性没有进行说明. 文献[ 2] 采用拉 格朗日乘子法求出玻尔兹曼分布的形式, 是建立在 条件极值一定存在这一假设之上. 这是拉格朗日乘 子法本身的要求, 后面给出的引理 1 将说明这一点. a2 , …, a n ) 的条件极值不存在, 然而, 如果 s( a1 , 拉格 朗日乘子法就不能使用, 结论的正确性也就无从保 证. 因此, 判定条件极值的存在性是有必要的 . 3 ) 没有论证得到的分布是否为条件最大值点 . 拉格朗日乘子法得到的是条件极值点, 但无法确定 是条件极大值还是条件极小值. 另一方面, 拉格朗 日乘子法无法判定边界点与条件极值点的大小关 1] 系. 这一方面, 文献[ 试图用函数对 a i 的二阶导数 小于 0 来论证分布是最大值点, 然而这并不严格. , 0 一方面 二阶导数小于 只能是判定一元函数驻点 为条件极大值点的条件, 对于多元函数不适用. 另 一方面, 即使是对于一元函数, 这也只是条件极大值 点的条件, 而不是条件最大值点的条件. 2]面向的读者 群 多 为 统 计 物 理 的 初 学 文献[ 者, 所做的论述力求以传达统计物理的思想为要 , 做 了较大的简化是可以理解的. 然而, 从数学上构建 严密的分析方法, 夯实玻尔兹曼分布的理论基础, 甚 至发掘出一些新的观点, 对于统计物理本身, 仍然是 很有意义的.
)
Σ
n i =1
ln a + (a + 1 2)
i i
其中 J 为雅可比( Jacobi) 矩阵. 引理 2 n 元拉格朗日型余项的泰勒公式
n 1 设 UR 为凸区域,f: U → R 具有 m + 1 阶连 x0 = ( x0 x0 …, x0 x = ( x1 , x2 , …, 续偏导数, n ) ∈ U, 1, 2,
a2 , …, an ) = 求 f ( a1 ,
N!
∏ i = 1 ai !
∏ j = 1 ωa j 何时取得最
a2 , …, a n ) 是玻尔兹曼体系当中对 大值? 这里 f( a1 ,
2 ] a2 , …, a n 时的微观状态数[1 , . 需 应能级分布为 a1 , 要说明的是, 本文假定满足上述条件的分布是存在
我们首先回顾传统统计物理教材对于玻尔兹曼
为了从数学上严格地研究上述问题, 这里先给 出 2 个重要的引理.