⎨ §1 变分法简介作为数学的一个分支,变分法的诞生,是现实世界许多现象不断探索的结果,人们可以追寻到这样一个轨迹:约翰·伯努利(Johann Bernoulli ,1667-1748)1696 年向全欧洲数学家挑战,提出一个难题:“设在垂直平面内有任意两点,一个质点受地心引力的作用,自较高点下滑至较低点,不计摩擦,问沿着什么曲线下滑,时间最短?”这就是著名的“最速降线”问题(The Brachistochrone Problem )。
它的难处在于和普通的极大极小值求法不同,它是要求出一个未知函数(曲线),来满足所给的条件。
这问题的新颖和别出心裁引起了很大兴趣,罗比塔(Guillaume Francois Antonie de l'Hospital 1661-1704)、雅可比· 伯努利( Jacob Bernoulli 1654-1705)、莱布尼茨( Gottfried Wilhelm Leibniz,1646-1716)和牛顿(Isaac Newton1642—1727)都得到了解答。
约翰的解法比较漂亮,而雅可布的解法虽然麻烦与费劲,却更为一般化。
后来欧拉(Euler Lonhard , 1707~1783)和拉格朗日(Lagrange, Joseph Louis ,1736-1813)发明了这一类问题的普遍解法,从而确立了数学的一个新分支——变分学。
有趣的是,在 1690 年约翰·伯努利的哥哥雅可比·伯努利曾提出著名的悬链线问题(The Hanging Chain Problem)向数学界征求答案,即,固定项链的两端,在重力场中让它自然垂下,问项链的曲线方程是什么。
在大自然中,除了悬垂的项链外,我們还可以观察到吊桥上方的悬垂钢索,挂着水珠的蜘蛛网,以及两根电线杆之间所架设的电线,这些都是悬链线(catenary )。
伽利略(Galileo, 1564~1643)比贝努利更早注意到悬链线,他猜测悬链线是抛物线, 从外表看的确象,但实际上不是。
惠更斯(Huygens, 1629~1695)在 1646 年(当时 17 岁),经由物理的论证,得知伽利略的猜测不对,但那时,他也求不出答案。
到 1691 年,也就是雅可比·伯努利提出悬链线问题的第二年,莱布尼兹、惠更斯(以 62 岁)与约翰·伯努利各自得到了正确答案,所用方法是诞生不久的微积分,具体说是把问题转化为求解一个二阶常微分方程⎧ d 2 y ⎪ dx 2 a 1+ ( dy )2 dx ⎪y (0) = y ⎪⎪ ⎩解此方程并适当选取参数,得y '(0) = 0即为悬链线。
y = 1 2a(e ax+ e -ax )(1)悬链线问题本身和变分法并没有关系,然而这和最速降线问题一样都是贝努利兄弟间的相互争强好胜、不断争吵的导火索,虽然雅可比·贝努利在解决悬链线问题时略占下风,但他随后所证明的“悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的重心最低,具有最小势能”,算是扳回了一局,俩兄弟扯平了!之所以提到悬链线问题,有两方面考虑,其一,这是有关数学史上著名的贝努利家族内的一个趣闻,而这是一个在变分法乃至整个数学物理领域有着巨大贡献的家族,其二,有关悬链线的得几个结论,可以用变= 0⎰ 0 1 0 1 0 1 0 0 1 1 ⎰ 0 0 0分法来证明!现实中很多现象可以表达为泛函极小问题,我们称之为变分问题。
求解方法通常有两种: 古典变分法和最优控制论。
我们这儿要介绍的基本属于古典变分法的范畴。
1.1变分法的基本概念 1.1.1 泛函的概念设 S 为一函数集合,若对于每一个函数 x (t ) ∈ S 有一个实数 J 与之对应,则称 J 是定义 在 S 上的泛函,记作 J ( x (t )) 。
S 称为 J 的容许函数集。
例如,在[x 0 , x 1 ] 上光滑曲线 y(x)的长度可定义为J = x 1x 01 + y '2dx(2)考虑几个具体曲线,取 x 0 = 0, x 1 = 1, 若 y (x ) = x ,则1若 y(x)为悬链线,则J ( y (x )) = J (x ) = ⎰0 1 + 1dx = e x+ e - x11e x+ e- xe - e -1J ( 2 ) = ⎰0 dx = ⎰0dx = 2 2 对应C 1[x , x ] 中不同的函数 y(x),有不同曲线长度值 J ,即 J 依赖于 y(x),是定义在函数集合C 1[x , x ] 上的一个泛函,此时我们可以写成J = J ( y (x ))我们称如下形式的泛函为最简泛函t fJ (x (t )) = ⎰tF (t , x (t ), x(t ))dt (3)被积函数 F 包含自变量t ,未知函数 x (t)及导数 x(t)。
如,上述曲线长度泛函即为一最简泛函。
1.1.2 泛函极值问题考虑上述曲线长度泛函,我们可以提出下面问题:在所有连接定点 A (x 0 , y 0 )和B (x 1 , y 1 ) 的平面曲线中,试求长度最小的曲线。
即,求 y (x ) ∈ {y (x ) y (x ) ∈ C 1[x , x ], y (x ) = y , y (x ) = y },使J ( y (x )) = x 1x 01 + y '2 d x取最小值。
此即为泛函极值问题的一个例子。
以极小值为例,一般的泛函极值问题可表述为, 称泛函 J ( x (t )) 在 x 0 (t ) ∈ S 取得极小值,如果对于任意一个与 x 0 (t ) 接近的 x (t ) ∈ S , 都有 J ( x (t )) ≥ J ( x 0 (t )) 。
所谓接近,可以用距离d ( x (t ), x 0 (t )) < 来度量,而距离可以定义为d (x (t ), x (t )) = max{| x (t ) - x (t ) |,| x (t ) - x (t ) |} t 0 ≤t ≤t f2(e x- e -x ) 21 + 4 0x (t ) = x (t ) - x 0 (t )泛函的极大值可以类似地定义。
其中 x 0 (t ) 称为泛函的极值函数或极值曲线。
1.1.3 泛函的变分如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。
作为泛函的自变量,函数 x (t ) 在 x 0 (t ) 的增量记为也称函数的变分。
由它引起的泛函的增量记作∆J = J ( x 0 (t ) +x (t )) - J ( x 0 (t ))如果∆J 可以表为∆J = L ( x 0 (t ),x (t )) + r ( x 0 (t ),x (t ))其中 L 为x 的线性项,而 r 是x 的高阶项,则称 L 为泛函在 x 0 (t ) 的变分,记作J ( x 0 (t )) 。
用变动的 x (t ) 代替 x 0 (t ) ,就有J ( x (t )) 。
(4)这是因为当变分存在时,增量∆J = J ( x (t ) +x ) - J ( x (t )) = L ( x (t ),x ) + r ( x (t ),x )根据 L 和 r 的性质有L ( x (t ),x ) =L ( x (t ),x ) lim r ( x (t ),x ) = lim r ( x (t ),x )x = 0→0所以→0 x ∂J ( x +x ) = lim J ( x +x ) - J ( x ) ∂=0→0= lim L ( x ,x ) + r ( x ,x ) = L ( x ,x ) = J ( x ) →01.2 泛函极值的相关结论1.2.1 泛函极值的变分表示利用变分的表达式(4),可以得到有关泛函极值的重要结论。
泛函极值的变分表示:若 J ( x (t )) 在 x 0 (t ) 达到极值(极大或极小),则J ( x 0 (t )) = 0(5)证明:对任意给定的x , J ( x 0 +x ) 是变量的函数,该函数在= 0 处达到极值。
根据函数极值的必要条件知J ( x (t )) = ∂J ( x (t ) +x (t ))∂=01 ⎰ ⎰ t f⎰ x t∂J ( x +x ) = 0∂ 0=0再由(4)式,便可得到(5)式。
变分法的基本引理:( x ) ∈C [x 1 , x 2 x 2( x )( x )dx ≡ 0 ,x 1], ∀( x ) ∈C 1[x , x ] ,( x 1) =( x 2) = 0 ,有则 ( x ) ≡ 0, 证明略。
x ∈[x 1, x 2 ] 。
1.2.2 泛函极值的必要条件考虑最简泛函(3),其中 F 具有二阶连续偏导数,容许函数类 S 取为满足端点条件为固定端点(6)的二阶可微函数。
x (t 0 ) = x 0 , x (t f ) = x f泛函极值的必要条件:设泛函(3 x(t)满足欧拉方程(6)(7)欧拉方程推导:首先计算(3)式的变分:J = ∂J ( x (t ) +x (t ))∂ = t f ∂ t =0F (t , x (t ) +x (t ), x (t ) +x (t )) =0 dt 0= t ft 0∂ [F x (t , x , x )x + F x (t , x , x )x ]dt 对上式右端第二项做分部积分,并利用x (t 0 ) = x (t f ) = 0 ,有t fd⎰t F x (t , x , x)x dt = - F (t , x , x)xdt , 0dt所以J = t f[F tx- d F dtx]xdt利用泛函极值的变分表示,得t f[F t 0x-dF dtx]xdt = 0因为x 的任意性,及x (t 0 ) = x (t f ) = 0 ,由基本引理,即得(7)。
(7) 式也可写成通常这是关于 x(t)的二阶微分方程,通解中的任意常数由端点条件(6)确定。
1.2.3 几种特殊形式最简泛函的欧拉方程(8)(i) F 不依赖于 x,即 F = F (t , x ) F x - F tx - F xx x - F x x x = 0 F - dF = 0 x dtx⎰⎰ ⎰2d这时 F x ≡ 0 ,欧拉方程为 F x (t , x ) = 0 ,这个方程以隐函数形式给出 x (t ) ,但它一般不满足边界条件,因此,变分问题无解。
(ii) F 不依赖 x ,即 F = F (t , x)欧拉方程为dtF x (t , x) = 0 将上式积分一次,便得首次积分 F x (t , x) = c 1 ,由此可求出 x = (t , c 1 ) ,积分后得到可能的极值曲线族x = ⎰(t , c 1 )dt(iii) F 只依赖于 x,即 F = F ( x )这时 F x = 0, F tx = 0, F xx = 0 ,欧拉方程为x F x x = 0由此可设 x = 0 或 F x x = 0 ,如果 x= 0 ,则得到含有两个参数的直线族 x = c 1t + c 2 。