第1章泛函和变分1.1引言以前我们在微积分中遇到的都是类似下面的函数极值问题:一个足够光滑的连续函数12(,,...,)n y f x x x =,其在区域n R Ω⊂内任何一点12(,,...,)T n x x x =x 都可以作以下的Taylor 展开21212()()()()(||||)(),,...,T T T Tn f f f f o f f f f x x x +∆=+∆+∆∆+∆⎛⎫∂∂∂= ⎪∂∂∂⎝⎭x x x x x x D x x x x ∇∇(1.1.1)22221121222212...()...n n n n f f f x x x x x f f f f x x x x x ⎡⎤∂∂∂⎢⎥∂∂∂∂∂⎢⎥⎢⎥=⎢⎥∂∂∂⎢⎥⎢⎥∂∂∂∂∂⎣⎦D x函数在某一点有极值的必要条件是12,,...,0Tn f f f f x x x ⎛⎫∂∂∂== ⎪∂∂∂⎝⎭∇但是,我们这们课程中要讨论的则是另一类极值问题—泛函的极值问题(泛函简单地讲,就是函数的函数,详细见后面)。
例1.1一个简单的变分问题:最短线问题图1.1最短线问题假设经过,A B 两点距离最短的曲线方程为*()y y x =(1.1.2)另有一任意的连续可导函数()x ηη=,()x η满足两端固定的边界条件01()()0x x ηη==(1.1.3)显然()()y y x x αη=+依旧是过固定两点,A B 的连续曲线,其对应的长度为12()1('')d x x L y xααη=++⎰(1.1.4)当0α=,()y y x =时()L α取到极小值,也就是说0d ()|0d L ααα==(1.1.5)把(1.1.4)代入(1.1.5),展开后有()()10111000110000222233222d ()('')'|d |d 1('')''''d |d 1'1'1'''''''''d d 1'1'1'0x x x x x x x x x x x x L y x y y y y x x y y y y y y y y x xy y y ααααηηααηηηηηη==+=++'⎛⎫⎪==- ⎪+++⎝⎭⎛⎫ ⎪=--=- ⎪+ ⎪++⎝⎭=⎰⎰⎰⎰⎰(1.1.6)由于(1.1.6)对于任意的()x ηη=都成立,根据变分引理(见2.2.2节),我们可以得到()32''1'y y =+(1.1.7)意味着12y C x C =+(1.1.9)因此,在平面上过固定两点距离最近的光滑曲线是直线。
下面我们来看几类比较典型的变分问题。
例1.2最速降线问题图1.2最速降线问题我们在该铅直平面上取一直角坐标系,以A 为坐标原点,水平为x 轴,向下为y 轴。
曲线的方程为()y y x =,A 点坐标00(,)(0,0)x y =,B 点坐标11(,)x y 。
曲线上任意一点P时的速度为d 2d sv gy t==(1.1.10)222d d 1(')d d d d 222x y y s st xv gy gy gy++====(1.1.11)因此,重物沿该曲线从A 点滑到B 点所需要的总时间为121(')[]d d 2x x y T y t xgy+==⎰⎰(1.1.12)[]T y 我们也称之为泛函。
该曲线参数形式为1122(sin ),(1cos )x C y C θθθ=-=-(1.1.13例1.3短程线问题短程线问题可以描述为:给定一个光滑曲面(,,)0x y z φ=,在该曲面上有两个固定A 和B ,要求在曲面上找到一根连接该两点的最短曲线。
记A 和B 的坐标分别为111(,,)x y z 和222(,,)x y z ,连接该两点的曲线方程为(),()y y x z z x ==(1.1.14)它们满足(,,)0x y z φ=(1.1.15)那么该曲线的长度为()()2122''[,]1d x x L y z y z x=++⎰(1.1.16)因此,短程线问题所对应的变分问题为:在连接A111(,,)x y z 和B 222(,,)x y z 而且满足(,,)0x y z φ=的光滑曲线()y y x =,()z z x =中,找到其中的一条,使得(1.1.16)中的泛函[,]L y z 取到极小值。
和前面速降线问题中不同的是,这里的自变函数()y y x =,()z z x =不是自由的,它们受到约束条件(,,)0x y z φ=的限制,因此短程线问题对所应的是个泛函的条件极值问题,其约束条件是代数关系。
例1.4等周问题用参数表示的平面曲线方程为(),()x x s y y s ==(1.1.17)参数s 可以理解为曲线从起点的长度。
如果曲线的长度为l ,那么[0,]s l ∈。
由于曲线是封闭,所以有边界条件(0)(),(0)()x x l y y l ==(1.1.18)而该曲线的长度为220(')(')d ll x y s=+⎰(1.1.19)该曲线所围成的面积为(根据Green 公式)1212[,]d d (d d )('')d A x y x y x y y x xy yx s==-=-⎰⎰⎰⎰ (1.1.20)因此,等周问题所对应的变分问题可以描述为:在所有满足(0)(),(0)()x x l y y l ==以及约束条件220(')(')d ll x y s=+⎰的曲线中,找到其中一根使得(1.1.20)中[,]A x y 取极大值。
显然,等周变分问题是泛函的条件极值问题,其约束条件是个积分等式。
例1.5最优控制问题状态方程为0()[(),(),],[,]f t t t t t t t =∈xf x u (1.1.21)其中nR ∈x 为状态向量,0()t x 为初始状态,()f t x 为终止状态,m R ∈u 为输入向量。
要求寻找合适的()(,)t t =u g x ,使得[(),(),]d minft t J L t t t t =→⎰x u (1.1.22)其中J 是一个性能泛函。
和上面几个问题不同的,这是一个带微分约束(1.1.21)的泛函极值问题.1.2泛函定义1.1记{()}C y x =是给定的函数集合,如果对于该集合中的任何一个函数)(x y ,都有一个数(在本讲义中全部为实数)与之相对应,我们记为)]([x y J 或者][y J 。
这样我们说][y J 是定义在函数集合)}({x y 上的一个泛函。
简单地讲,泛函就是以函数集合为定义域的实值映射。
泛函的定义域是指泛函定义中的函数集合。
如例1.2中最速降线中的泛函(1.1.12)21(')[]d d 2x y T y t xgy+==⎰⎰,其定义域为{}1010011()(,),(),()C y y x C x x y x y y x y =∈==此外,在等周问题中泛函(1.1.31)1[,]('')d 2A x y xy yx s =-⎰ 中的定义域为{}1,(),()(0,),(0)(),(0)()C x y x s y s C l x x l y y l =∈==象短程线问题中的(1.1.26)、等周问题中的(1.1.30)、最优控制问题中的(1.1.32),一般不被视为泛函定义域中对函数的限制,而被认为是一种外加的约束,这样的约束称为条件。
以上定义还可以推广到依赖于多元函数或多个函数的泛函。
举两个例子。
{(,)(,)}C z x y x y =∈Ω是定义在区域Ω上连续函数的集合,那么下式就定义了一个泛函2[]()d d J z z x,y x yΩ=⎰⎰如果1{(),(),[,]}C y x z x y z C a b =∈是定义在区间[[,]a b 上的一阶连续可微函数对的集合,那么下式就定义了一个泛函22[,][()()]d baJ f g f x g x x''=+⎰当然0[()]()J y x y x =也可视为一种泛函;不过,以后提到的泛函主要是指具有上述积分形式的泛函。
线性泛函对于泛函][∙J ,如果对于泛函定义域中任意两个函数f 和g 以及任意两个实数a 和b ,始终成立][][][g bJ f aJ bg af J +=+那么称泛函][∙J 为定义域上的线性泛函。
1.3自变函数的变分定义1.2在同一泛函定义域上的两个函数)(x y 、)(x m ,若彼此任意接近,那么)(x m 与)(x y 之差()()()y x m x y x δ=-称为函数)(x y 的变分。
显然函数变分y δ也是关于x 的函数,它和函数的增量y ∆是有差别的。
变分y δ反应了整个函数的变化,而函数增量y ∆反应的是同一个函数由于自变量的取值不同所引起的变化。
图2.1变分y δ和函数的增量y∆自变函数变分的一个重要性质下面我们来讨论函数变分的一个重要性质:求变分和求导数可以交换次序'''''()[()()]()()()y m x y x m x y x y δδ=-=-=(1.3.1)如果自变函数),(y x w 是个多元函数,那么求偏导数和求变分也可以交换次序,就是说()()x w w xδδ∂=∂(1.3.2)w w δδ∆=∆)(,222222x y z∂∂∂∆=++∂∂∂(1.3.3)()δφδφ=∇∇,x y z∂∂∂=++∂∂∂ij k ∇(1.3.4)1.4泛函的变分对于一个足够光滑的函数,如果我们在某一点x 附近作泰勒展开,212!()()'()"()(||)f x x f x f x x f x x o x +∆=+∆+∆+∆那么其增量的线性部分d '()f f x x=∆称为函数的一阶微分,而22d "()f f x x =∆称为函数的两阶微分。
其中d f 是x ∆的线性函数,而2d f 是x ∆的两次函数。
对于任意一个泛函][y J ,函数变分所引起的泛函增加量为][][y J y y J J -+=∆δ如果可以展开为212![,][,](||||)J L y y Q y y o y δδδ∆=++(1.4.1)其中],[y y L δ是关于y δ的线性泛函,也就是说RC C ∈∀21,],[],[],[22112211y y L C y y L C y C y C y L δδδδ+=+(1.4.2)而],[y y Q δ为y δ的两次泛函。