当前位置:文档之家› 矩阵函数和函数矩阵

矩阵函数和函数矩阵

矩阵函数求导
首先要区分两个概念:矩阵函数和函数矩阵
(1) 函数矩阵,简单地说就是多个一般函数的阵列,包括单变量和多变量函数。

函数矩阵的求导和积分是作用在各个矩阵元素上,没有更多的规则。

单变量函数矩阵的微分与积分
考虑实变量t 的实函数矩阵
()()()ij m n X t x t ×=,所有分量函数()ij x t 定义域相同。

定义函数矩阵的微分与积分
0()(),()().t t ij ij t t d d X t x t X d x d dx dx ττττ⎛⎞⎛⎞⎟⎜⎟⎜⎟==⎜⎟⎜⎟⎟⎜⎜⎟⎝⎠⎝⎠∫∫ 函数矩阵的微分有以下性质:
(1) ()()()()()d d d X t Y t X t t dt dt dt
+=+; (2) ()()()()()()()d dX t dY t X t Y t t X t dt dt dt
=+; 特殊情形
(a ) 若K 是常数矩阵,则()()()d d KX t K X t dt dt
=; (b ) 若()X t 是方阵,则2()()()()()d dX t dX t X t X t X t dt dt dt
=+; (3) ()
111()()()()d dX t X t X t X t dt dt =----; (4) 对任意的方阵A 和时变量t ,恒有At At At d e Ae e A dt
==; (5) 若AB BA =,则A B B A A B e e e e e +==。

如果,A B 可交换,则许多三角不等
式可以推广到矩阵上。

如sin(),sin(2)A b A +等。

参考文献:余鄂西,矩阵论,高等教育出版社。

(2) 矩阵函数,就是自变量为矩阵的函数映射;根据函数的自变量和因变量的
形式可分为多种。

矩阵函数的导数
定义(向量导数):映射:n m f →\\,()()12(),(),,()
(), 1...T m i f f x f x f x f x i m ===",
定义映射的导数为一个m n ×的偏导数矩阵 (), 1..., 1...i ij j df x Df i m j n dx ⎡⎤===⎢⎥⎣⎦. 例如 dAx A dx
=, ⇒
()()()(),,D f x g x Df x Dg x αβαβαβ⎡⎤+=+∈∈⎢⎥⎣⎦\\
()()''()()()D f g x f g x g x ⎡⎤=⎢⎥⎣⎦
''()()()()()(),,T T T n m D f x g x g x f x f x g x f g ⎡⎤=+∈→⎢⎥⎣⎦
\\ ⇒
()()T T T T T dx Ax x A Ax x A A dx
=+=+
定义(矩阵导数):
()vec ()()vec()
d A X dA X dX d X 有
符号说明
•d/dx (y)是一个向量,其第(i)个元素是dy(i)/dx
•d/d x (y) 是一个向量,其第(i)个元素是dy/dx(i)
•d/d x (y T) 是一个矩阵,其第(i,j)个元素是dy(j)/dx(i)•d/dx (Y) 是一个矩阵,其第(i,j)个元素是dy(i,j)/dx •d/d X (y) 是一个矩阵,其第(i,j)个元素是dy/dx(i,j)
注意 Hermitian 转置不能应用,因为复共轭不可解析,x,y是向量,X,Y是矩阵,x,y是标量。

在下面的表达中 A, B, C 是不依赖于 X的矩阵,a,b是不依赖于x的向量, 线性积
•d/dx (AYB) =A * d/dx (Y) * B
o d/dx (Ay) =A * d/dx (y)
•d/d x(x T A) =A
o d/d x(x T) =I
o d/d x(x T a) = d/d x(a T x) = a
•d/d X(a T Xb) = ab T
o d/d X(a T Xa) = d/d X(a T X T a) = aa T
•d/d X(a T X T b) = ba T
•d/dx (YZ) =Y * d/dx (Z) + d/dx (Y) * Z
二次积
•d/d x (Ax+b)T C(D x+e) = A T C(Dx+e) + D T C T(Ax+b)
o d/d x (x T Cx) = (C+C T)x
[C: symmetric]: d/d x (x T Cx) = 2Cx
d/d x (x T x) = 2x
o d/d x (Ax+b)T (D x+e) = A T (Dx+e) + D T (Ax+b)
d/d x (Ax+b)T (A x+b) = 2A T (Ax+b)
o[C: symmetric]: d/d x (Ax+b)T C(A x+b) = 2A T C(Ax+b)
•d/d X(a T X T Xb) = X(ab T + ba T)
o d/d X(a T X T Xa) = 2Xaa T
•d/d X(a T X T CXb) = C T Xab T + CXba T
o d/d X(a T X T CXa) = (C + C T)Xaa T
o[C:Symmetric]d/d X(a T X T CXa) = 2CXaa T
•d/d X((Xa+b)T C(Xa+b)) = (C+C T)(Xa+b)a T
三次积
•d/d x(x T Axx T) = (A+A T)xx T+x T AxI

•d/dx (Y-1) = -Y-1d/dx (Y)Y-1

Note: matrix dimensions must result in an n*n argument for tr().
•d/d X(tr(X)) = I
•d/d X(tr(X k)) =k(X k-1)T
•d/d X(tr(AX k)) =SUM r=0:k-1(X r AX k-r-1)T
•d/d X(tr(AX-1B)) = -(X-1BAX-1)T
o d/d X(tr(AX-1)) =d/d X(tr(X-1A)) = -X-T A T X-T
•d/d X(tr(A T XB T)) = d/d X(tr(BX T A)) = AB
o d/d X(tr(XA T)) = d/d X(tr(A T X)) =d/d X(tr(X T A)) = d/d X(tr(AX T)) = A •d/d X(tr(AXBX T)) = A T XB T + AXB
o d/d X(tr(XAX T)) = X(A+A T)
o d/d X(tr(X T AX)) = X T(A+A T)
o d/d X(tr(AX T X)) = (A+A T)X
•d/d X(tr(AXBX)) = A T X T B T + B T X T A T

•[C:symmetric]d/d X(tr((X T CX)-1A) = d/d X(tr(A (X T CX)-1) =
-(CX(X T CX)-1)(A+A T)(X T CX)-1
•[B,C:symmetric]d/d X(tr((X T CX)-1(X T BX)) = d/d X(tr( (X T BX)(X T CX)-1) = -2(CX(X T CX)-1)X T BX(X T CX)-1 + 2BX(X T CX)-1

行列式
•d/d X(det(X)) = d/d X(det(X T)) = det(X)*X-T
o d/d X(det(AXB)) = det(AXB)*X-T
o d/d X(ln(det(AXB))) = X-T
•d/d X(det(X k)) = k*det(X k)*X-T
o d/d X(ln(det(X k))) = k X-T
•[Real] d/d X(det(X T CX)) = det(X T CX)*(C+C T)X(X T CX)-1
o[C: Real,Symmetric]d/d X(det(X T CX)) = 2det(X T CX)* CX(X T CX)-1•[C: Real,Symmetricc]d/d X(ln(det(X T CX))) = 2CX(X T CX)-1
Jacobian
如果y 是x的函数,则d y T/d x是y关于x的Jacobian 矩阵。

其行列式|d y T/d x|是表示了d y和d x的超体积比值. Jacobian行列式出现在变元积分中: Integral(f(y)d y)=Integral(f(y(x)) |d y T/d x| d x).
Hessian矩阵
如果f是x的函数,则对称矩阵d2f/d x2= d/d x T(df/d x)就是f(x)的Hessian 矩阵。

满足df/d x = 0 的x的值,当Hessian是正定、负定、不定时,就是相应的最小值、最大值、或者是鞍点。

•d2/d x2 (a T x) = 0
•d2/d x2 (Ax+b)T C(D x+e) = A T CD + D T C T A
o d2/d x2 (x T Cx) = C+C T
d2/d x2 (x T x) = 2I
o d2/d x2 (Ax+b)T (D x+e) = A T D + D T A
d2/d x2 (Ax+b)T (A x+b) = 2A T A
o[C: symmetric]: d2/d x2 (Ax+b)T C(A x+b) = 2A T CA。

相关主题