5.4 正定矩阵 5.4.1 正定矩阵[1] 二次型的分类n 个变数的二次型∑===nj i Tji ij n x A x x x a x x q 1,1),,( ,其实就是定义在n R 的一个二次齐次函数,对n R 的每个特定向量q x ,0对应一个函数值)(0x q ,依据)(x q 值的符号,在教材184页上给出了二次型的分类定义:1.正定二次型。
若对一切nR x ∈,当0)(0>=⇒≠Ax x x q x T称二次型)(x q 正定。
显然,正定二次型也就是函数值定正的二次型(当然有唯一的例外,0=x 时,0=q )。
2.正半定(或半正定)二次型。
若对一切nR x ∈,皆有0)(≥=Ax x x q T,且至少有一 00≠x 能使0)(0=x q .3.负定。
对二次型Ax x x q T=)(,当(-q )为正定时,称q 为负定二次型。
4.负半定(或半负定)。
对二次型Ax x x q T=)(,当(-q )为正半定时,称q 为负半定二次型。
5.不定二次型。
若二次型Ax x q T=既能取正值,又能取负值,称为不定二次型。
容易明白,对标准形的二次型(以下给出的均为充要条件)。
若系数全正为正定二次型;若系数全为非负,且至少有一为0,则为正半定二次型; 若系数全负为负定二次型;若系数全为非正,且至少有一为0,则为负半定二次型; 若系数有正、有负,则为不定二次型。
对于不是标准形的二次型,为确定其类型,可通过化成标准形,并依据惯性律而作出判断。
例19 设n a a a ,,,21 是n 个实数,问它们满足什么条件时,二次型212322221121)()()(),,,(x a x x a x x a x x x x q n n n ++++++=是正定二次型。
解 乍一看,这是n 个带正系数1的平方项之和,应明显是正定的。
但与定义一对照,发现这并非是二次型的标准形,每一项都是线性型而非单独变换的平方。
在这样考虑下,可对其作线性变换nn n x x a y x a x y x a x y +=+=+=132222111而将q 化成标准形,22221n y y y q +++=这样不就可断定q 必是正定二次型了吗?但又发现这样的问题:这个线性变换是否是满秩线性变换呢?若是,则可肯定q 为正定,若否,则还是无法肯定q 为正定二次型。
现从定义出发考察此二次型,显然0),,(1≥n x x q , 只要有字距?0021====⇒=n x x x q ,就能说明q 是正定二次型了。
若q =0, 则必有⎪⎪⎩⎪⎪⎨⎧=+=+=+00 0 132211n n x x a a x x a x将其看作一 n n ⨯齐次方程组,只有系数行列式不为0时,才只有平凡解,即021====n x x x即可知),,(1n x x q 为正定二次型,于是,可写出条件为:01000100121≠na a a即0101001,01001001212121≠-≠-a a a a a a a n依次类推,最后得此),,,(21n x x x q 为正定二次型的条件是1)1(21≠-n na a a[2] 二次型分类问题的提出怎样想到要根据函数值的正负来对二次型分类的?这里以函数方及值问题为例作一讨论,供有兴趣的学生阅读教材190页5.4.2前作参考。
为简单计这里讨论二元函数。
在微积分中已知,函数),(y x f 在定义域某内点),(00y x 处取得极值的必要条件是,0),(00=∇y x f 即 ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡∂∂∂∂00),(),(0000y y x f xy x f 但若真在),(00y x 处取得极值,其充要条件是对),(00y x 某邻域内点),(y x ,能使),(),(00y x f y x f -保持定号,若总取正值则),(00y x f 是极小值,若总取负值则),(00y x f 是极大值。
利用函数的泰勒公式,使这一比较成为可能。
粗来造地说起来,泰勒公式使任意足够光滑的函数,在一点邻近,总可用一个多项式来近似,而且可以给出这样近似所产生的误差,即泰勒定理中的余项公式。
现设),(y x f 在点),(00y x 处具有2阶连续偏导数,则有展开到2阶项为止的泰勒公式:)(),()(),(),(),(00000000y y yy x f x x x y x f y x f y x f -∂∂+-∂∂+=⎥⎦⎤⎢⎣⎡-∂∂+--∂∂∂+-∂∂+20200200002202002)(),())((),(2)(),(!21y y y y x f y y x x y x y x f x x x y x f()22y y x x o -+-+由 0),(00=∇y x f ,若记 ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡∂∂∂∂∂∂∂∂∂∂=200200200220020),(),(),(),(y y x f x y y x f x y y x f x y x f H ,则上式可改写为 )|||(|)](),[(),(),(20200000000y y x x o y y x x H y y x x y x f y x f -+-+⎥⎦⎤⎢⎣⎡----=- 若略去高阶无穷小,从上可见,若[关于变数(0x x -)及)(0y y -的]二次型 000],[H y y x x --⎥⎦⎤⎢⎣⎡--00y y x x 正定,则f (00,y x )为极小值;若这个二次型负定,则f (00,y x )为极大值。
由于这个二次型涉及函数f 在点(00,y x )处的二阶偏导数,故常称此(加上∇f (00,y x )=0)为函数极值的二阶充分条件。
[3] 正定矩阵教材185页给出了实对称矩阵为正定或负定的定义,要注意这里是以矩阵为实对称作前提的,否则就不谈是否正定的问题,并且是以对应二次型为依据的。
另外,对记号也要注意,如0>A ,这里仅是实对称阵A 是正定矩阵,即AX X T为正定二次型的同义语,除此,就再无其他含意了。
例20 设A 是n 阶满秩阵,试证A A T是正定矩阵。
解 首先易证A A T是对称的,因有A A A A A A TTTTTT==)()(,其次对任一n 维向量0≠x ,二次型0)(22≥=Ax x A A x TT,由于上式中仅当0=Ax 时才能成立等号,而0=Ax 时必有0=x ,故证得A A T 是正定矩阵。
[4] 正定的充分必要条件对不是标准形的二次型(或不是对角阵的实对称阵)要判断其正定性,除按照定义外,可利用化二次型成标准形(实对称阵必可合同于对角阵)及惯性律,这样,就有一些可用的充要条件。
1.n 个变数的二次型为正定的充要条件是正惯性指数等于变数个数,即n =π。
教材185页定理81′n 阶实对称阵A 为正定的充要条件是存在满秩阵P ,使AP P T 成对角线元素皆正 的对角阵D 。
1″n 阶实对称阵A 为正定的充要条件是n 个特征值全正。
教材186页定理8推论2.n 个变数二次型为正定的充要条件是其规范形的系数全为+1。
存在满秩2′n 阶实对称阵A 为正定的充要条件是存在满秩阵B ,使成立B B A T =(即A 与单 位阵I 合同)。
2″n 阶实对称阵A 为正定的充要条件是存在对称正定阵B ,使A =B 2。
这可对教材186页定理9的证明,作如下演算而得:2B Q Q Q Q Q Q Q Q A T T T T =ΛΛ=ΛΛ=Λ=,其中记 TQ Q B Λ=以及),,,(diag 21n λλλ =Λ。
3.n 个变数的二次型AX X T或n 阶实对称阵A 为正定的充要条件是A 的多阶前主公式皆正,即),,2,1(0det ][n k Ak =>其中 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=kk k k k nn nnn n a a a a A a a a a a a a a a A 1111][212221211211, 教材187页定理10例21 已知A 、B 同是n 阶正定矩阵,试证A +B 及kA (k 是正整数)也是正定矩阵。
解 1. 对抽象给出的矩阵,常考虑从定义出发来证明,对任一n 维向量0≠x ,有 BX X AX X XB A X TTT+=+)(后一不等号是因为AX X T 及BX X T都大于0才成立的。
故知A +B 正定。
2.kA 与A 的特征值有熟知的关系,故从特征值角度入手考虑。
根据A 正定,即知其特征值n λλ,,1 全正,由于k A 的全部特征值就是k n k λλ,,1 ,也都为正。
这就知kA 是正定矩阵。
例22 已知A 是n 阶实对称阵,试证(1) 若A 正定,则必 0,,0,02211>>>nn a a a ; (2) 若对一切n 维向量0=X A X T则必0=A ; (3) 若 r A r =)(则A 可分成r 个秩1矩阵之和。
解(1) 根据定义,对一切0≠x ,皆有0>x A x T,故依次令ne e x ,,1 =, 就有0)(11>Ae e T, 即 011>a0)(>nTn Ae e , 即 0>nn a(2) 分别令ne e x ,,1=, 由0=x A x T,可得011===nn a a .若再令 j ix ←←⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=01010 ,则 02==ij T a Ax x ,得n j i a ij ≤<≤=1,0于是O A =.也可这样入手证明,将x T Ax 通过正交变换x=Qy 化成标准形,有 ∑==ni ii Tgd Ax x 12分别令n Qe Qe x ,,1 =,由0=x A x T得值01===n λλ ,即0=Λ,于是T Q Q A Λ=.(3) 利用实对称矩阵的特性:必可对角化;有)(A r 个非零特征值。
于是,因r A r =)(, 故知A 有r 个非零特征值r λλ,,1 ,并有TQ Q A Λ= 将Λ写成r 个秩1矩阵之和r rΛ++Λ+Λ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=Λ 21100λλ 其中i Λ是第i 个主对角线元为)1(r i i ≤≤λ,其他元全为0的秩1矩阵。
于是,有 r Tr TA A Q Q Q Q A ++=Λ++Λ= 11. 因i A 与i Λ同秩,故i A 均为秩1矩阵),,1(r i =,证毕。