第五章 特征值的估计及对称矩阵的极性本章主要讨论数值代数中的三个特殊理论,即特征值的估计广义特征值问题实对称矩阵(一般是Hermite 矩阵)特征值的极小极大原理,其次也涉及到一些特征值和奇异值的扰动问题,最后简要地介绍矩阵直积的一些性质及其在线性矩阵方程求解方面的应用。
这几方面的内容,在矩阵的理论研究与实际应用当中都有着相当重要的作用。
5.1特征值的估计一、特征值的界首先给出直接估计矩阵特征值模的上界的一些方法定理5.1 设A=(a rs )∈R n×n ,令 M=||21max ,1sr rs n s r a a -≤≤ λ若表示A 任一特征值,则λ的虚部Im(λ)满足不等式2)1(|)Im(|-≤n n M λ |Im(λ)|≤||A -A T ||2 / 2|Im(λ)|≤||A -A T ||1⋅/2.证明:设x+i ⋅y 为对应于λ的A 的特征向量,则 A(x+i ⋅y)=(α+β⋅i)(x+i ⋅y)其中λ=α+β⋅i.显然x,y 为实向量,且x,y 为线性无关的 向量。
经整理A(x,y)=(x,y)B,其中B=⎪⎪⎭⎫ ⎝⎛-αββα。
从而(x,y)T A(x,y)=(x,y)T (x,y)B展开有⎪⎪⎭⎫ ⎝⎛Ay y Ax y Ay x Ax x T T T T =α⋅⎪⎪⎭⎫ ⎝⎛y y y x y x x x T T T T + β⋅⎪⎪⎭⎫ ⎝⎛--x y y y x x y x T T T T (求等式两边矩阵的对角元之和,可得α(x T x +y T y )=x T Ax +y T Ay (1)等式两边矩阵的左上角单元减去右下角单元可得:β(x T x +y T y )=x T (A -A T )y1).记B=A -A T ,则 |x T By|≤||x||2 ⋅||B||2⋅||y||2从而 |β|≤||x||2 ⋅||B||2⋅||y||2 /((||x ||2)2 +(||y ||2)2)利用ab /(a 2+b 2)≤1/2 可得 |β|≤||B||2 /2.2).由于|x T By|≤||Bx||1 ⋅||y||∞≤||B||1⋅||x||1 ⋅||y||∞从而 |β|≤||B||1 ⋅||x||1 ⋅||y||∞ /((||x ||2)2 +(||y ||2)2)易证明 ||x||1 ⋅||y||∞ /((||x ||2)2 +(||y ||2)2)/2.(显然,不妨假设(||x ||2)2 +(||y ||2)2=1,设||y ||∞=t =cos(α), 则y 必为t ⋅ e j 的形式(为什么?), 从而极值转化为求解如下最大值问题:max ||x||1, 满足约束(||x ||2)2=1-t 2这样有均值不等式||x||1x ||2= -t 2)1/2,从而我们需要求解t (1-t 2)1/2的最大值,设t =cos(α) 可得t (1-t 2)1/2的最大值为1/2. 从而得证。
)因此 |β|≤||B||13). 由于b ii =0, i =1,2,…,n , b ij = -b ji ,因此 |x T By|2=|11()n ij i j j i i j i bx y x y -=>⋅⋅-∑∑|2≤(2M )221||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑(利用(a 1+a 2+…+a n )2≤ n ((a 1)2+(a 2)2+…+(a n )2)≤(2M )2 (n (n -1)/2)21||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑≤(2M )2 (n(n -1)/2)⋅2222111(2)2n n i j i j i j j i i j x y x x y y x y ==-+∑∑=M 2 (n (n -1))⋅2⋅[ (x T x)⋅(y T y )- (x T y)2]利用[ (x T x)⋅(y T y )- (x T y)2]≤(x T x)⋅(y T y )可得|β|≤M (2n (n -1))1/2 (x T x)1/2⋅(y T y )1/2 /(x T x +y T y )≤M (2n (n -1))1/2 / 2=M (n (n -1)/2)1/24). |x T By|=|11()n ij i j j i i j i bx y x y -=>⋅⋅-∑∑|≤1/221||nij i j i b =>⎛⎫ ⎪⎝⎭∑∑1/221||n i j j ii j i x y x y =>⎛⎫- ⎪⎝⎭∑∑ 而 1/221||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑≤(x T x)1/2⋅(y T y )1/2 由此可以有|β|≤(1/2)1/221||nij i j i b =>⎛⎫ ⎪⎝⎭∑∑ 思考题:对于(1)式,利用定理推导的类似技术,求出关于|α|的界。
推论 实对称矩阵的特征值都是实数。
事实上,当A 这实对称矩阵时,M =0.由定理5.1可得Im(λ)=0,即λ为实数。
引理1 设B ∈C n×n ,列向量y ∈C n 满足||y||2=1,则|y H By|∞≤m B ||||.定理5.2 设A ∈C n×n ,则A 的任一特征值λ满足|λ|≤||A||∞m∞+≤m H A A ||||21|)Re(|λ (5.1.3) ∞-≤m H A A ||||21|)Im(|λ (5.1.4) 推论: Hermite 矩阵的特征值都是实数;反Hermite 矩阵的特征值为零或纯虚数。
事实上,当A 为Hermite 矩阵时,由式(5.1.4) 知Im(λ)=0,即λ为实数;当A 为反Hermite 矩阵时,由式(5.1.3)知Re(λ)=0,即为λ为零或纯虚数。
定义.5.1设,)(n n rs Ca A ⨯∈=记∑≠==n rs s rs a A 1r ||)(R ),R (r 简写为.,,1n r =如果00|a r r 0|r R >,则称矩阵A 按行(弱)对角占优。
定义5.2 设A ∈C n×n 。
如果A T 按行严格对角占优,则称A 按列严格对角占优;如果A T 按行(弱)对角占优,则称A 按列(弱)对角占优。
对直接估计矩阵特征之乘积的模的界,再给出以下两个方法。
定理5.3 设A=(a rs )∈C n×n ,令M r =|a rr |+∑∑+=+=-=n r s nr s rs rr r rs a a m a 11|||||,| 如果A 按行严格对角占优,则∏∏∏===≤=≤n r n r nr r r r M A A m 111|)(||det |0λ (5.1.5)且当a rs =0(s>r)时,式(5.1.5)中等号成立。
证明:由于A 按对角占优, 所以det(A)≠0.考虑方程组21222211120,n n n n nn a a a A A a a a ξξ⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪+== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭因为A 按行对角占优, 因此A 1也按行对角占优。
从而A 1可逆。
上述线性方程组有唯一解x (1)=(ξ2, …,ξn )T .可以证明 |ξ k |=max {|ξ2|, …,|ξn |} <1,事实上,若|ξ k |=0 则显然成立。
若|ξ k |≠0, 我们有 a k 1+2n ks s s aξ=∑=0 (2 ≤ k ≤ n )则有 121n s kk k sks k ks k a a a ξξξ=≠-=+∑ (2 ≤ k ≤ n ) 如果|ξ k | ≥ 1, 则可得12||||||nkk k sk s s k a a a =≠≤+∑ (2 ≤ k ≤ n )这和A 对角占优矛盾。
因此|ξ k |=max {|ξ2|, …,|ξn |} <1成立。
利用分块矩阵的性质和x (1)的定义,我们有det(A)=det (1)110n -⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭A xI = det 1112110n b a a A ⎛⎫⎪⎝⎭ 其中b 11=a 11+12n s s s aξ=∑, |ξs |<1 (s =2,…,n )从而m 1 ≤ |b 11|≤ M 1, 其余类推可得0<1n r r m=∏|det |A ≤1nr r M =≤∏定理5.4 (H adamard’s inequality )设A=(a rs )∈C n×n ,则有122111|()||det |[(||)]n n n rrs r r s A A a λ====≤∑∏∏(5.1.7) 且式(5.1.7)中等号成立的充分条件是某a s 0=0或者(a r ,a s )=0 (r ≠ s ),这里a 1,…,a n 表示A 的n 个列向量。
证明:若a 1,…,a n 线性相关,则式(5.17)显然成立。
不妨设a 1,…,a n 线性无关,则对它们进行Gram-schmidt 正交化过程得到:a 1=b 1a 2=b 2+λ21b 1…a n =b n +λn 1b 1 +λn 2b 2+…+λn , n -1b n -1其中b 1 ,b 2,…b n 为正交向量。
从而||a i ||2≥||b i ||2记B=( b 1 ,b 2,…b n ).则A=BL, 其中L 为单位下三角矩阵。
|det(A)|2=|det(B)|2=det(B T B)=|| b 1||2⋅||b 2||2…||b n ||2.≤|| a 1||2⋅||a 2||2…||a n ||2.推广的定理5.4 (H adamard’s inequality )设A=(a rs )∈C n×n ,则有2121221111|||()||det |[(||max )]||n kl rl n n n l rrs n k s r r kl l a a A A a aλ======≤-∑∑∏∏∑ 证明:由于|det(A)|2=det (A H A )=det 111(,)H a a A αα⎛⎫ ⎪⎝⎭ = det 11111(,)0H H a a A A ααα-⎛⎫- ⎪⎝⎭ 利用对于任给的β ≠0有1211||/H H H A A αααβββ-≥从而有|det(A)|2≤[(a 1,a 1)-|αH β|2/βH A 1β]det(A 1)我们可以取β =e k ,这样我们就有|det(A)|2≤[(a 1,a 1)-max k>1|(a 1,a k )|2/(a k ,a k )]det(A 1) (*) 类似推导可以得到命题的证明。