第三章 矩阵的对角化、若当标准型§3.1 矩阵对角化线性变换在基下的矩阵若为对角阵,则向量在基下的表示将非常简单,而线性变换在两个基下的矩阵相似,故线性变换在基下矩阵为对角阵问题即为矩阵对角化问题。
一、特征值、特征向量性质定义1 设n n A ⨯∈C ,称A 的全体特征值为A 的谱。
下面定理1是显然的。
定理1 相似矩阵有相同的特征多项式,从而有相同的谱。
由于矩阵A 的不同特征值对应的特征子空间的和是直和,故有下面定理2。
定理2 设n n A ⨯∈C ,则A 的不同特征值对应的特征向量线性无关。
定义2设n n A ⨯∈C ,i λ为A 的特征值,称A 的特征多项式中i λ的重根数i m 为i λ的代数重复度,称特征子空间i V λ的维数i α为i λ的几何重复度。
由定义2即知A 的特征值i λ的几何重复度i α为A 对应于特征值i λ的线性无关特征向量的个数。
定理3 设n n A ⨯∈C ,i λ为A 的特征值,i α为i λ的几何重复度,则rank()i i n n I A αλ=--证明 特征子空间{|,}i n i V x Ax x x λλ==∈C ,所以dim dim ()ii i n V N I A λαλ==-dim ()i n n R I A λ=--rank()i n n I A λ=--例1 求123323001A ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦的谱,及相异特征值的代数重复度和几何重复度。
解 123det()32301I A λλλλ----=---+ 2(1)(4)λλ=+-所以A 的谱为11,1λ=--,24λ=,12,λλ的代数重复度分别为122,1m m ==。
1λ的几何重复度113rank()I A αλ=--2233rank 3331000---⎡⎤⎢⎥=----=⎢⎥⎢⎥⎣⎦2λ的几何重复度223rank()I A αλ=--3233rank 3231005--⎡⎤⎢⎥=---=⎢⎥⎢⎥⎣⎦定理4 设n n A ⨯∈C ,i λ为A 的特征值,i m 为i λ的代数重复度,i α为i λ的几何重复度,则i i m α≤。
证明 因为i α为i λ的几何重复度,所以A 对应于i λ有i α个线性无关的特征向量12,,,i αεεε是特征子空间i V λ的基,将12,,,i αεεε扩充为n C 的基121,,,,,iin ααεεεεε+设121[]iin P ααεεεεε+=,则121[]iin AP A ααεεεεε+=121[,]iii i i n AA ααλελελεεε+=121*[]iiiin iOααλλεεεεελ+⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥∆⎣⎦PB =其中()()i i n n αα-⨯-∆∈C ,*i iiB Oλλλ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥∆⎣⎦。
所以矩阵A 与B 相似,故特征多项式det()det()n n I A I B λλ-=-()det()i i i n I ααλλλ-=--∆又因为det()()()i m n i I A f λλλλ-=-所以i i m α≤。
二、矩阵的对角化定义3 设n n A ⨯∈C ,若A 与对角阵相似,则称A 可对角化,可对角化的矩阵称为单纯矩阵。
定理5 设n n A ⨯∈C ,则A 为单纯矩阵的充分必要条件是A 的任一特征值的代数重复度等于几何重复度。
证明 设12,,,σλλλ为A 的全部相异特征值,i m 为i λ的代数重复度,i α为i λ的几何重复度,1,2,,i σ=。
充分性 因为1i i m n σ==∑,i i m α=,所以A 有n 个线性无关的特征向量12111222121212,,,,,,,,,,,,p p p p p p p p p σσσσααα 其中12,,,ii iip p p α为i λ对应的特征向量,1,2,,i σ=。
设12111222121212[,,,,,,,,,,,,]P p p p p p p p p p σσσσααα= 则1122diag[,,,,,,,,,]AP P σσλλλλλλ=故11122diag[,,,,,,,,,]A P P σσλλλλλλ-=必要性 设A 与12diag[,,,]n μμμ相似,则12,,,n μμμ是A 的特征值,不妨设1211122diag[,,,,,,,,,]m m m A P P σσσλλλλλλ-=则A 关于特征值i λ至少有i m 个线性无关的特征向量,即i i m α≥,又由定理4:i i m α≤,故得i i m α=,1,2,,i σ=。
由定理5的证明显然有下面的结论。
推论1 设n n A ⨯∈C ,则A 为单纯矩阵的充分必要条件是A 有n 个线性无关的特征向量。
推论2 设n n A ⨯∈C ,若A 有n 个不同的特征值,则A 为单纯矩阵。
三、正规阵及其对角化定义4 设()n n n n A ⨯⨯∈C R ,如果H H A A AA =,则称A 为复(实)正规阵。
显然埃尔米特矩阵(对称阵)、反埃尔米特矩阵(反对称阵)和酉矩阵(正交阵)都是复(实)正规阵。
定义5 设,()n n n n A B ⨯⨯∈C R ,若()n n n n U ⨯⨯∃∈U E ,使得H A UBU =(T A UBU =)则称,A B 酉(正交)相似。
引理1(司楚尔(Schur )引理) 设n n A ⨯∈C ,则n n U ⨯∃∈U ,使得H A URU =,其中R 是上三角阵,且R 的对角线为A 的特征值。
证明 用归纳法 当1n =时,命题显然。
假设n m =时命题成立,要证1n m =+时命题也成立。
设(1)(1)m m A +⨯+∈C ,1λ为A 的特征值,1u 为其对应的特征向量,且1||||1u =。
将1u 扩充为1m +C 的标准正交基121,,,m u u u +记1121[]m U u u u +=,则[]H 1H H 211121H 1m m u uU AU Au Au Au u ++⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦11B OA λ⎡⎤=⎢⎥⎣⎦因为1m m A ⨯∈C ,故由假设1m m V ⨯∃∈U ,使得H1111A V RV =,其中1R为上三角阵。
所以1H 11H 111B U AU O V RV λ⎡⎤=⎢⎥⎣⎦11H 11111O BV O O V OR O V λ⎡⎤⎡⎤⎡⎤=⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦所以11H1111111H O BV O A U U O V OR O V λ⎡⎤⎡⎤⎡⎤=⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦记111O U U O V ⎡⎤=⎢⎥⎣⎦,111BV R O R λ⎡⎤=⎢⎥⎣⎦,则 (1)(1)m m U +⨯+∈U ,且H A URU =其中R 为上三角阵。
因为A 与R 酉相似,故A 与R 有相同的特征值,所以R 的对角线元素为A 的特征值。
推论3 设n n A ⨯∈C ,则n n U ⨯∃∈U ,使得H A URU =,其中R 是 下三角阵,且R 的对角线为A 的特征值。
定理 6 设n n A ⨯∈C ,则A 为正规阵的充分必要条件是n n U ⨯∃∈U ,使得H A U U =Λ,其中12diag[,,,]n λλλΛ=,12,,,n λλλ是A 的特征值。
证明 必要性 由司楚尔引理n n U ⨯∃∈U ,使得H A URU =,111212220n n nn r r r r r R r ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦且R 的对角线为A 的特征值12,,,n λλλ。
因为H H H H HA AU R U U R U U R R U== H H H H H H A A UR U URU UR RU ==所以H H RR R R =, 即1112111222122212000000n n nn nn nn r r r r r r r r r r r r ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦ 111112112222221200000n n nnnn nn r r r r r r r r r r r r ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦比较此式两端即得12diag[,,,]n R λλλ=Λ=。
充分性 H A U U =Λ,故H H A A AA =。
推论4 正规阵是单纯矩阵。
推论5 正规阵的属于不同特征值的特征子空间正交。
证明 由定理6知A 酉相似对角阵,故A 的不同特征值的特征子空间基底正交,故得证。
推论 6 设A 为正规阵,其特征值为12,,,n λλλ,则H A 的特征值为12,,,n λλλ。
证明 因为A 为正规阵,所以n n U ⨯∃∈U ,使得12diag[,,,]H n A U U λλλ=所以12diag[,,,]H H n A U U λλλ=即H A 的特征值为12,,,n λλλ。
推论7 设A 为正规阵,则A 为Hermite 矩阵的充分必要条件是A 的特征值都是实数。
证明 由推论6,若H A A =,则A 的特征值为实数。
反之若A 的特征值为实数,则H A A =。
推论8 设A 为正规阵,则A 为酉矩阵的充分必要条件是A 的特征值|()|1A λ=。
证明 因为A 为正规阵,所以n n U ⨯∃∈U ,使得12diag[,,,]H n A U U λλλ=若H AA I =,则1i i λλ=,即||1i λ=,1,2,,i n =。
反之,若||1i λ=,1,2,,i n =,则H AA I =。
n 阶正规阵A 酉相似于对角阵,求酉矩阵n n U ⨯∈U ,使得12diag[,,,]H n U AU λλλ=的方法与线性代数中实对称阵对角化方法相似,介绍如下。
(1) 求出A 的相异特征值12,,,σλλλ(2) 对A 的每个相异特征值i λ求出其对应的特征子空间的基底12,,,ii iip p p α(即方程()0i I A x λ-=的基础解系),1,2,,i σ=。
(3) 将12,,,ii ii p p p α化为i λ对应的特征子空间标准正交基12,,,ii i iαεεε(用施密特正交化,然后单位化),1,2,,i σ=(4) 取12111222121212[]U σσσσαααεεεεεεεεε=,则1122diag[,,,,,,,,,]H U AU σσλλλλλλ=§3.2 埃尔米特二次型埃尔米特矩阵是实对称阵的推广,而一个实对称阵对应着一个实二次型,相应的我们讨论复(埃尔米特)二次型,这在力学及其它一些工程中有重要的应用。
一、埃尔米特矩阵定理1 设H n n A A ⨯=∈C ,则(1)A 酉相似于对角线上都是A 的特征值的对角阵,且A 的特征值都是实数。