矩阵及其特征值计算
⎜⎛ 2 1 0⎟⎞ A = ⎜1 3 1⎟
⎜⎝ 0 1 2⎟⎠ 解 矩阵A的特征方程为
λ −2 −1 0 ϕ(λ ) = det(λI − A) = − 1 λ − 3 − 1
0 −1 λ −2 = λ3 − 7λ2 + 14λ − 8 = (λ − 1)(λ − 2)(λ − 4) = 0.
求得矩阵A的特征值为:
解 矩阵A的3个圆盘为
D1 : λ − 4 ≤ 1, D2 : λ ≤ 2, D3 : λ + 4 ≤ 2.
n
∑ λ − aii ≤r i= aij (i = 1,2,L.n) j =1 j≠i
由定理8,可知A的3个特征值位于3个圆盘的并 集中,由于D1是孤立圆盘,所以D1内恰好包含A的一 个特征值λ1(为实特征值),即
量序列{vk}以计算A的主特征值λ1(2.7)及相应特征向量
(2.5)的方法就称为幂法.
38
迭代公式实质上是由矩阵A的乘幂 Ak与非零向量
v0相乘来构造向量序列{vk}={Akv0},从而计算主特征
值λ1及其对应的特征向量,这就是幂法的思想.
( ) vk+1 i ( )vk i
→ λ1
(k → ∞).
称为迭代向量,由假设,v0可唯一表示为
v0 = a1 x1 + a2 x2 + L+ an xn (设a1 ≠ 0), (2.3)
于是
vk = Avk−1 = Akv0 = a1λ1k x1 + a2λk2 x2 + L + anλkn xn
∑ =
λ1k
⎡ ⎢⎣a1 x1
+
n i=2
ai (λi
/
=
⎡− 5⎤
⎢ ⎣
5
⎥ ⎦
32
x1
=
Ax0 =
⎡1 ⎢⎣2
3⎤⎡− 5⎤
2⎥⎦⎢⎣
5
⎥ ⎦
=
⎡10⎤
⎢ ⎣
0
⎥ ⎦
=
⎡1⎤ 10⎢⎣0⎥⎦,
x2
=
A2 x0 =
⎡1 ⎢⎣2
3⎤⎡10⎤ 2⎥⎦⎢⎣ 0 ⎥⎦
=
⎡10⎤ ⎢⎣20⎥⎦
=
⎡0.5⎤ 20⎢⎣ 1 ⎥⎦,
x3
=
A3 x 0 =
⎡1 ⎢⎣2
(2) 属于同一个特征值的特征向量不是惟一的。
比如,若 X 是矩阵 A 的属于特征值 λ0 的特征向量, 则 k X (k ≠ 0) 也是 A 的属于特征值 λ0 的特征向量。
6
定义1 ⑴ 已知n阶矩阵A=(aij),则
⎛⎜ λ − a11 − a12 L − a1n ⎞⎟
ϕ(λ ) = det(λI − A) = det⎜⎜
一般有n个根(实的或复的,重根按重数计算)称为A的
特征值. 用λ(A)表示A的所有特征值的集合.
注:当A为实矩阵时,ϕ (λ)=0为实系数n次代数
方程,其复根是共轭成对出现.
8
⑵ 设λ为A的特征值,相应的齐次方程组
(λI − A)x = 0
(1.2)
的非零解x称为矩阵A的对应于λ的特征向量.
9
例1 求A的特征值及特征向量,其中
第5章 矩阵及其特征值计算
1
• 1 特征值性质及其估计 • 2 幂法及反幂法 • 3 QR方法
矩阵计算的基本问题
¾线性方程组解 ¾超定方程组的二乘解
Ax = b min || Ax − b || 2
¾矩阵特征值和特征向量 Ax = λx
一、问题
矩阵的特征值与特征向量理论有着非常广泛的应用, 如工程技术领域中的振动问题和稳定性问题,数学领域 中方阵的对角化、偏微分方程组的求解等问题都会用到 该理论。
四、特征值估计
下面讨论矩阵特征值界的估计.
定义3 设n阶矩阵A=(aij),令
n
∑ ⑴ r i= aij (i = 1,2,L.n) ; j =1 j≠i
{ } ⑵ 集合Di = z | z − aii ≤ ri , z ∈ C (i = 1,2,L, n) 称
为复平面上以aii为圆心,以ri为半径的n阶矩阵A的n 个Gerschgorin(格什戈林)圆盘.
λ = 1, λ = 2, λ = 4.
对应于各特征值矩阵A的特征向量分别为:
⎜⎛ 1 ⎟⎞
⎜⎛ 1 ⎟⎞
⎜⎛ 1⎟⎞
x1 = ⎜ − 1⎟, x2 = ⎜ 0 ⎟, x3 = ⎜ 2⎟.
⎜⎝ 1 ⎟⎠
⎜⎝ − 1⎟⎠
⎜⎝ 1⎟⎠
计算问题
关于计算矩阵A的特征值问题,当n=2,3时,我
们还可按行列式展开的办法求ϕ(λ)=0的根. 但当n较大 时,如果按展开行列式的办法,首先求出ϕ(λ)的系数, 再求ϕ(λ)的根,工作量就非常大,用这种办法求矩阵
定义4 设A∈Rn×n为对称矩阵,对于任一非零向
量x,称
R( x) = ( Ax, x) , (x, x)
为对应于向量x的瑞利(Rayleigh)商.
定理9 设A∈Rn×n为对称矩阵(其特征值次序记
为λ1≥λ2≥L≥λn),则
1.
λn
≤
( Ax, x) (x, x)
≤
λ1
(对任何非零x∈Rn);
定理7(对称矩阵的正交约化) 设A∈Rn×n为对称
矩阵,则
⑴ A的特征值均为实数;
⑵ A有n个线性无关的特征向量;
⑶ 存在一个正交矩阵P使的
⎡λ1
⎢
PT
AP
=
⎢ ⎢
λ2
O
⎤
⎥
⎥ ⎥
,
⎢ ⎣
λn
⎥ ⎦
且λ1,λ2,L,λn为A的特征值,而P=(u1,u2,L,un) 列向量 uj为A的对应于λj 的单位特征向量.
4
矩阵特征值
Ax = λx
求绝对值最大的特征值 求全部特征值
5
二、特征值与特征向量
设 A 为 n 阶方阵, 如果存在数 λ 和 n 维非零向量 X 使得 A X= λ X, 则称数 λ 为方阵 A 的特征值, 非零 向量 X 称为 A 的属于特征值 λ 的特征向量。
注意 (1) 特征值 λ 可以为零;
⑴ A与B有相同的特征值; ⑵ 如果y是B的特征向量,则Py是A的特征向量.
定理5说明,一个矩阵A经过相似变换,其特征 值不变.
定理6 ⑴ A∈Rn×n可对角化,即存在非奇异矩阵
P使
⎡λ1
⎤
⎢
P
−1 AP
=
⎢ ⎢
λ2
O
⎥
⎥ ⎥
,
⎢ ⎣
λn
⎥ ⎦
的充分必要条件是A具有n个线性无关的特征向量.
⑵ 如果A∈Rn×n有 m个 (m≤n) 不同的特征值 λ1,λ2,L,λm,则对应的特征向量 x1,x2,L, xm 线性无关.
反幂法则是计算非奇异(可逆)矩阵按模最小的特征 值和相应特征向量的一种向量迭代法. 下面分别介 绍幂法与反幂法.
一 、幂法(又称乘幂法)
设实矩阵A=(aij)有一个完全的特征向量组,即 A有n个线性无关的特征向量,设矩阵A的特征值为
λ1,λ2,L,λn, 相应的特征向量为x1,x2,L,xn. 已知A的主 特征值λ1是实根,且满足条件
3⎤ 2⎥⎦
⎡10⎤ ⎢⎣20⎥⎦
=
⎡70⎤ ⎢⎣60⎥⎦
=
⎡ 70⎢
⎢⎣
1 6
7
⎤ ⎥, ⎥⎦
x4
=
A4 x0 =
⎡1 ⎢⎣2
3⎤⎡70⎤ 2⎥⎦⎢⎣60⎥⎦
=
⎡250⎤ ⎢⎣260⎥⎦
=
⎡ 260⎢
⎢⎣
25⎤ 216⎥⎥⎦,
33
¾幂法是利用矩阵的高次幂乘上一个向量,它一般将 随着幂次的增大而转化成特征向量。 ¾幂迭代的动机是通过乘以一个矩阵来把向量朝主特 征向量方向移动。
⎜⎜⎝
− a21 M
− an1
λ − a22 L − a2n ⎟
M − an2
O L
λ
M − ann
⎟ ⎟⎟⎠
= λn − (a11 + a22 + L + ann )λn−1 + (次数 ≤ n − 2的项)
称为A的特征多项式.
A的特征方程
ϕ (λ ) = det(λI − A) = 0
(1.1)
vk ≈ λ1kα1 x1
vk +1
≈
λ1k
α +1 1
x1
vk+1 ≈ λ1vk
又 vk+1 = Avk
( ) vk+1 j (vk ) j
≈
λ1 ( j
=1,
2,
...
,
n
)
Avk ≈ λ1vk
vk 为 λ1 的近似特征向量
即vk为矩阵A的对应特征值λ1 的一个近似特征向量.
这种由已知非零向量v0及矩阵A的乘幂Ak构造向
的收敛速度由比值
34
幂法的基本思想是: 任取非零的初始向量v0 , 由矩 阵A构造一向量序列{vk}
⎧v1 = Av0 , ⎪⎪⎪⎨v..2...=...A...v..1..=....A...2v0 , ⎪⎪vk+1 = Avk = Ak+1v0 , ⎪⎩.........................
(2.2)
⎜⎛
α −1 1
⎟⎞
D−1
=
⎜ ⎜
⎜⎜⎝
α −1 2
O
⎟ ⎟,
α
−1 n
⎟⎟⎠
并可使做某相些似圆变盘换半D−1径AD及=连⎜⎜⎛⎝ aαi通jαi j性⎟⎟⎞⎠n×发n.适生当变选化取. αi (i = 1,2,L, n)