当前位置:文档之家› 第八章 特征值问题

第八章 特征值问题


n
| x p | ¹ 0 ,因此
a p k xk
k 1, k p
k 1, k p

n
| a p k | | xk |
| xp |
从而

n
| a p k | | x p | Rp
| app | Rp
例 5
矩阵
骣 5 0.8 20 琪 A = 琪 10 1 4 琪 琪 琪 2 10i 1 桫
工程计算中,求解特征值问题 的特征对 ( , x ) 时,由于数据往往带有误差, 因此我们计算出的特征对 ( , x ) ,实际上是 扰动后的特征值问题
Ax x
xx A
的解。这里 A A E, E ( i j )
我们希望知道矩阵元素的变化对特征对的影响。 | 或j | ||的某个上界, i E || 由于我们一般只知道 因此有必要研究如何利用这样的上界,尽可能 x 准确地估计 与 、 与 x之间的差距,从 而可确定特征值问题的稳定性。 由于矩阵的特征多项式的系数是矩阵元素的连 续函数,而多项式的根都是其系数的连续函数, 因此矩阵的特征值作为特征多项式的零点都连 续地依赖于矩阵的元素。因此矩阵元素的连续 变化时,必有对应特征值的连续变化。
骣 5 0.4 20 琪 B = D- 1 AD = 琪 10 0.5 4 琪 琪 琪 4 10i 2 桫
三个行Gerschgorin圆分别收缩为:
G1¢( A) = { z ? C | z 20 | G2¢( A) = { z ? C | z 10 | G3¢( A) = { z ? C | z 10i |
i , j 1 i j
n
三、特征值的界
首先,根据矩阵 A 的Cartesian分解,有
A = H1 + iH2 ? B C 1 这里H1 = 1 ( A + AH ), H2 = 2i ( A- AH )都 2
是Hermite矩阵。 如果 C = O ,则 A 是Hermite矩阵,特征值 全为实数。当 C 的元素在0附近变化时, 的 A 特征值出现复数,因此矩阵 C 可用于确定矩 阵 A 的特征值的虚部变化范围。
=

i= 1 n
n
λi + λi 2
i
2
+
r s
t r s + ts r
2
= ³
邋| Re( λ ) | + å | Re( λ ) |
2 i= 1 n 2 i i= 1
| tr s | 2 2
2
r< s
在上述证明中,当且仅当 A 是正规矩阵时, 上三角阵 T 为对角矩阵,即
tr s = 0 ( r < s)
按推论11所得特征值的变化范围为带型区域:
{z | z| # 60}
z I{ |Re( )| z
60,|Im( )| 30} z
这个结果显然比相应的Gerschgorin区域差。
§2、多项式特征值问题
多项式特征值问题在Matlab中可分别利用 Matlab函数eig、eigs、Polyeig等来解决。所涉 及的算法主要还是变换类算法,核心思想就是 通过各类变换尤其是相似变换将高阶特征值问 题转化为低阶特征值问题,例如QEP可以线性 化为GEP再转化为SEP来求解。因此这些函数 比较适合于稠密、中小型的矩阵。
5.4} 4.5} 6}
Gerschgorin定理与对角占优矩阵有密切关系。
定义7 对方阵 A = (ai j )
C n´ n ,如果
| ai i | Ri , i 1, 2,, n | ai i | Ri , i 1, 2,, n
则称矩阵 A 为按行对角占优矩阵。如果
则称矩阵 A 为按行严格对角占优矩阵。
下述定理是特征值的这种连续性的定量分析。 定理1 (Ostrowski)设矩阵 A = (ai j ), B = (bi j ) 的特征值分别为 λi , μi ( i = 1, 2, L , n) 。令
δ = ( n + 2) 鬃 [max(| ai j |,| bi j |)]1i, j 1/ n
Ri
j 1, j i

| ai j |
类似地,可定义矩阵 A 的列盖尔圆。
定理4 (Gerschgorin)对方阵 A = (ai j )
C
n´ n
(1)矩阵 A 的特征值都位于其行盖尔区域内;
(2)若矩阵 A 有 m 个盖尔圆构成的并集 G 是 连通区域,并且与其余 n m 个盖尔圆均不相 交,则 G 中恰好有 A 的 m 个特征值。
的三个行Gerschgorin圆分别是:
G1 ( A) = {z ? C | z 20 | G2 ( A) = {z ? C | z 10 | G3 ( A) = {z ? C | z 10i |
5.8} 5} 3}
因为相似变换不改变特征值,为了得到特征值 的更加准确的估计,Gerschgorin发现可以将矩 阵 A 变换为其相似矩阵 B = D- 1 AD ,以减少 Gerschgorin圆的半径,达到隔离Gerschgorin 圆的目的。为计算方便,常常取 D为对角矩阵
的某些小邻域内。 构造 A 的扰动矩阵 A( ε ) ?
定义3 对方阵 A = (ai j )
C n´ n ,称
Gi ( A) { z C | z ai i | Ri }, i 1, , n
为矩阵 A 的行盖尔(Gerschgorin)圆。称并 n 集 Gi ( A) 为矩阵 A 的行盖尔(Gerschgorin) i 1 区域。这里 n
第八章
特征值问题
特征值问题是线性代数的研究重点,在理论和应 用上都非常重要。 理论上 ,矩阵的特征值就是线性算子的谱。因此 可以从泛函分析里找到理论的支撑和生长点。 应用上,常微分方程(ODE)和偏微分方程(PDE)中 许多问题都可以转化为矩阵特征值问题。 矩阵特征值问题的算法也是高性能计算机的主要 计算任务之一。可大致分为求解稠密、中小型矩 阵全部特征值的变换类方法和求解稀疏、大型矩 阵部分特征值的投影类方法。
定理8 (Levy--Desplanques) 严格对角占优矩阵是可逆矩阵。
证明:令 D diag(a11 ,, ann ) ,则矩阵
BID A
的元素
1
i j 0, bi j ai j / ai i , i j 1 因此 || B || 1 ,所以矩阵 I B D A 可逆,即矩阵 A 可逆。
定理10(Schur)设 A 的特征值为 λ1 , L , λn ,则
(1) | λ
1
| + L + | λn |
2
2
|| A ||
2 F
(2) | Re( λ
) |2 + L + | Re( λn ) |2 1 ) |2 + L + | Im( λn ) |2 1
|| B ||2 F || C ||2 F
一、从 矩阵的视角看特征值问题
因此等号都成立。
推论11(Hirsch)对 A 的任意特征值 λ ,有
(1) | λ |
W n max | ai j |
1#i , j n
n (2) | Re( λ ) | W max | ai j + a j i | 2 1#i , j n n (3) | Im( λ ) | W max | ai j + a j i | 2 1#i , j n
根据定理8,严格对角占优矩阵 A 没有零特 征值,而
| 0 ai i | | ai i | Ri , i 1, 2,, n
这说明矩阵 A 的特征值 可能满足
| ai i | Ri , i 1, 2,, n
由此,我们可以将Gerschgorin定理看成定理8 的“推论” 。
骣 0 1 0 琪 A( ε ) = 琪 1 + ε 1 0 琪 琪 琪 0 1+ ε ε 桫 的特征值为 1 + ε、+ ε、 ,特征向量为 (0,1,0)T 1 1 和 (1,1 / ε, - 1)T。而 A(0) 的特征值为 1、、, 11 特征向量为 (0,1,0)T 和 (1,0,0)T。矩阵 A( ε ) 的 特征向量在 ε = 0 处不连续。
(1)的证明:
| λ| ?
2
å
n
| λi |
2
|| A ||
2 F
=
2
i= 1

n
n
| ai j |
2
W n ( max | ai j |)
2 1#i , j n
i= 1 j = 1
因此
| λ| £
|| A || F W n max | ai j |
1#i , j n
例 12
矩阵
骣 5 0.8 20 琪 A = 琪 10 1 4 琪 琪 琪 2 10i 1 桫
§1、特征值的估计
由于工程计算中求矩阵尤其是高阶矩阵的 精确特征值通常比较困难,而许多情况下我们 只需要知道特征值在什么范围内变化或者落在 什么区域内,例如判断方阵的幂级数是否收敛 只要看方阵的特征值的模或谱半径是否小于1, 因此特征值的估计就显得尤其必要,这方面的 理论在特征值问题中相当经典。
一、从特征值问题的稳定性说起
例 2
矩阵
二、盖尔(Gerschgorin)定理
把矩阵 A 分裂成
A = diag(a11 , L , ann ) + B ? D B
D εB ,显然 A(0) = D, A(1) = A 我们有理由猜测,如果 ε 足够小,A( ε ) 的特征 L 值将位于 A( 0 ) 的特征值(即元素 a11、 、ann )
相关主题