当前位置:
文档之家› 矩阵理论与应用(张跃辉 上海交大研究生教材)第四答案
矩阵理论与应用(张跃辉 上海交大研究生教材)第四答案
第四章习题及参考解答
建议:1. 第 50 题往后属补充内容,不提供参考解答,不必布置。 2. 可不布置的题目:30 题的前两个(前两个矩阵的奇异值分解含无理数特征值);35 题 (2) 用手算非常麻烦;37 题的存在性需要矩阵函数 log ;46 题的收敛性; 3. 有误需要改正的题目有: (1) 将 13 题(3)中的“变”改为“伸缩”并在最后加入” 试求一个正方形使得其在该矩 阵下的像仍是正方形;” (2) 在 46 题中的
n ∑ i,j =1
|aij |2
且等号成立当且仅当 B 是对角矩阵当且仅当 A 是正规矩阵, 即得 (2). 10. 直接证明实对称矩阵与 (实) 正交矩阵可以酉对角化, 从而均为正规矩阵. 证明:由线性代数知实对称矩阵可以正交对角化故可酉对角化。 设 A 是正交矩阵,则存在酉矩阵 U 使得 U ∗ AU = T 是上三角矩阵, 但 A 也是酉矩阵, 从而 T 也是酉矩阵,于是 T 只能是对角矩阵。 11. 设 A 是 n 阶实矩阵, 证明 A 是正规矩阵 ⇐⇒ 存在正交矩阵 Q 使得 QT AQ = A1 ⊕ A2 ⊕ · · · ⊕ As , 其中每个 Ai 或者是 1 阶实矩阵, 或者是一个 Schur 型. 证明:由于每个 Schur 型均为正规矩阵,故充分性是显然的。必要性。由实矩阵的三角 A1 ∗ A2 化定理 (见第三章习题 5) 可知存在正交矩阵 Q 使得 QT AQ = = B ,其 . . . 0 Ak 中 Ai , 1 ≤ i ≤ s 是 1 阶实矩阵 (即 A 的一个实特征值), Ai , s+1 ≤ i ≤ n 是一个 Schur 型 (对应 A 的一对非实数特征值, 其模长平方恰为该型的行列式). 设 A 是实正规矩阵,λ1 , λ2 , · · · , λn k k s n ∑ ∑ ∑ ∑ tr(Ai AT |Ai | = |Ai |2 + |λi |2 = 为 A 的 n 个特征值. 则 tr(BB T ) = tr(AAT ) = i ).
1. 判断下列矩阵能否酉对角化, 如能, 则求一个酉矩阵 U , 使 U ∗ AU 为对角形: −1 i 0 0 i 1 i i 0 (1) A = −i 0 −i ; (2) A = −i 0 0 ; (3) A = i 1 0 . 0 i −1 1 0 0 0 i i i 1 i 解:(1) U = (2) U =
1≤i≤n−k 1≤i≤n−k 1≤i≤n−k 1≤i≤n−k
特别地, λmax = λn = max λmin = λ1 =
x=0,x∈Cn
x∗ Ax x∗ Ax, = max x∗ x=1 x∗ x x∗ Ax = min x∗ Ax. x∗ x=1 x∗ x
x=0,x∈Cn
min
38
证明:只证第一个等号。设 U 是酉矩阵且 U ∗ AU = D = diag (λ1 , λ2 , ..., λn ) 是实对角矩 阵,则 A = U DU ∗ 。若 x = 0, 则 x∗ Ax (U ∗ x)∗ D(U ∗ x) (U ∗ x)∗ D(U ∗ x) = = , x∗ x x∗ x (U ∗ x)∗ (U ∗ x) 记 U ∗ x = y , 则 x = 0 ⇐⇒ y = 0. 对给定的 w1 , · · · , wn−k ∈ Cn 有 max
x∗ Ax x∗ x
0=x⊥wi 1≤i≤n−k
= max ∗
0=y ⊥U wi 1≤i≤n−k
y ∗ Ay y∗ y
= max ∗
∑n
y y =1,y ⊥wi 1≤i≤n−k
2 i=1 λi |yi |
≥ max ∗
∑n
y y =1,y1 =y2 =···=yk−1 =0, y ⊥wi ,1≤i≤n−k
√ 6 2 √ 6 i √ 6 √ 3 1 0 −√ , U ∗ AU = diag (1, −1, −2); 3 1 i √ −√ 2 3 1 1 √ √ 2 2 √ √ i i −2 , U ∗ AU = diag (0, − 2, 2); 2 1 −1 2 2 (A∗ A = AA∗ ), 故不能酉对角化. √ 2
2 i=1 λi |yi |
= max
∑n
i=k
|yk |2 +···+|yn |2 =1,y ⊥wi 1≤i≤n−k
λi |yi |2 ≥ λk .
9. 设 A = (aij )n×n 是复矩阵, λ1 , λ2 , · · · , λn 为 A 的 n 个特征值. 证明 n n ∑ ∑ (1) (Schur 不 等式 ) |λi |2 ≤ |aij |2 ;
i=1 i=1 i=s+1 i=1
39
这迫使 B 是分块对角矩阵。 12. 证明: 如果 Hermite 阵或实对称矩阵 A 至少有 k 个特征值 (包括重数) 大于零,则 A 在某一个 k 维子空间上正定. 证明:设 Hermite 阵或实对称矩阵 A 至少有 k 个正特征值 λ1 , · · · , λk ,相应的线性无 ∗ Aα = α∗ (λ α ) = λ (α∗ α ) > 0,即 A 在 k - 维子空 关的特征向量为 α1 , · · · , αk 。于是 αi i i i i i i i 间 Span{α1 , ..., ak } 上正定. 13. (1) 证明: 平面上的可逆线性变换 σ 是正规变换 ⇐⇒ σ 将某个正方形伸缩为矩形 (因 此非正规的可逆线性变换不可能将任何正方形伸缩为矩形) 或者将所有正方形均变为正方形; ) ( 1 1 将哪些正方形变为了矩形? (2) 计算 2 阶实正规矩阵 −1 1 ) ( 1 2 是非正规矩阵, 说明它不能将任何正方形伸缩 为矩形; 试求一个正 (3) 证明矩阵 0 3 方形使得其在该矩阵下的像仍是正方形; (4) 试给出 3 阶实正规矩阵的几何意义. 证明:(1) 必要性。设可逆线性变换 σ 是正规变换,则或者 σ 有两个实特征值和两个正 交的实单位特征向量,因此由该二特征向量构成的正方形被 σ 变为矩形;或者 σ 有一对非 实的特征值,此时 σ 正交相似于一个 Schur 型,因此它是一个位似变换与一个正交变换的合 成,从而将每个正方形均变为正方形。 充分性。设 σ 是将某个正方形伸缩为矩形,于是 σ 将一对正交向量 α1 , β1 伸缩为另一对 正交向量 λ1 α1 , λ2 β1 . 由于 σ 可逆,λi = 0,因此 σ 有 2 个正交的单位特征向量 α, β , 故 σ 是 正规变换. 如果 σ 是将所有正方形伸均变为正方形,则 σ 将任意标准正交基 α, β 变为一对等 长的正交向量 σ (α), σ (β ). 故 σ (α, β ) = (σ (α), σ (β )) = (α, β )A, 其中矩阵 A 的两列等长且正 ) ( a −b , |A| = a2 + b2 = 0. 因此 σ 正交相 交 (因为 σ (α) 与 σ (β ) 等长且正交), 于是 A = b a 似于 Schur 型 A,故为正规变换。 (2) 由 (1) 的证明可知,该矩阵将所有正方形均变为正方形 (边长扩大为 √ 2 倍).
i=1 i,j =1 n ∑ i=1
(2) A 为正规矩阵 ⇐⇒
|λi |2 =
n ∑ i,j =1
|aij |2 .
证明:(1) 由 Schur 酉三角化定理可知 U ∗ AU = B 是上三角矩阵, 故 U ∗ AA∗ U = BB ∗ . ∑ 2 ∗ 从而 AA∗ 与 BB ∗ 有相同的迹. 注意 tr(AA∗ ) = n i,j =1 |aij | ,而 BB 的第 i 个对角元素 n ∑ 2 2 2 2 ∗ 2 |λi |2 . 故 为 |b2 i1 + bi2 + · · · + bii |, 因此 tr(BB ) ≥ |b11 + b22 + · · · + bnn | =
证明:(1) 设 U ∗ AU = D 是对角矩阵,则 U ∗ (A − xI )U = D − xI 也是对角矩阵; (2) (Ax)∗ (Ax) = x∗ A∗ Ax = x∗ AA∗ x = (A∗ x)∗ (A∗ x), 故向量 Ax 与 A∗ x 的长度平方相 同; (3) 设 U ∗ AU = D 为对角矩阵,则 U ∗ A∗ U = D∗ 也是对角矩阵。故由 A∗ U = D∗ U 知 U 的每一列也是 A∗ 的特征向量。 (4) 显然 (或由上题可得). 6. 设 A 是正规矩阵, 证明 (1) A 是 Hermite 矩阵 ⇐⇒ A 的特征值全为实数; (2) A 是酉阵 ⇐⇒ A 的特征值的模都是 1; (3) A 是幂等阵 ⇐⇒ A 的特征值只能是 0 与 1; (4) 若 A 的全部特征值为 λ1 , λ2 , ..., λn , 则 AA∗ 与 A∗ A 的全部特征值为 |λ1 |2 , |λ2 |2 , ..., |λn |2 . 此结论对非正规矩阵成立吗? 证明:(1) 见第一章习题 20. (2) 设 U 是酉矩阵且 U ∗ AU = D 是对角矩阵。由于酉矩阵的乘积仍是酉矩阵,故 A 是 酉矩阵当且仅当 D 是酉矩阵当且仅当 D 的对角元素的模均为 1 当且仅当 A 的特征值的模均 为 1. (3) 设 U 是酉矩阵且 U ∗ AU = D 是对角矩阵。故 A 是幂等矩阵当且仅当 D 是幂等矩阵 当且仅当 D 的对角元素均为 1 或 0 当且仅当 A 的特征值均为 1 或 0. (4) 设 U 是酉矩阵且 U ∗ AU = D = diag (λ1 , λ2 , ..., λn ) 是对角矩阵。则 U ∗ A∗ U = D∗ , 故 U ∗ AA∗ U = (U ∗ AU )(U ∗ A∗ U ) = DD∗ = diag (|λ2 |2 , ..., |λn |2 ) = U ∗ AA∗ U . ) ) ( ( 2 1 1 1 T 的特征值为 1, 3,而 ,则 AA = 此结论一般不成立. 例如设 A = 1 2 0 1 ) ( √ 1 1 T 的特征值为 (3 ± 5)/2. 设A A= 1 2 7. 设 A 是正规矩阵, 证明 (1) 若 A 是幂等阵, 则 A 是 Hermite 矩阵; (2) 若 A3 = A2 , 则 A2 = A; (3) 若 A 又是 Hermite 阵, 而且也是一个幂幺阵 (即 Ak = I ), 则 A 是对合阵 (即 A2 = I ). 证明:设 U 是酉矩阵且 U ∗ AU = D 是对角矩阵。 (1) 若 A2 = A, 由上题 (3) 知 A 的特征值只能是 0,1,特别 A 的特征值均为实数,因此 再由上题 (1) 可知 A 是 Hermite 矩阵. (2) 此时 D3 = D2 ,因此 D 的对角元素均为 1 或 0, 故 D2 = D,从而 A2 = A; (3) 此时 A 的特征值均为实数且只能是 ±1,因此 D2 = I ,从而 A2 = I . 8. 证明特征值的极大极小定理: 设 A 是 Hermite 矩阵, 其全部特征值为 λ1 ≤ λ2 ≤ · · · ≤ λn , 则 : x∗ Ax x∗ Ax λk = min min = . max max 0=x⊥wi 0=x⊥wi wi ∈Cn wi ∈Cn x∗ x x∗ x