跳转至

第 14 章 矩阵分析

前置:矩阵函数 (Ch13) · 矩阵范数 (Ch15) · 微积分级数理论

本章脉络:从标量分析到矩阵分析 \(\to\) 矩阵序列及其收敛性(按分量与按范数) \(\to\) 矩阵级数的收敛准则 \(\to\) 谱半径 \(\rho(A)\) 的核心作用 \(\to\) Gelfand 公式(谱半径与范数的桥梁) \(\to\) 矩阵幂序列 \(A^k\) 的收敛性分析 \(\to\) 诺依曼级数 (Neumann Series) 与逆矩阵近似 \(\to\) 矩阵微积分初步 \(\to\) 应用:线性方程组的迭代解法、动力系统的稳定性判据

延伸:矩阵分析是数值分析与连续动力系统的交叉学科;它将微积分的连续工具引入了离散的矩阵世界,是分析大规模系统长期演化稳定性的终极钥匙

矩阵分析研究的是矩阵作为变量时的解析性质。与初等代数关注精确的相等不同,矩阵分析更关注“接近”、“极限”和“趋势”。本章将确立判定矩阵演化是否收敛的标准,并揭示谱半径如何作为系统的“生命指标”决定了算子的长期行为。


14.1 矩阵序列与级数

定义 14.1 (矩阵序列收敛)

矩阵序列 \(\{A_k\}\) 收敛于 \(A\),若对于每一个分量都有 \(\lim_{k \to \infty} (A_k)_{ij} = a_{ij}\)等价性:这等价于对任何矩阵范数 \(\|\cdot\|\),都有 \(\lim_{k \to \infty} \|A_k - A\| = 0\)

定理 14.1 (Neumann 级数)

级数 \(\sum_{k=0}^\infty A^k\) 收敛的充要条件是谱半径 \(\rho(A) < 1\)。 若收敛,则其和为 \((I - A)^{-1}\)


14.2 谱半径 \(\rho(A)\) 与 Gelfand 公式

定义 14.2 (谱半径)

方阵 \(A\) 的所有特征值模的最大值: $\(\rho(A) = \max \{ |\lambda| : \lambda \in \sigma(A) \}\)$

定理 14.2 (Gelfand 公式)

对于任何矩阵范数 \(\|\cdot\|\),都有: $\(\rho(A) = \lim_{k \to \infty} \|A^k\|^{1/k}\)$ 这一深刻的结论说明,尽管单个范数的值可能很大,但矩阵幂的长期平均增长率完全由其特征值决定。


14.3 矩阵幂序列 \(A^k\) 的收敛性

定理 14.3 (幂收敛判据)

  1. \(\lim_{k \to \infty} A^k = O \iff \rho(A) < 1\)
  2. \(\{A^k\}\) 有界 \(\iff \rho(A) \le 1\) 且所有模为 1 的特征值的 Jordan 块阶数为 1。

练习题

1. [收敛判定] 设 \(A = \begin{pmatrix} 0.5 & 1 \\ 0 & 0.5 \end{pmatrix}\)。序列 \(A^k\) 是否收敛于零矩阵?

参考答案

分析步骤: 1. 提取特征值:由于是上三角阵,特征值直接读取为 \(\lambda_1 = 0.5, \lambda_2 = 0.5\)。 2. 计算谱半径:\(\rho(A) = \max(|0.5|) = 0.5\)。 3. 应用判据:由于 \(\rho(A) < 1\),矩阵幂序列必然收敛。 结论:是的,\(\lim_{k \to \infty} A^k = O\)

2. [级数计算] 给定 \(A = \begin{pmatrix} 0.1 & 0 \\ 0 & 0.2 \end{pmatrix}\)。计算级数 \(\sum_{k=0}^\infty A^k\)

参考答案

计算过程: 1. 检查收敛性:\(\rho(A) = 0.2 < 1\)。收敛。 2. 利用 Neumann 级数公式:\(S = (I - A)^{-1}\)。 3. \(I - A = \begin{pmatrix} 0.9 & 0 \\ 0 & 0.8 \end{pmatrix}\)。 4. 求逆:\(S = \begin{pmatrix} 1/0.9 & 0 \\ 0 & 1/0.8 \end{pmatrix} = \begin{pmatrix} 1.111 & 0 \\ 0 & 1.25 \end{pmatrix}\)

3. [谱半径] 举出一个矩阵 \(A\),使得对算子 2-范数有 \(\|A\| > 1\)\(\rho(A) < 1\)

参考答案

典型反例: \(A = \begin{pmatrix} 0 & 10 \\ 0 & 0 \end{pmatrix}\)。 1. 特征值为 \(0, 0\),故 \(\rho(A) = 0\)。 2. 2-范数(最大奇异值):\(A^* A = \begin{pmatrix} 0 & 0 \\ 0 & 100 \end{pmatrix}\),故 \(\|A\|_2 = 10\)启示:谱半径仅反映长期行为,范数则反映单步行为。这个矩阵在第一步会扩张,但从第二步起就归零了。

4. [Gelfand] 若对某种范数有 \(\|A\| = 0.9\),证明对所有 \(k \ge 1\),都有 \(\|A^k\|^{1/k} \le 0.9\)

参考答案

证明: 1. 利用范数的次可乘性:\(\|A^k\| \le \|A\|^k\)。 2. 两边同时取 \(1/k\) 次方:\(\|A^k\|^{1/k} \le (\|A\|^k)^{1/k} = \|A\|\)。 3. 代入已知条件:\(\|A^k\|^{1/k} \le 0.9\)。 由 Gelfand 公式可知,谱半径 \(\rho(A)\) 是这一序列的极限,且必然满足 \(\rho(A) \le \|A\|\)

5. [微积分初步] 计算矩阵 \(A(t) = \begin{pmatrix} e^t & \sin t \\ 0 & 1 \end{pmatrix}\) 的导数 \(A'(t)\)

参考答案

定义应用: 矩阵导数定义为分量导数的集合。 \(A'(t) = \begin{pmatrix} \frac{d}{dt} e^t & \frac{d}{dt} \sin t \\ \frac{d}{dt} 0 & \frac{d}{dt} 1 \end{pmatrix} = \begin{pmatrix} e^t & \cos t \\ 0 & 0 \end{pmatrix}\)

6. [积分] 计算 \(\int_0^1 \begin{pmatrix} x & 1 \\ 0 & 3x^2 \end{pmatrix} dx\)

参考答案

计算: 分量积分。 \(\begin{pmatrix} \int_0^1 x dx & \int_0^1 1 dx \\ 0 & \int_0^1 3x^2 dx \end{pmatrix} = \begin{pmatrix} 1/2 & 1 \\ 0 & 1 \end{pmatrix}\)

7. [逆矩阵导数] 利用 \(A(t)A^{-1}(t) = I\) 证明:\((A^{-1})' = -A^{-1} A' A^{-1}\)

参考答案

证明: 1. 对 \(A(t)A^{-1}(t) = I\) 两边关于 \(t\) 求导(利用矩阵乘积求导法则)。 2. \(A'(t)A^{-1}(t) + A(t)(A^{-1}(t))' = O\)。 3. 移项:\(A(t)(A^{-1}(t))' = -A'(t)A^{-1}(t)\)。 4. 左乘 \(A^{-1}(t)\)\((A^{-1})' = -A^{-1} A' A^{-1}\)。 这展示了分析学法则在非交换代数中的优雅平衡。

8. [有界性] 若 \(\rho(A) = 1\),为什么 \(A^k\) 序列不一定有界?举例说明。

参考答案

理由:谱半径仅保证了特征值的大小,但如果存在属于该特征值的 Jordan 块(非平凡链),幂运算会产生多项式级别的增长。 例子\(A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}\)。特征值为 1,\(\rho(A)=1\)。 但 \(A^k = \begin{pmatrix} 1 & k \\ 0 & 1 \end{pmatrix}\)。随着 \(k \to \infty\),分量 \(k\) 趋于无穷大。

9. [迹导数] 证明 \(\frac{d}{dt} \operatorname{tr}(A(t)) = \operatorname{tr}(A'(t))\)

参考答案

证明: 迹是分量的线性求和。求导运算也是线性的。 \(\frac{d}{dt} \sum A_{ii}(t) = \sum \frac{d}{dt} A_{ii}(t) = \operatorname{tr}(A'(t))\)。 由于求和与求导是有限项且可交换的,结论成立。

10. [应用] 在线性迭代法 \(x_{k+1} = Bx_k + f\) 中,为何需要 \(\rho(B) < 1\)

参考答案

稳定性分析: 1. 定义误差 \(e_k = x_k - x^*\)(其中 \(x^*\) 是精确解)。 2. 代入迭代式:\(e_{k+1} = B e_k = B^2 e_{k-1} = \cdots = B^k e_0\)。 3. 为了保证对任何初始误差 \(e_0\),误差都能消失(即 \(\lim e_k = 0\)),必须有 \(\lim B^k = O\)结论:根据矩阵分析判据,这等价于 \(\rho(B) < 1\)。这确立了谱半径在所有数值迭代法中的“生死线”地位。

本章小结

矩阵分析为静态的代数赋予了时间的维度:

  1. 收敛准则:谱半径是不变演化的终极裁判,它决定了离散动力系统是趋于稳定平衡还是走向指数爆炸。
  2. 分析工具:矩阵微积分与级数为处理非线性逼近和灵敏度分析提供了符号引擎,使得我们能对复杂的矩阵模型进行动态分析。
  3. 全局视角:Gelfand 公式揭示了局部范数与全局谱结构之间的渐近一致性,证明了算子本质由其最深层的特征结构定义。