跳转至

第 32 章 数值域与数值半径

前置:内积空间 (Ch08) · 特征值 (Ch06) · 凸集基础 (Ch25)

本章脉络:数值域 (Numerical Range) 定义 \(\to\) Toeplitz-Hausdorff 凸性定理 \(\to\) 谱包含性质 \(\to\) 数值半径 (Numerical Radius) \(w(A)\) \(\to\) 数值半径不等式(与谱范数的关系) \(\to\) 2 阶矩阵的椭圆定理 \(\to\) 正常阵的数值域(凸包) \(\to\) 算子稳定性中的应用

延伸:数值域是特征值在复平面上的“连续扩张”;它在分析非正常算子的瞬态增长、克雷洛夫子空间方法的收敛性以及量子可观测量的取值范围中具有关键作用

如果特征值 \(\sigma(A)\) 是矩阵在复平面上的“离散指纹”,那么数值域 \(W(A)\) 就是它的“连续阴影”。数值域捕捉了矩阵作为二次型在单位球上的全部取值可能。对于正常矩阵,这个阴影只是特征值的凸包;但对于非正常矩阵,数值域展现出极其复杂的几何形态,揭示了算子背后的不稳定性。


32.1 数值域的定义与凸性

定义 32.1 (数值域 / 算子值域)

方阵 \(A \in M_n(\mathbb{C})\)数值域定义为单位球面上二次型的取值集合: $\(W(A) = \{ \mathbf{x}^* A \mathbf{x} : \mathbf{x} \in \mathbb{C}^n, \|\mathbf{x}\| = 1 \}\)$

定理 32.1 (Toeplitz-Hausdorff 凸性定理)

对于任何矩阵 \(A\),其数值域 \(W(A)\) 总是复平面上的一个凸集意义:尽管单位球面是弯曲的,但二次型的映射结果在复平面上却呈现出完美的凸性。


32.2 谱包含与正常阵

定理 32.2 (谱包含性质)

矩阵 \(A\) 的所有特征值都包含在其数值域中:\(\sigma(A) \subseteq W(A)\)。 此外,\(W(A)\) 还包含 \(A\) 的特征值的凸包 \(\operatorname{conv}(\sigma(A))\)

定理 32.3 (正常阵的数值域)

\(A\) 是正常矩阵 (\(AA^* = A^*A\)) \(\iff\) \(W(A) = \operatorname{conv}(\sigma(A))\)。 对于非正常矩阵,\(W(A)\) 通常严格大于特征值的凸包。


32.3 数值半径 \(w(A)\)

定义 32.2 (数值半径)

数值域中元素模的最大值称为数值半径: $\(w(A) = \sup \{ |z| : z \in W(A) \}\)$

定理 32.4 (数值半径不等式)

数值半径与谱范数 \(\|A\|_2\) 满足以下双边不等式: $\(\frac{1}{2} \|A\|_2 \le w(A) \le \|A\|_2\)$ 这说明 \(w(A)\) 与算子范数是等价的,但在研究幂收敛性时,\(w(A)\) 往往提供更细致的刻画。


练习题

1. [基础] 计算单位矩阵 \(I\) 的数值域。

参考答案

计算: 1. 根据定义,\(W(I) = \{ \mathbf{x}^* I \mathbf{x} : \|\mathbf{x}\|=1 \}\)。 2. \(\mathbf{x}^* I \mathbf{x} = \mathbf{x}^* \mathbf{x}\)。 3. 由于 \(\mathbf{x}\) 是单位向量,其内积 \(\mathbf{x}^* \mathbf{x} = 1\)结论\(W(I) = \{1\}\)。在复平面上,它只是一个孤立的点。

2. [对角阵] 求 \(A = \operatorname{diag}(1, i)\) 的数值域。

参考答案

分析: 1. 对角阵是正常矩阵。 2. 正常矩阵的数值域等于其特征值的凸包。 3. \(A\) 的特征值为 \(\{1, i\}\)结论\(W(A)\) 是复平面上连接点 1 和点 \(i\)闭线段

3. [凸性] 举出一个例子说明 \(\sigma(A)\) 本身不是凸的,但 \(W(A)\) 是凸的。

参考答案

例子: \(A = \operatorname{diag}(1, -1)\)。 1. 谱 \(\sigma(A) = \{1, -1\}\)。这两个点的集合显然不是凸集(不包含中间的 0)。 2. 数值域 \(W(A) = \operatorname{conv}\{1, -1\} = [-1, 1]\)。 3. 区间 \([-1, 1]\) 是一个凸集。 这展示了 Toeplitz-Hausdorff 定理如何通过“填充”特征值之间的间隙来实现凸性。

4. [数值半径] 求 \(A = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}\) 的数值域及其数值半径。

参考答案

应用 2 阶矩阵椭圆定理: 1. 这是一个秩为 1 的幂零阵。 2. 2 阶矩阵的数值域是以特征值为焦点的椭圆。 3. 特征值为 \(0, 0\)。椭圆退化为圆。 4. 半径为 \(\frac{1}{2} \sqrt{\operatorname{tr}(A^* A)} = 0.5\)结论\(W(A)\) 是以原点为中心、半径为 0.5 的闭圆盘。数值半径 \(w(A) = 0.5\)

5. [性质] 证明 \(W(A+cI) = W(A) + c\)

参考答案

证明: 1. \(\mathbf{x}^*(A+cI)\mathbf{x} = \mathbf{x}^*A\mathbf{x} + c(\mathbf{x}^*\mathbf{x})\)。 2. 由于 \(\|\mathbf{x}\|=1\)\(\mathbf{x}^*\mathbf{x} = 1\)。 3. \(= \mathbf{x}^*A\mathbf{x} + c\)结论:数值域随恒等变换发生平移。

6. [自伴] 证明:若 \(A\) 是 Hermite 阵,则 \(W(A)\) 是实轴上的区间 \([\lambda_{\min}, \lambda_{\max}]\)

参考答案

分析: 1. Hermite 阵的二次型 \(\mathbf{x}^*A\mathbf{x}\) 总是实数。 2. 因此 \(W(A)\) 必须落在实轴上。 3. 根据 Rayleigh 商的性质,该连续函数的最大值是 \(\lambda_{\max}\),最小值是 \(\lambda_{\min}\)。 4. 由于 \(W(A)\) 连通且凸,它必须覆盖整个区间。

7. [范数] 已知 \(\|A\|_2 = 10\),数值半径 \(w(A)\) 的最小可能值是多少?

参考答案

利用不等式: \(w(A) \ge \frac{1}{2} \|A\|_2\)。 代入得 \(w(A) \ge 5\)补充:当 \(A = \begin{pmatrix} 0 & 10 \\ 0 & 0 \end{pmatrix}\) 时达到该下界。

8. [迹] 数值域的质心与矩阵的迹有什么关系?

参考答案

结论:\(\frac{1}{n} \operatorname{tr}(A)\) 总是位于数值域 \(W(A)\) 的内部。 理由:迹是 \(\mathbf{e}_i^* A \mathbf{e}_i\) 的平均值。由于每个 \(\mathbf{e}_i^* A \mathbf{e}_i \in W(A)\),它们的凸组合(均值)也必在 \(W(A)\) 中。

9. [酉不变] 证明 \(W(U^* A U) = W(A)\) 对任何酉矩阵 \(U\) 成立。

参考答案

证明: 1. 设 \(y = U\mathbf{x}\)。由于 \(U\) 是酉变换,它将单位球面 \(\|\mathbf{x}\|=1\) 映射为单位球面 \(\|y\|=1\)。 2. \(\mathbf{x}^*(U^* A U)\mathbf{x} = (U\mathbf{x})^* A (U\mathbf{x}) = y^* A y\)。 3. 两个集合的取值完全一致。 结论:数值域是酉相似下的不变量。

10. [应用] 为什么数值域在非正常算子的稳定性分析中比特征值更可靠?

参考答案

稳定性深度分析: 1. 特征值仅决定长期(渐近)行为。 2. 如果 \(A\) 是高度非正常的,即使所有特征值都在左半平面(稳定),数值域 \(W(A)\) 仍可能伸入右半平面。 3. 若 \(W(A)\) 包含正数,则解的范数 \(\|e^{At}\|\) 在衰减前可能会经历剧烈的瞬态增长结论:数值域的大小提供了对系统误差和瞬态波动的更紧致的上限估计。

本章小结

数值域是矩阵谱论的几何拓广:

  1. 形态的凸性:Toeplitz-Hausdorff 定理揭示了线性算子作用下的一种深刻一致性,即无论算子如何复杂,其“投影”总是复平面上的凸区域。
  2. 正常性的分水岭:数值域与特征值凸包的重合程度是衡量矩阵“正常性”(即是否具有标准正交特征基)的直观几何标准。
  3. 解析的界限:数值半径确立了算子大小的新测度,为非正常系统的瞬态分析和迭代收敛速度提供了比谱半径更保守但也更稳健的参考。