跳转至

第 43 章 伪谱与非正规矩阵分析

前置:特征值 (Ch06) · 矩阵范数与扰动 (Ch15) · 矩阵函数 (Ch13)

本章脉络:非正规矩阵的危机(特征值的欺骗性) \(\to\) \(\epsilon\)-伪谱 (\(\epsilon\)-Pseudospectra) 的定义 \(\to\) 伪谱的等价刻画(预解式范数、奇异值判据、扰动集合) \(\to\) 矩阵非正规性的度量(Henrici 数) \(\to\) 伪谱在复平面上的形态 \(\to\) 核心现象:非正规系统的瞬态增长 (Transient Growth) \(\to\) Kreiss 矩阵定理 \(\to\) 应用:流体力学稳定性、数值算法收敛速度估计、激光谐振腔模式分析

延伸:伪谱理论是针对高度非正规算子的“广义谱理论”;它揭示了当矩阵偏离正常阵时,传统的特征值分析将失效,系统的动力学行为由伪谱这一更大的集合支配,是理解物理系统“伪稳定”现象的关键

对于正常矩阵,特征值完美决定了系统的稳定性。但对于高度非正规矩阵(Non-normal Matrices,\(AA^* \neq A^*A\)),特征值可能会极度误导。即使所有特征值都在左半平面,系统仍可能发生剧烈的瞬态增长。伪谱(Pseudospectra)通过研究预解式的范数,为这些“病态”算子提供了比传统谱理论更深刻的描述。本章将揭示这种隐藏在特征值背后的潜在不稳定区域。


43.1 \(\epsilon\)-伪谱的定义

定义 43.1 (\(\epsilon\)-伪谱)

对于 \(\epsilon > 0\),矩阵 \(A\)\(\epsilon\)-伪谱 \(\sigma_\epsilon(A)\) 是复平面上的集合,满足以下等价条件: 1. 扰动视角:存在 \(\|E\| < \epsilon\) 使得 \(z \in \sigma(A+E)\)。 2. 预解式视角:其预解式范数满足 \(\|(zI - A)^{-1}\| > 1/\epsilon\)。 3. 奇异值视角\(s_{\min}(zI - A) < \epsilon\)


43.2 非正规性与瞬态增长

定义 43.2 (非正规性度量)

矩阵 \(A\) 的非正规性可以用 Henrici 数 度量:\(\Delta(A) = \sqrt{\|A\|_F^2 - \|\Lambda\|_F^2}\)。 非正规性越强,伪谱区域相对于特征值的凸包扩张得越远。

定理 43.1 (Kreiss 矩阵定理)

系统 \(\|e^{At}\|\) 的瞬态增长峰值与伪谱向右半平面的伸入程度成正比。 这解释了为什么“理论上稳定”的流体流动在实际中会突然转变为湍流。


43.3 伪谱的几何形态

可视化:等高线图

伪谱通常通过绘制函数 \(f(z) = \log_{10} s_{\min}(zI - A)\) 的等高线来展现。 - 对于正常阵:等高线是以特征值为中心的完美圆。 - 对于非正规阵:等高线会严重扭曲并合并,形成巨大的“危险区域”。


练习题

1. [基础] 证明若 \(A\) 是正规矩阵,则其 \(\epsilon\)-伪谱就是特征值的 \(\epsilon\)-邻域。

参考答案

证明: 1. 对于正规矩阵, \(\|(zI - A)^{-1}\|_2 = 1 / \operatorname{dist}(z, \sigma(A))\)。 2. 根据定义,\(z \in \sigma_\epsilon(A) \iff \|(zI - A)^{-1}\| > 1/\epsilon\)。 3. 代入得:\(1 / \operatorname{dist}(z, \sigma(A)) > 1/\epsilon \iff \operatorname{dist}(z, \sigma(A)) < \epsilon\)结论:正常矩阵的伪谱没有“溢出”,稳定性完全由特征值确定。

2. [计算] 计算 \(A = \begin{pmatrix} 0 & 100 \\ 0 & 0 \end{pmatrix}\)\(\epsilon=1\) 伪谱范围。

参考答案

计算步骤: 1. 计算 \(s_{\min}(zI - A) = s_{\min} \begin{pmatrix} z & -100 \\ 0 & z \end{pmatrix}\)。 2. 特征值为 \(0, 0\)。 3. 当 \(z\) 很小时,该矩阵接近秩 1。最小奇异值近似为 \(|z|^2/100\)。 4. 令 \(|z|^2/100 < 1 \implies |z| < 10\)结论:尽管特征值只有 0,但 \(\epsilon=1\) 伪谱是一个半径约等于 10 的圆盘。这意味着微小的扰动就能让特征值移动到 10 那么远。

3. [性质] 证明:\(\sigma_\epsilon(A)\) 总是包含谱 \(\sigma(A)\)

参考答案

证明: 1. 当 \(z \in \sigma(A)\) 时, \(zI - A\) 是奇异的。 2. 此时预解式范数 \(\|(zI - A)^{-1}\|\) 为无穷大。 3. 对任何 \(\epsilon > 0\),都有 \(\infty > 1/\epsilon\)结论:特征值是伪谱集合的“源点”。

4. [瞬态增长] 为什么特征值全在左半平面不能保证 \(\|e^{At}\|\) 不会先增大再减小?

参考答案

代数解释: 1. \(\|e^{At}\|\) 的初始导数(数值域边界)可能为正。 2. 若 \(A\) 非正规,特征向量基是非正交的。 3. 分量之间可能存在相消干涉。当这种平衡被破坏时,系统能量会暂时激增。 4. 只有当时间足够长,特征值的指数衰减才会占主导。

5. [数值] 简述如何高效计算大矩阵的伪谱。

参考答案

由于直接计算整个平面的最小奇异值极其耗时,常用算法包括: 1. Lanczos 降维:将大矩阵投影到小空间的 Krylov 子空间。 2. 路径跟踪法:利用预测-校正器跟踪预解式范数的等高线。

6. [包含关系] 若 \(\epsilon_1 < \epsilon_2\),证明 \(\sigma_{\epsilon_1}(A) \subset \sigma_{\epsilon_2}(A)\)

参考答案

证明:\(z \in \sigma_{\epsilon_1}(A)\),则 \(\|(zI - A)^{-1}\| > 1/\epsilon_1\)。 由于 \(\epsilon_1 < \epsilon_2\),有 \(1/\epsilon_1 > 1/\epsilon_2\)。 故 \(\|(zI - A)^{-1}\| > 1/\epsilon_2\),满足 \(z \in \sigma_{\epsilon_2}(A)\)

7. [应用] 在数值格式收敛性分析中,伪谱有什么作用?

参考答案

作用: 对于某些迭代算子(如非对称预处理子),即使谱半径 \(\rho(B) < 1\),由于非正规性导致的强伪谱效应,初期的迭代残差可能会急剧放大,导致算法在实际中失效。伪谱分析能预测这种“初期发散”现象。

8. [酉等价] 证明:若 \(U\) 是酉矩阵,则 \(\sigma_\epsilon(U^* A U) = \sigma_\epsilon(A)\)

参考答案

证明: 1. \(\|(zI - U^*AU)^{-1}\| = \|(U^*(zI - A)U)^{-1}\| = \|U^*(zI - A)^{-1}U\|\)。 2. 由于酉变换保持算子范数,上式等于 \(\|(zI - A)^{-1}\|\)结论:伪谱在坐标轴旋转下是不变的。

9. [Henrici] 计算 \(A = \begin{pmatrix} 1 & 2 \\ 0 & 3 \end{pmatrix}\) 的非正规性度量 \(\Delta(A)\)

参考答案

计算: 1. \(\|A\|_F^2 = 1^2 + 2^2 + 0^2 + 3^2 = 14\)。 2. 特征值为 \(1, 3\)\(\|\Lambda\|_F^2 = 1^2 + 3^2 = 10\)。 3. \(\Delta(A) = \sqrt{14 - 10} = 2\)结论:非正规性来源于非对角元 2。

10. [物理应用] 为什么伪谱理论在研究流体转捩(Transition to Turbulence)中是突破性的?

参考答案

解释: 经典的线性稳定性理论预测层流在某些雷诺数下应该是特征值稳定的。但实验观测到转捩发生得更早。 伪谱理论证明了流体方程对应的线性化算子是高度非正规的。 伪谱在右半平面的巨大扩张预示了微小扰动会导致巨大的瞬态放大,这才是诱发非线性失稳和湍流的真正代数原因。

本章小结

伪谱理论是针对不稳定性本质的现代诊断书:

  1. 特征值的局限:它证明了对于高度耦合、非对称的系统,单一的谱点无法代表算子的全貌,必须考虑“近谱区域”的能量响应。
  2. 预解式的力量:通过预解式范数的等高线,伪谱将抽象的扰动理论具象化为复平面上的几何地图,确立了评估数值健壮性的新标尺。
  3. 瞬态的洞察:本章将静态的标准形分析扩展到动态的能量分析,揭示了非正规系统在“长远趋于稳定”之前可能发生的“初期灾难”。