第 38A 章 M-矩阵与 Z-矩阵¶

前置：非负矩阵与 Perron-Frobenius (Ch17) · 矩阵分析 (Ch14) · 正定矩阵 (Ch16)

本章脉络：Z-矩阵的定义（非对角元非正） $\to$ M-矩阵的多种定义方式 $\to$ 核心等价刻画（逆正性、主子式、正向量） $\to$ 矩阵分裂 (Matrix Splitting) 理论 $\to$ M-矩阵在迭代收敛中的判定作用 $\to$ 比较定理与范数界限 $\to$ 奇异 M-矩阵及其性质 $\to$ 应用：离散偏微分方程 (PDE) 的稳定性、经济学 Leontief 模型、生态系统平衡分析

延伸：M-矩阵是连接非负矩阵与正定矩阵的纽带；它是判定数值格式（如有限差分法）是否满足“最大值原理”的代数准则，也是保证大规模方程组迭代法绝对收敛的核心条件

在数值分析和经济学建模中，经常会出现一类非对角元素全为负、但整体性质极佳的矩阵。M-矩阵（M-matrices，因 Minkowski 而得名）正是这类结构的代数抽象。它们最显著的特征是具有非负的逆矩阵，这保证了物理系统在受到正向激励时必然产生正向响应。本章将探讨 M-矩阵的 10 余种等价判据及其在计算科学中的基石地位。

38A.1 Z-矩阵与 M-矩阵的定义¶

定义 38A.1 (Z-矩阵)

方阵 $A$ 称为 Z-矩阵，如果其所有非对角元素均为非正数，即 $a_{ij} \le 0$ 对所有 $i \neq j$ 成立。

定义 38A.2 (M-矩阵)

Z-矩阵 $A$ 称为 M-矩阵，如果它可以表示为： $$A = sI - B, \quad B \ge 0, \quad s \ge \rho(B)$$ 其中 $\rho(B)$ 是非负矩阵 $B$ 的谱半径。若 $s > \rho(B)$，则称 $A$ 为非奇异 M-矩阵。

38A.2 核心等价刻画¶

定理 38A.1 (非奇异 M-矩阵的判定)

对于 Z-矩阵 $A$，以下条件等价： 1. 逆正性：$A$ 可逆且 $A^{-1} \ge 0$（逐元素非负）。 2. 特征值：$A$ 的所有特征值的实部均为正。 3. 主子式：$A$ 的所有顺序主子式均大于 0。 4. 正向量：存在向量 $\mathbf{x} > 0$ 使得 $A\mathbf{x} > 0$。

38A.3 矩阵分裂与迭代¶

技术：收敛性判定

设 $A = M - N$。若 $M$ 是非奇异 M-矩阵且 $N \ge 0$，则该分裂是收敛的（即 $\rho(M^{-1}N) < 1$）。意义：这为 Jacobi 和 Gauss-Seidel 等迭代法的收敛性提供了最稳健的代数证明。

练习题¶

1. [判定] 判定 $A = \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix}$ 是否为 M-矩阵。

参考答案

步骤： 1. 检查是否为 Z-矩阵：非对角元为 -1，均 $\le 0$。是。 2. 计算主子式：$D_1 = 2 > 0$，$D_2 = 4 - 1 = 3 > 0$。 3. 由于所有顺序主子式为正且是 Z-矩阵。结论：是非奇异 M-矩阵。

2. [逆正性] 若 $A$ 是非奇异 M-矩阵，证明：对于 $Ax=b$，若 $b \ge 0$，则必有 $x \ge 0$。

参考答案

证明： 1. 解为 $x = A^{-1}b$。 2. 由 M-矩阵性质知，$A^{-1} \ge 0$（逆正性）。 3. 由于非负矩阵乘非负向量结果仍非负。结论：$x \ge 0$。这在物理上保证了“正输入产生正响应”。

3. [对角占优] 证明：对角元为正且严格对角占优的 Z-矩阵必为 M-矩阵。

参考答案

证明： 1. 令 $\mathbf{x} = (1, 1, \ldots, 1)^T$。 2. $(A\mathbf{x})_i = a_{ii} + \sum_{j \neq i} a_{ij} = a_{ii} - \sum_{j \neq i} |a_{ij}|$。 3. 由严格对角占优知，该值大于 0。 4. 存在正向量 $\mathbf{x} > 0$ 使得 $A\mathbf{x} > 0$。结论：满足正向量判据，故为 M-矩阵。

4. [特征值] M-矩阵的特征值可以位于虚轴上吗？

参考答案

结论： 不可以（针对非奇异情形）。理由：非奇异 M-矩阵的所有特征值实部均严格大于 0。这意味着特征值被限制在复平面的右半开平面内，从而保证了系统的渐近稳定性。

5. [经济学应用] 在 Leontief 模型 $(I-A)x = d$ 中，$I-A$ 为什么通常是 M-矩阵？

参考答案

解释： 1. $A$ 是消耗矩阵，元素非负。 2. 现实经济系统必须是“盈利”的，即 $\rho(A) < 1$。 3. 按照定义 $s=1 > \rho(A)$，$I-A$ 恰好符合非奇异 M-矩阵的形式。这一结构保证了系统能产生正的净产出来满足外部需求。

6. [比较定理] 若 $A, B$ 是 Z-矩阵且 $A \le B$（逐分量），若 $A$ 是 M-矩阵，证明 $B$ 也是。

参考答案

证明思路： 1. 考虑 $A\mathbf{x} > 0$ 对应的正向量 $\mathbf{x}$。 2. $B\mathbf{x} = A\mathbf{x} + (B-A)\mathbf{x}$。 3. 由于 $B-A \ge 0$ 且 $\mathbf{x} > 0$，故 $(B-A)\mathbf{x} \ge 0$。 4. 从而 $B\mathbf{x} \ge A\mathbf{x} > 0$。结论：$B$ 继承了正向量判据，也是 M-矩阵。

7. [性质] 证明：M-矩阵的对角线元素必须是正数。

参考答案

证明： 由主子式判据，$a_{ii}$ 是 1 阶顺序主子式，必须大于 0。从物理上看，这代表了系统在每个节点上的“自回归”强度必须足以抵消与其他节点的负向耦合。

8. [奇异性] 举出一个奇异 M-矩阵的例子。

参考答案

例子： $A = \begin{pmatrix} 1 & -1 \\ -1 & 1 \end{pmatrix}$。分析：是 Z-矩阵，且谱半径 $\rho(\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}) = 1$。此时 $s=1=\rho$，行列式为 0。

9. [迭代] 在解 $Ax=b$ 的 Jacobi 迭代中，$A$ 是 M-矩阵意味着什么？

参考答案

结论： 意味着 Jacobi 迭代矩阵 $B = D^{-1}(L+U)$ 是一个非负矩阵。根据 Perron-Frobenius 理论，其收敛性由 $\rho(B)$ 决定。对于 M-矩阵，这种收敛通常是单调的且具有解析保障。

10. [应用] 简述为什么在求解扩散方程时希望离散矩阵是 M-矩阵。

参考答案

理由： 扩散过程遵循最大值原理（浓度不会凭空产生极值）。如果离散后的矩阵不是 M-矩阵，数值解可能会在剧烈变化处产生“虚假震荡”或负浓度值，这违背了基本的物理定律。M-矩阵结构保证了数值格式的保真性。

本章小结¶

M-矩阵是数值稳定性与物理真实性的代数交汇点：

逆向的正性：M-矩阵最深刻的特性是“逆正性”，它确保了正的输入必然导致正的输出，是线性系统符合逻辑的根本保障。
收敛的定海神针：在处理超大规模方程组时，M-矩阵结构是保证各种分解和迭代算法不发散的终极防线。
结构的支配力：通过比较定理，M-矩阵为我们提供了一套估计算子范数和特征值范围的有力杠杆，将复杂的算子比较转化为简单的元素对比。