跳转至

第 38A 章 M-矩阵与 Z-矩阵

前置:非负矩阵与 Perron-Frobenius (Ch17) · 矩阵分析 (Ch14) · 正定矩阵 (Ch16)

本章脉络:Z-矩阵的定义(非对角元非正) \(\to\) M-矩阵的多种定义方式 \(\to\) 核心等价刻画(逆正性、主子式、正向量) \(\to\) 矩阵分裂 (Matrix Splitting) 理论 \(\to\) M-矩阵在迭代收敛中的判定作用 \(\to\) 比较定理与范数界限 \(\to\) 奇异 M-矩阵及其性质 \(\to\) 应用:离散偏微分方程 (PDE) 的稳定性、经济学 Leontief 模型、生态系统平衡分析

延伸:M-矩阵是连接非负矩阵与正定矩阵的纽带;它是判定数值格式(如有限差分法)是否满足“最大值原理”的代数准则,也是保证大规模方程组迭代法绝对收敛的核心条件

在数值分析和经济学建模中,经常会出现一类非对角元素全为负、但整体性质极佳的矩阵。M-矩阵(M-matrices,因 Minkowski 而得名)正是这类结构的代数抽象。它们最显著的特征是具有非负的逆矩阵,这保证了物理系统在受到正向激励时必然产生正向响应。本章将探讨 M-矩阵的 10 余种等价判据及其在计算科学中的基石地位。


38A.1 Z-矩阵与 M-矩阵的定义

定义 38A.1 (Z-矩阵)

方阵 \(A\) 称为 Z-矩阵,如果其所有非对角元素均为非正数,即 \(a_{ij} \le 0\) 对所有 \(i \neq j\) 成立。

定义 38A.2 (M-矩阵)

Z-矩阵 \(A\) 称为 M-矩阵,如果它可以表示为: $\(A = sI - B, \quad B \ge 0, \quad s \ge \rho(B)\)$ 其中 \(\rho(B)\) 是非负矩阵 \(B\) 的谱半径。若 \(s > \rho(B)\),则称 \(A\)非奇异 M-矩阵


38A.2 核心等价刻画

定理 38A.1 (非奇异 M-矩阵的判定)

对于 Z-矩阵 \(A\),以下条件等价: 1. 逆正性\(A\) 可逆且 \(A^{-1} \ge 0\)(逐元素非负)。 2. 特征值\(A\) 的所有特征值的实部均为正。 3. 主子式\(A\) 的所有顺序主子式均大于 0。 4. 正向量:存在向量 \(\mathbf{x} > 0\) 使得 \(A\mathbf{x} > 0\)


38A.3 矩阵分裂与迭代

技术:收敛性判定

\(A = M - N\)。若 \(M\) 是非奇异 M-矩阵且 \(N \ge 0\),则该分裂是收敛的(即 \(\rho(M^{-1}N) < 1\))。 意义:这为 Jacobi 和 Gauss-Seidel 等迭代法的收敛性提供了最稳健的代数证明。


练习题

1. [判定] 判定 \(A = \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix}\) 是否为 M-矩阵。

参考答案

步骤: 1. 检查是否为 Z-矩阵:非对角元为 -1,均 \(\le 0\)。是。 2. 计算主子式:\(D_1 = 2 > 0\)\(D_2 = 4 - 1 = 3 > 0\)。 3. 由于所有顺序主子式为正且是 Z-矩阵。 结论:是非奇异 M-矩阵。

2. [逆正性] 若 \(A\) 是非奇异 M-矩阵,证明:对于 \(Ax=b\),若 \(b \ge 0\),则必有 \(x \ge 0\)

参考答案

证明: 1. 解为 \(x = A^{-1}b\)。 2. 由 M-矩阵性质知,\(A^{-1} \ge 0\)(逆正性)。 3. 由于非负矩阵乘非负向量结果仍非负。 结论\(x \ge 0\)。这在物理上保证了“正输入产生正响应”。

3. [对角占优] 证明:对角元为正且严格对角占优的 Z-矩阵必为 M-矩阵。

参考答案

证明: 1. 令 \(\mathbf{x} = (1, 1, \ldots, 1)^T\)。 2. \((A\mathbf{x})_i = a_{ii} + \sum_{j \neq i} a_{ij} = a_{ii} - \sum_{j \neq i} |a_{ij}|\)。 3. 由严格对角占优知,该值大于 0。 4. 存在正向量 \(\mathbf{x} > 0\) 使得 \(A\mathbf{x} > 0\)结论:满足正向量判据,故为 M-矩阵。

4. [特征值] M-矩阵的特征值可以位于虚轴上吗?

参考答案

结论: 不可以(针对非奇异情形)。 理由:非奇异 M-矩阵的所有特征值实部均严格大于 0。这意味着特征值被限制在复平面的右半开平面内,从而保证了系统的渐近稳定性。

5. [经济学应用] 在 Leontief 模型 \((I-A)x = d\) 中,\(I-A\) 为什么通常是 M-矩阵?

参考答案

解释: 1. \(A\) 是消耗矩阵,元素非负。 2. 现实经济系统必须是“盈利”的,即 \(\rho(A) < 1\)。 3. 按照定义 \(s=1 > \rho(A)\)\(I-A\) 恰好符合非奇异 M-矩阵的形式。 这一结构保证了系统能产生正的净产出来满足外部需求。

6. [比较定理] 若 \(A, B\) 是 Z-矩阵且 \(A \le B\)(逐分量),若 \(A\) 是 M-矩阵,证明 \(B\) 也是。

参考答案

证明思路: 1. 考虑 \(A\mathbf{x} > 0\) 对应的正向量 \(\mathbf{x}\)。 2. \(B\mathbf{x} = A\mathbf{x} + (B-A)\mathbf{x}\)。 3. 由于 \(B-A \ge 0\)\(\mathbf{x} > 0\),故 \((B-A)\mathbf{x} \ge 0\)。 4. 从而 \(B\mathbf{x} \ge A\mathbf{x} > 0\)结论\(B\) 继承了正向量判据,也是 M-矩阵。

7. [性质] 证明:M-矩阵的对角线元素必须是正数。

参考答案

证明: 由主子式判据,\(a_{ii}\) 是 1 阶顺序主子式,必须大于 0。 从物理上看,这代表了系统在每个节点上的“自回归”强度必须足以抵消与其他节点的负向耦合。

8. [奇异性] 举出一个奇异 M-矩阵的例子。

参考答案

例子: \(A = \begin{pmatrix} 1 & -1 \\ -1 & 1 \end{pmatrix}\)分析:是 Z-矩阵,且谱半径 \(\rho(\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}) = 1\)。此时 \(s=1=\rho\),行列式为 0。

9. [迭代] 在解 \(Ax=b\) 的 Jacobi 迭代中,\(A\) 是 M-矩阵意味着什么?

参考答案

结论: 意味着 Jacobi 迭代矩阵 \(B = D^{-1}(L+U)\) 是一个非负矩阵。 根据 Perron-Frobenius 理论,其收敛性由 \(\rho(B)\) 决定。对于 M-矩阵,这种收敛通常是单调的且具有解析保障。

10. [应用] 简述为什么在求解扩散方程时希望离散矩阵是 M-矩阵。

参考答案

理由: 扩散过程遵循最大值原理(浓度不会凭空产生极值)。如果离散后的矩阵不是 M-矩阵,数值解可能会在剧烈变化处产生“虚假震荡”或负浓度值,这违背了基本的物理定律。M-矩阵结构保证了数值格式的保真性

本章小结

M-矩阵是数值稳定性与物理真实性的代数交汇点:

  1. 逆向的正性:M-矩阵最深刻的特性是“逆正性”,它确保了正的输入必然导致正的输出,是线性系统符合逻辑的根本保障。
  2. 收敛的定海神针:在处理超大规模方程组时,M-矩阵结构是保证各种分解和迭代算法不发散的终极防线。
  3. 结构的支配力:通过比较定理,M-矩阵为我们提供了一套估计算子范数和特征值范围的有力杠杆,将复杂的算子比较转化为简单的元素对比。