第 38A 章 M-矩阵与 Z-矩阵¶
前置:非负矩阵与 Perron-Frobenius (Ch17) · 矩阵分析 (Ch14) · 正定矩阵 (Ch16)
本章脉络:Z-矩阵的定义(非对角元非正) \(\to\) M-矩阵的多种定义方式 \(\to\) 核心等价刻画(逆正性、主子式、正向量) \(\to\) 矩阵分裂 (Matrix Splitting) 理论 \(\to\) M-矩阵在迭代收敛中的判定作用 \(\to\) 比较定理与范数界限 \(\to\) 奇异 M-矩阵及其性质 \(\to\) 应用:离散偏微分方程 (PDE) 的稳定性、经济学 Leontief 模型、生态系统平衡分析
延伸:M-矩阵是连接非负矩阵与正定矩阵的纽带;它是判定数值格式(如有限差分法)是否满足“最大值原理”的代数准则,也是保证大规模方程组迭代法绝对收敛的核心条件
在数值分析和经济学建模中,经常会出现一类非对角元素全为负、但整体性质极佳的矩阵。M-矩阵(M-matrices,因 Minkowski 而得名)正是这类结构的代数抽象。它们最显著的特征是具有非负的逆矩阵,这保证了物理系统在受到正向激励时必然产生正向响应。本章将探讨 M-矩阵的 10 余种等价判据及其在计算科学中的基石地位。
38A.1 Z-矩阵与 M-矩阵的定义¶
定义 38A.1 (Z-矩阵)
方阵 \(A\) 称为 Z-矩阵,如果其所有非对角元素均为非正数,即 \(a_{ij} \le 0\) 对所有 \(i \neq j\) 成立。
定义 38A.2 (M-矩阵)
Z-矩阵 \(A\) 称为 M-矩阵,如果它可以表示为: $\(A = sI - B, \quad B \ge 0, \quad s \ge \rho(B)\)$ 其中 \(\rho(B)\) 是非负矩阵 \(B\) 的谱半径。若 \(s > \rho(B)\),则称 \(A\) 为非奇异 M-矩阵。
38A.2 核心等价刻画¶
定理 38A.1 (非奇异 M-矩阵的判定)
对于 Z-矩阵 \(A\),以下条件等价: 1. 逆正性:\(A\) 可逆且 \(A^{-1} \ge 0\)(逐元素非负)。 2. 特征值:\(A\) 的所有特征值的实部均为正。 3. 主子式:\(A\) 的所有顺序主子式均大于 0。 4. 正向量:存在向量 \(\mathbf{x} > 0\) 使得 \(A\mathbf{x} > 0\)。
38A.3 矩阵分裂与迭代¶
技术:收敛性判定
设 \(A = M - N\)。若 \(M\) 是非奇异 M-矩阵且 \(N \ge 0\),则该分裂是收敛的(即 \(\rho(M^{-1}N) < 1\))。 意义:这为 Jacobi 和 Gauss-Seidel 等迭代法的收敛性提供了最稳健的代数证明。
练习题¶
1. [判定] 判定 \(A = \begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix}\) 是否为 M-矩阵。
参考答案
步骤: 1. 检查是否为 Z-矩阵:非对角元为 -1,均 \(\le 0\)。是。 2. 计算主子式:\(D_1 = 2 > 0\),\(D_2 = 4 - 1 = 3 > 0\)。 3. 由于所有顺序主子式为正且是 Z-矩阵。 结论:是非奇异 M-矩阵。
2. [逆正性] 若 \(A\) 是非奇异 M-矩阵,证明:对于 \(Ax=b\),若 \(b \ge 0\),则必有 \(x \ge 0\)。
参考答案
证明: 1. 解为 \(x = A^{-1}b\)。 2. 由 M-矩阵性质知,\(A^{-1} \ge 0\)(逆正性)。 3. 由于非负矩阵乘非负向量结果仍非负。 结论:\(x \ge 0\)。这在物理上保证了“正输入产生正响应”。
3. [对角占优] 证明:对角元为正且严格对角占优的 Z-矩阵必为 M-矩阵。
参考答案
证明: 1. 令 \(\mathbf{x} = (1, 1, \ldots, 1)^T\)。 2. \((A\mathbf{x})_i = a_{ii} + \sum_{j \neq i} a_{ij} = a_{ii} - \sum_{j \neq i} |a_{ij}|\)。 3. 由严格对角占优知,该值大于 0。 4. 存在正向量 \(\mathbf{x} > 0\) 使得 \(A\mathbf{x} > 0\)。 结论:满足正向量判据,故为 M-矩阵。
4. [特征值] M-矩阵的特征值可以位于虚轴上吗?
参考答案
结论: 不可以(针对非奇异情形)。 理由:非奇异 M-矩阵的所有特征值实部均严格大于 0。这意味着特征值被限制在复平面的右半开平面内,从而保证了系统的渐近稳定性。
5. [经济学应用] 在 Leontief 模型 \((I-A)x = d\) 中,\(I-A\) 为什么通常是 M-矩阵?
参考答案
解释: 1. \(A\) 是消耗矩阵,元素非负。 2. 现实经济系统必须是“盈利”的,即 \(\rho(A) < 1\)。 3. 按照定义 \(s=1 > \rho(A)\),\(I-A\) 恰好符合非奇异 M-矩阵的形式。 这一结构保证了系统能产生正的净产出来满足外部需求。
6. [比较定理] 若 \(A, B\) 是 Z-矩阵且 \(A \le B\)(逐分量),若 \(A\) 是 M-矩阵,证明 \(B\) 也是。
参考答案
证明思路: 1. 考虑 \(A\mathbf{x} > 0\) 对应的正向量 \(\mathbf{x}\)。 2. \(B\mathbf{x} = A\mathbf{x} + (B-A)\mathbf{x}\)。 3. 由于 \(B-A \ge 0\) 且 \(\mathbf{x} > 0\),故 \((B-A)\mathbf{x} \ge 0\)。 4. 从而 \(B\mathbf{x} \ge A\mathbf{x} > 0\)。 结论:\(B\) 继承了正向量判据,也是 M-矩阵。
7. [性质] 证明:M-矩阵的对角线元素必须是正数。
参考答案
证明: 由主子式判据,\(a_{ii}\) 是 1 阶顺序主子式,必须大于 0。 从物理上看,这代表了系统在每个节点上的“自回归”强度必须足以抵消与其他节点的负向耦合。
8. [奇异性] 举出一个奇异 M-矩阵的例子。
参考答案
例子: \(A = \begin{pmatrix} 1 & -1 \\ -1 & 1 \end{pmatrix}\)。 分析:是 Z-矩阵,且谱半径 \(\rho(\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}) = 1\)。此时 \(s=1=\rho\),行列式为 0。
9. [迭代] 在解 \(Ax=b\) 的 Jacobi 迭代中,\(A\) 是 M-矩阵意味着什么?
参考答案
结论: 意味着 Jacobi 迭代矩阵 \(B = D^{-1}(L+U)\) 是一个非负矩阵。 根据 Perron-Frobenius 理论,其收敛性由 \(\rho(B)\) 决定。对于 M-矩阵,这种收敛通常是单调的且具有解析保障。
10. [应用] 简述为什么在求解扩散方程时希望离散矩阵是 M-矩阵。
参考答案
理由: 扩散过程遵循最大值原理(浓度不会凭空产生极值)。如果离散后的矩阵不是 M-矩阵,数值解可能会在剧烈变化处产生“虚假震荡”或负浓度值,这违背了基本的物理定律。M-矩阵结构保证了数值格式的保真性。
本章小结¶
M-矩阵是数值稳定性与物理真实性的代数交汇点:
- 逆向的正性:M-矩阵最深刻的特性是“逆正性”,它确保了正的输入必然导致正的输出,是线性系统符合逻辑的根本保障。
- 收敛的定海神针:在处理超大规模方程组时,M-矩阵结构是保证各种分解和迭代算法不发散的终极防线。
- 结构的支配力:通过比较定理,M-矩阵为我们提供了一套估计算子范数和特征值范围的有力杠杆,将复杂的算子比较转化为简单的元素对比。