第 1 章 线性方程组¶
前置:无(线性代数的起点)
本章脉络:线性方程 → 增广矩阵 → 初等行变换 → 高斯消元 → REF/RREF → 解的存在唯一性 → 齐次方程组 → 解的结构
延伸:线性方程组在电路分析(Kirchhoff 定律)、经济学(Leontief 投入产出模型)、计算机图形学(齐次坐标变换)中无处不在;无穷维推广导致积分方程与 Fredholm 理论
线性方程组(system of linear equations)是线性代数最基本的研究对象之一。从初等数学中解二元一次方程组开始,我们就已经在接触线性方程组的求解问题。在本章中,我们将系统地建立线性方程组的理论框架:引入增广矩阵和初等行变换,发展高斯消元法这一强有力的算法工具,深入分析解的存在性、唯一性及其结构。这些内容构成了后续所有章节的基石。
1.1 线性方程与线性方程组¶
核心问题:什么是"线性"? → 未知量一次幂、无乘积 → 几何上对应直线/平面/超平面的交集
基本定义¶
定义 1.1 (线性方程)
含有 \(n\) 个未知量 \(x_1, x_2, \ldots, x_n\) 的线性方程(linear equation)是指形如
的方程,其中 \(a_1, a_2, \ldots, a_n\) 和 \(b\) 是已知的实数(或复数)常量,分别称为方程的系数(coefficient)和常数项(constant term)。
线性方程的关键特征在于:每个未知量只以一次幂出现,且未知量之间没有乘积项。例如 \(3x_1 - 2x_2 + x_3 = 7\) 是线性方程,而 \(x_1 x_2 + x_3 = 1\) 或 \(\sin(x_1) + x_2 = 0\) 则不是。
定义 1.2 (线性方程组)
由 \(m\) 个含 \(n\) 个未知量的线性方程所构成的集合称为一个 \(m \times n\) 线性方程组(system of linear equations),一般形式为:
其中 \(a_{ij}\)(\(1 \le i \le m, 1 \le j \le n\))为系数,\(b_i\) 为常数项。
定义 1.3 (解与解集)
使线性方程组中所有方程同时成立的一组数 \((s_1, s_2, \ldots, s_n)\) 称为该方程组的一个解(solution)。方程组所有解的集合称为解集(solution set)。若两个线性方程组具有相同的解集,则称它们是等价的(equivalent)。
几何解释¶
二维情形(两个未知量):每个线性方程 \(a_1 x_1 + a_2 x_2 = b\) 在 \(\mathbb{R}^2\) 平面上表示一条直线。两个方程的解集对应两条直线的交集,有三种情形:
- 唯一解:两条直线相交于一点(两条直线斜率不同)。
- 无穷多解:两条直线重合(两方程成比例)。
- 无解:两条直线平行但不重合。
三维情形(三个未知量):每个线性方程 \(a_1 x_1 + a_2 x_2 + a_3 x_3 = b\) 在 \(\mathbb{R}^3\) 中表示一个平面。三个方程的解集是三个平面的公共交集,可能是一个点、一条直线、一个平面,或者空集。
例 1.1
考虑方程组
第一个方程在平面上表示经过 \((3,0)\) 和 \((0,3)\) 的直线,第二个方程表示经过原点斜率为 \(2\) 的直线。两条直线交于一点 \((1, 2)\),即唯一解 \(x_1 = 1, x_2 = 2\)。
例 1.2
考虑三维方程组
这两个方程各表示 \(\mathbb{R}^3\) 中的一个平面。两个不平行的平面交于一条直线,因此该方程组有无穷多解。由两方程相减得 \(2x_2 = -2\),即 \(x_2 = -1\)。代入第一个方程得 \(x_1 + x_3 = 2\)。设 \(x_3 = t\)(自由参数),则通解为 \(x_1 = 2 - t,\; x_2 = -1,\; x_3 = t\),\(t \in \mathbb{R}\)。
1.2 增广矩阵与初等行变换¶
动机:方程组中未知量符号冗余 → 将信息压缩为增广矩阵 → 用初等行变换系统化地操作(→ 第 2 章将行变换抽象为初等矩阵)
在求解线性方程组时,未知量的符号 \(x_1, x_2, \ldots, x_n\) 仅起占位作用,真正决定解的是系数和常数项。因此,我们可以将方程组的全部信息压缩到一个矩阵中。
定义 1.4 (系数矩阵与增广矩阵)
对于线性方程组
其系数矩阵(coefficient matrix)为
其增广矩阵(augmented matrix)为
方程组还可以紧凑地写成矩阵方程 \(A\mathbf{x} = \mathbf{b}\),其中 \(\mathbf{x} = (x_1, x_2, \ldots, x_n)^T\),\(\mathbf{b} = (b_1, b_2, \ldots, b_m)^T\)。
定义 1.5 (初等行变换)
对矩阵施行的以下三种操作称为初等行变换(elementary row operations):
- 行交换(row interchange):交换矩阵的第 \(i\) 行和第 \(j\) 行,记作 \(R_i \leftrightarrow R_j\)。
- 行倍乘(row scaling):将第 \(i\) 行乘以非零常数 \(c\),记作 \(cR_i \to R_i\)。
- 行倍加(row replacement):将第 \(j\) 行的 \(c\) 倍加到第 \(i\) 行上,记作 \(R_i + cR_j \to R_i\)。
定理 1.1 (行变换保持解集不变)
对线性方程组的增广矩阵施行有限次初等行变换后得到的新方程组与原方程组等价,即它们具有相同的解集。
证明
每种初等行变换都是可逆的:
- 行交换 \(R_i \leftrightarrow R_j\) 的逆操作仍是 \(R_i \leftrightarrow R_j\)。
- 行倍乘 \(cR_i \to R_i\)(\(c \neq 0\))的逆操作是 \(\frac{1}{c}R_i \to R_i\)。
- 行倍加 \(R_i + cR_j \to R_i\) 的逆操作是 \(R_i - cR_j \to R_i\)。
因此,原方程组的任意解满足新方程组的所有方程,反之亦然。从而两个方程组的解集相同。\(\blacksquare\)
1.3 高斯消元法与高斯-Jordan 消元法¶
从行变换到算法:初等行变换保持解集不变(定理 1.1) → 系统地消去主元下方元素即为高斯消元,进一步消去上方元素即为高斯-Jordan 消元
高斯消元法¶
高斯消元法(Gaussian elimination)是一种系统化的求解线性方程组的算法,其基本思想是通过初等行变换将增广矩阵化为行阶梯形,然后通过回代求解。
算法步骤:
- 写出增广矩阵 \([A \mid \mathbf{b}]\)。
- 从最左列开始,找到该列中第一个非零元素所在的行(如果该列全为零,则移到下一列)。必要时进行行交换,将该非零元素移至当前处理行。该非零元素称为主元(pivot)。
- 利用行倍加操作,将主元下方该列的所有元素消为零。
- 对下一行和下一列重复步骤 2–3,直到所有行处理完毕。
- 得到行阶梯形矩阵后,从最后一个含主元的行开始回代(back substitution),逐步求出各未知量。
例 1.3
用高斯消元法解方程组
写出增广矩阵并进行行变换:
回代:由第三行 \(2x_3 = 1\) 得 \(x_3 = \frac{1}{2}\);由第二行 \(x_2 = 1\);由第一行 \(x_1 + 2(1) + \frac{1}{2} = 3\) 得 \(x_1 = \frac{1}{2}\)。
解为 \(x_1 = \frac{1}{2},\; x_2 = 1,\; x_3 = \frac{1}{2}\)。
高斯-Jordan 消元法¶
高斯-Jordan 消元法(Gauss-Jordan elimination)在高斯消元的基础上进一步操作:不仅消去主元下方的元素,还消去主元上方的元素,并将每个主元化为 \(1\),最终将增广矩阵化为简化行阶梯形。
例 1.4
继续例 1.3 的结果,进行高斯-Jordan 消元:
直接读出解 \(x_1 = \frac{1}{2},\; x_2 = 1,\; x_3 = \frac{1}{2}\),无需回代。
1.4 行阶梯形与简化行阶梯形¶
为什么需要标准形:消元的目标需要精确定义 → REF 足以回代求解,RREF 直接读出解 → RREF 的唯一性(定理 1.2)使其成为矩阵的"规范代表"
定义 1.6 (行阶梯形矩阵)
矩阵处于行阶梯形(row echelon form, REF)当且仅当满足以下条件:
- 所有全零行位于矩阵的底部。
- 每个非零行的首个非零元素(称为主元或领头元素,leading entry / pivot)严格位于上一行主元的右侧。
定义 1.7 (简化行阶梯形矩阵)
矩阵处于简化行阶梯形(reduced row echelon form, RREF)当且仅当满足以下条件:
- 它是行阶梯形。
- 每个主元等于 \(1\)(称为主 1,leading 1)。
- 每个主元所在列的其余元素全为 \(0\)。
例 1.5
以下矩阵处于行阶梯形但不是简化行阶梯形:
以下矩阵处于简化行阶梯形:
定理 1.2 (简化行阶梯形的唯一性)
每个矩阵都行等价于唯一的一个简化行阶梯形矩阵。
证明
存在性:通过高斯-Jordan 消元法,任意矩阵都可以经过有限次初等行变换化为简化行阶梯形。
唯一性:设矩阵 \(A\) 行等价于两个简化行阶梯形矩阵 \(R_1\) 和 \(R_2\)。由于行等价的矩阵对应同解方程组,因此 \(R_1\) 和 \(R_2\) 对应的齐次方程组具有完全相同的解集。
我们证明 \(R_1 = R_2\)。首先,\(R_1\) 和 \(R_2\) 的主元列位置相同(因为主元列恰好对应基本变量,而基本变量由解集唯一确定)。其次,对于每个主元列,简化行阶梯形中该列只有主元位置为 \(1\)、其余为 \(0\),所以对应列相同。对于自由变量列,其值由方程组的解集唯一确定。综合可得 \(R_1 = R_2\)。\(\blacksquare\)
注
行阶梯形不是唯一的。同一个矩阵可以经过不同的初等行变换序列化为不同的行阶梯形。但简化行阶梯形是唯一的,这是一个重要的性质。
1.5 解的存在性与唯一性¶
从算法到理论:RREF 的主元位置完全决定解的命运 → 主元列 = 基本变量,非主元列 = 自由变量 → 三种结局:无解 / 唯一解 / 无穷多解
定义 1.8 (相容与不相容)
若线性方程组有解(至少一个),则称该方程组是相容的(consistent);若无解,则称为不相容的(inconsistent)。
定义 1.9 (主元位置与主元列)
矩阵中在行阶梯形中对应主元的位置称为主元位置(pivot position)。含有主元位置的列称为主元列(pivot column)。对应主元列的未知量称为基本变量(basic variable),其余未知量称为自由变量(free variable)。
定理 1.3 (解的存在性)
线性方程组 \(A\mathbf{x} = \mathbf{b}\) 相容的充要条件是:其增广矩阵 \([A \mid \mathbf{b}]\) 的行阶梯形中,\(\mathbf{b}\) 所在列不是主元列。
等价地,方程组相容当且仅当增广矩阵的行阶梯形中不出现形如 \((0\; 0\; \cdots\; 0 \mid c)\)(其中 \(c \neq 0\))的行。
证明
若行阶梯形中出现 \((0\; 0\; \cdots\; 0 \mid c)\)(\(c \ne 0\)),则对应方程为 \(0 = c\),矛盾,方程组无解。
若不出现这样的行,则每个非零行都至少有一个系数列中的主元,可以通过回代(将自由变量赋任意值)求得至少一个解,方程组相容。\(\blacksquare\)
定理 1.4 (解的唯一性)
若相容的线性方程组没有自由变量(即每一列都是主元列),则方程组有唯一解;若存在自由变量,则方程组有无穷多解。
证明
若没有自由变量,简化行阶梯形中每个未知量都是基本变量,对应列只有一个 \(1\),解被唯一确定。
若存在自由变量,令该自由变量取不同的实数值就得到不同的解,因此解有无穷多个。由于自由变量可取 \(\mathbb{R}\) 中的任意值,解集是无穷的。\(\blacksquare\)
关键洞察:线性方程组不可能有"恰好 2 个解"——有 2 个就有无穷多个,因为解集对仿射组合封闭
命题 1.1
线性方程组的解的情况恰好有三种:无解、唯一解、无穷多解。不存在恰好有有限多个(大于1个)解的线性方程组。
证明
假设方程组有两个不同的解 \(\mathbf{x}_1\) 和 \(\mathbf{x}_2\)。对任意实数 \(t\),令 \(\mathbf{x}(t) = (1-t)\mathbf{x}_1 + t\mathbf{x}_2\)。由于
所以 \(\mathbf{x}(t)\) 也是方程组的解。当 \(t\) 取遍所有实数时,得到无穷多个不同的解。\(\blacksquare\)
例 1.6
判断下列方程组的解的情况:
增广矩阵为
第二行为 \((0\; 0\; 0 \mid 1)\),对应方程 \(0 = 1\),矛盾。方程组无解。
例 1.7
解方程组
增广矩阵化为简化行阶梯形:
主元列为第 1、3、4 列,对应基本变量 \(x_1, x_3, x_4\)。第 2 列为非主元列,\(x_2\) 是自由变量。设 \(x_2 = t\),则
1.6 齐次线性方程组¶
特殊到一般:\(A\mathbf{x}=\mathbf{0}\) 总有平凡解 → 关注非平凡解的存在性 → 解集对加法和数乘封闭 → 构成子空间(→ 第 4 章零空间、第 5 章核)
定义 1.10 (齐次线性方程组)
若线性方程组中所有常数项 \(b_i = 0\),即方程组为
则称其为齐次线性方程组(homogeneous system of linear equations)。否则称为非齐次线性方程组(nonhomogeneous system)。
齐次方程组总有一个解 \(\mathbf{x} = \mathbf{0}\),称为平凡解(trivial solution)。非零解称为非平凡解(nontrivial solution)。
定理 1.5 (非平凡解的存在条件)
齐次线性方程组 \(A\mathbf{x} = \mathbf{0}\) 有非平凡解的充要条件是:方程组中存在自由变量。
特别地,若方程的个数 \(m\) 小于未知量的个数 \(n\)(即 \(m < n\)),则齐次方程组必有非平凡解。
证明
齐次方程组总是相容的(\(\mathbf{x} = \mathbf{0}\) 是解)。因此由定理 1.4,有非平凡解当且仅当存在自由变量。
对于 \(m < n\) 的情形:增广矩阵为 \(m \times (n+1)\) 矩阵,系数矩阵为 \(m \times n\) 矩阵。主元最多有 \(m\) 个(每行至多一个主元),因此至少有 \(n - m > 0\) 个自由变量,从而有非平凡解。\(\blacksquare\)
定理 1.6 (齐次方程组解空间的性质)
齐次线性方程组 \(A\mathbf{x} = \mathbf{0}\) 的解集 \(S\) 满足:
- \(\mathbf{0} \in S\)。
- 若 \(\mathbf{x}_1, \mathbf{x}_2 \in S\),则 \(\mathbf{x}_1 + \mathbf{x}_2 \in S\)(对加法封闭)。
- 若 \(\mathbf{x}_1 \in S\),\(c \in \mathbb{R}\),则 \(c\mathbf{x}_1 \in S\)(对标量乘法封闭)。
因此 \(S\) 构成 \(\mathbb{R}^n\) 的一个子空间(subspace),称为 \(A\) 的零空间(null space)或核。
证明
-
\(A\mathbf{0} = \mathbf{0}\),所以 \(\mathbf{0} \in S\)。
-
若 \(A\mathbf{x}_1 = \mathbf{0}\) 且 \(A\mathbf{x}_2 = \mathbf{0}\),则 \(A(\mathbf{x}_1 + \mathbf{x}_2) = A\mathbf{x}_1 + A\mathbf{x}_2 = \mathbf{0} + \mathbf{0} = \mathbf{0}\)。
-
若 \(A\mathbf{x}_1 = \mathbf{0}\),则 \(A(c\mathbf{x}_1) = cA\mathbf{x}_1 = c\mathbf{0} = \mathbf{0}\)。\(\blacksquare\)
例 1.8
求齐次方程组的通解:
增广矩阵化为简化行阶梯形:
主元列为第 1、3 列。自由变量:\(x_2 = s\),\(x_4 = t\)。通解:
1.7 解的结构¶
统一视角:非齐次通解 = 特解 \(\mathbf{x}_0\) + 齐次通解 → 解集是子空间的平移(仿射子空间) → 这是线性叠加原理的原型
定理 1.7 (非齐次方程组解的结构)
设 \(A\mathbf{x} = \mathbf{b}\) 为一个相容的非齐次线性方程组,\(\mathbf{x}_0\) 为其一个特解(particular solution),则方程组的通解可以表示为
其中 \(\mathbf{x}_h\) 是对应齐次方程组 \(A\mathbf{x} = \mathbf{0}\) 的通解。
换言之,非齐次方程组的通解 = 一个特解 + 齐次方程组的通解。
证明
(通解属于上述形式) 设 \(\mathbf{x}_1\) 是 \(A\mathbf{x} = \mathbf{b}\) 的任意解,则
故 \(\mathbf{x}_h = \mathbf{x}_1 - \mathbf{x}_0\) 是齐次方程组的解,因而 \(\mathbf{x}_1 = \mathbf{x}_0 + \mathbf{x}_h\)。
(上述形式都是解) 反过来,若 \(A\mathbf{x}_h = \mathbf{0}\),则
故 \(\mathbf{x}_0 + \mathbf{x}_h\) 确为非齐次方程组的解。\(\blacksquare\)
注
此定理揭示了线性方程组解集的几何结构。齐次方程组 \(A\mathbf{x} = \mathbf{0}\) 的解集是经过原点的子空间(直线、平面等),而非齐次方程组 \(A\mathbf{x} = \mathbf{b}\) 的解集是该子空间的一个平移(仿射子空间),即将子空间整体平移到特解 \(\mathbf{x}_0\) 的位置。
例 1.9
解方程组
增广矩阵化简:
特解(令自由变量 \(x_2 = 0\)):\(\mathbf{x}_0 = (3, 0, 1)^T\)。
齐次通解(\(x_2 = t\)):\(\mathbf{x}_h = t(-2, 1, 0)^T\)。
通解:
例 1.10
设 \(4 \times 5\) 矩阵 \(A\) 的秩为 \(3\),\(A\mathbf{x} = \mathbf{b}\) 有解。试分析解的结构。
由于 \(A\) 有 \(5\) 个未知量,秩为 \(3\)(即有 \(3\) 个主元列),所以有 \(5 - 3 = 2\) 个自由变量。齐次方程组 \(A\mathbf{x} = \mathbf{0}\) 的解空间是 \(\mathbb{R}^5\) 的 \(2\) 维子空间,设其基础解系为 \(\{\mathbf{x}_1, \mathbf{x}_2\}\)。
非齐次方程组的通解为
其中 \(\mathbf{x}_0\) 是某个特解。几何上,这是 \(\mathbb{R}^5\) 中一个 \(2\) 维仿射子空间(平面的推广)。