线性方程组 是线性代数最早出现、也最实用的问题。本节把方程组和 向量组 放在一起研究,因为它们其实是同一件事的两种说法:
- 方程组 Ax=b 是否有解 ⟺ b 能否被 A 的列向量 线性表示。
- 解的个数(唯一还是无穷)⟺ A 的列向量是否 线性相关。
把矩阵乘法 Ax 看成「A 的各列以 x1,x2,… 为权重的线性组合」,这条桥就立起来了:解方程组,就是找一组权重把 A 的列向量「拼」成 b。一切最终归结为 秩。
n 维 列向量 α=(a1,a2,…,an)T,可以看成 Rn 空间里从原点出发的一个箭头,或一个点。
α+β,kα
加法是「箭头首尾相接」(平行四边形法则),数乘是「沿原方向伸缩」。这两种运算满足结合律、交换律、分配律。
若存在数 k1,…,ks 使
β=k1α1+k2α2+⋯+ksαs
则称 β 是 α1,…,αs 的一个 线性组合,也说 β 可由它们 线性表示。这恰好等价于方程组 (α1,…,αs)x=β 有解。
一组向量的所有线性组合构成的集合,叫它们 张成(Span)的空间 —— 这是后面「列空间」的来源。
向量组 α1,…,αs 称为 线性相关(Linearly Dependent),若存在 不全为零 的数 k1,…,ks 使
k1α1+k2α2+⋯+ksαs=0
否则称 线性无关(Linearly Independent)。
几何直觉一句话:线性相关 = 有「多余」的向量。
- 两个向量相关,就是它们 共线(一个是另一个的倍数)。
- 三个向量相关,就是它们 共面(挤在同一平面里,张不出三维体)。
线性无关,则每个向量都提供了一个「新方向」,谁都不能由其余的拼出来。判断相关性,本质是问「这堆向量真正撑起了几维空间」。
下面几句说的是同一件事:
α1,…,αs 线性相关⟺至少一个向量能由其余线性表示⟺r(α1,…,αs)<s
反过来,线性无关 ⟺ 矩阵 (α1,…,αs) 的秩 =s ⟺ 齐次方程组 (α1,…,αs)x=0 只有零解。
- 含 零向量 的向量组必线性相关。
- 单个非零向量线性无关;两个向量相关当且仅当成比例。
- 部分相关 ⇒ 整体相关;整体无关 ⇒ 部分无关。
- n+1 个 n 维向量 必线性相关(向量个数超过维数,必有多余)。
- 无关组每个向量「接长」分量后仍无关;相关组「截短」分量后仍相关。
向量组 A 的一个子组 A0=αi1,…,αir 若满足:
- A0 本身线性无关;
- 从 A 里再添任何一个向量进去都变成相关。
则称 A0 是 A 的 极大线性无关组(Maximal Linearly Independent Subset)。它是这组向量的「骨架」:剩下的向量都能由它线性表示,但它一个都不多余。极大无关组通常不唯一,但所含向量个数固定。
极大无关组中向量的个数,记为 r(α1,…,αs),称为向量组的 秩。它等于由这些向量作列拼成的矩阵的秩:
r(α1,…,αs)=r((α1,…,αs))
这就把「向量组的秩」和「矩阵的秩」彻底打通了 —— 它们是同一个数。
例:求向量组 α1=(1,2,1)T、α2=(2,4,2)T、α3=(1,1,3)T、α4=(2,3,4)T 的秩和一个极大无关组。把它们作 列 拼成矩阵,做初等行变换化行阶梯形:
121242113234r2−2r1, r3−r11002001−122−12r3+2r21002001−102−10
非零行有 2 个,故秩为 2。主元落在 第 1、3 列,所以 α1,α3 构成一个极大无关组。其余两个可由它们表示:从阶梯形看出 α2=2α1,而 α4=α1+α3(用 α1+α3=(2,3,4)T 核对正是 α4)。这套「行变换定秩、主元列定骨架」的做法是求极大无关组的标准流程。
两个向量组 A,B 若能 相互线性表示,称为 等价。等价的向量组必 秩相同(但秩相同不一定等价)。
Ax=b
A 为 m×n 系数矩阵,b 为 m 维常数列。把 b 拼到 A 右边得到 增广矩阵 Aˉ=(A∣b)。b=0 时称 齐次,否则称 非齐次。
求解的通用算法:对 增广矩阵 Aˉ 做初等行变换,化成 行最简形,再直接读出解。每次行变换对应方程的等价变形(交换方程、方程乘非零数、一个方程加另一个的倍数),不改变解集。
化到行最简形后,主元所在列对应的变量叫 主变量,其余叫 自由变量。自由变量可任取,主变量由它们表出,自由变量的个数 =n−r(A) 正是解的「自由度」。
| 情形 | 条件 | 解 |
|---|
| 无解 | r(A)=r(Aˉ) | 不存在 |
| 唯一解 | r(A)=r(Aˉ)=n | 恰一组 |
| 无穷多解 | r(A)=r(Aˉ)<n | 含 n−r 个自由变量 |
记忆要点:先比 r(A) 与 r(Aˉ) —— 不相等就 无解(b 拼不进 A 的列空间)。相等了再看它和未知数个数 n 的关系 —— 等于 n 唯一解,小于 n 无穷多解。「r(A) 决定有没有约束,Aˉ 决定相不相容」。
齐次方程组 Ax=0 因为 b=0,永远 相容(至少有零解)。它有 非零解 的充要条件是 r(A)<n。
例(唯一解):解 ⎩⎨⎧x1+x2+x3=62x1+3x2+x3=11x1−x2+2x3=5。对增广矩阵消元:
12113−11126115r2−2r1, r3−r110011−21−116−1−1r3+2r21001101−1−16−1−3
r(A)=r(Aˉ)=3=n,唯一解。回代:由末行 −x3=−3 得 x3=3;代入第 2 行 x2−x3=−1 得 x2=2;代入首行得 x1=6−2−3=1。解为 (1,2,3)T。
例(无解):解 {x1+x2+x3=12x1+2x2+2x3=3。r2−2r1 得 (10101011),末行翻译成 0=1,矛盾。此时 r(A)=1=r(Aˉ)=2,无解——b 不在 A 的列空间里。
例(无穷多解):解 {x1+x2+x3=22x1+x2−x3=1。消元化行最简形:
(12111−121)r2−2r1(101−11−32−3)−r2, r1−r2(1001−23−13)
r(A)=r(Aˉ)=2<n=3,有 n−r=1 个自由变量。取 x3=t 为自由变量,主变量 x1=−1+2t、x2=3−3t,通解
x=−130+t2−31,t∈R
前一项是特解,后一项是对应齐次方程的解,正合「特解 + 齐次通解」的结构。
设 r(A)=r<n,则解集是一个 n−r 维的子空间。能找到 n−r 个 线性无关 的解 ξ1,…,ξn−r,它们构成 基础解系(Fundamental System of Solutions),通解是它们的任意线性组合:
x=c1ξ1+c2ξ2+⋯+cn−rξn−r,ci∈R 任意
基础解系就是解空间的一组 基,n−r 就是它的维数。
例:求 {x1+x2−x3+x4=02x1+x2+x3−x4=0 的基础解系。系数矩阵化行最简形:
(1211−111−1)r2−2r1(101−1−131−3)−r2, r1−r2(10012−3−23)
r(A)=2,自由度 n−r=4−2=2。主变量是 x1,x2,自由变量是 x3,x4,由行最简形读出 x1=−2x3+2x4、x2=3x3−3x4。分别取 (x3,x4)=(1,0) 和 (0,1),得两个线性无关的解:
ξ1=−2310,ξ2=2−301
通解为 x=c1ξ1+c2ξ2。代回原方程可验证 ξ1,ξ2 都满足,且二者不成比例、确实线性无关。
设 Ax=b 相容。它的通解 = 对应齐次方程 Ax=0 的通解 + 任一个特解 η∗:
x=η∗+c1ξ1+c2ξ2+⋯+cn−rξn−r
道理很直接:若 η1,η2 都是非齐次的解,则 A(η1−η2)=b−b=0,差是齐次解。所以全体非齐次解 = 一个特解再加上所有齐次解。
这与 微分方程 中「线性 ODE 解的结构」完全同构:非齐次通解 = 齐次通解 + 特解。这并非巧合,而是 线性算子 理论的统一表述 —— 凡是线性映射 L,方程 L(x)=b 的解集都长这个样子。
把解集放回空间里看,结构一目了然:
- 齐次方程组的解集 {x:Ax=0} 是一个 过原点 的子空间(一条过原点的直线、一张过原点的平面……),维数为 n−r。
- 非齐次方程组的解集是它的一个 平移:把齐次解空间整体挪到特解 η∗ 上,得到一个 不过原点 的 仿射子空间。
所以「特解 + 齐次通解」就是「先定一个落点,再沿解空间自由滑动」。两个平面相交得一条直线、三个平面交于一点,这些中学几何场景,都是方程组解结构的特例。
Rn 是最常见的 向量空间(Vector Space):对加法、数乘 封闭,且满足结合、交换、分配等 八条公理。直观上它就是「能自由做线性组合的场所」。
Rn 的非空子集 W 若对加法和数乘也封闭,就称为 子空间(Subspace)。子空间必过原点。和矩阵相关的两个重要子空间:
- 零空间(Null Space,解空间):齐次方程 Ax=0 的全体解,维数 =n−r(A)。
- 列空间(Column Space):A 的列向量张成的空间,等于 b 使 Ax=b 有解的全部取值,维数 =r(A)。
由此得到 秩-零化度定理:r(A)+dim(零空间)=n,正是「主变量 + 自由变量 = 总变量数」的几何版本。
- 基(Basis):子空间的一个极大无关组 —— 既能张成整个空间,又互相独立。
- 维数(Dimension):基中向量的个数,是空间「有几个独立方向」的度量。
- 坐标(Coordinate):向量在某组基下的表示系数。选定基后,抽象向量就和一串具体数字一一对应。
同一个向量在不同基下坐标不同,两组基之间通过 过渡矩阵(基变换矩阵)换算。这个「换基」的思想,正是 特征值与相似矩阵 里相似变换的几何内核。
例(求坐标):在 R2 里取一组基 β1=(1,1)T、β2=(1,−1)T,求向量 γ=(3,1)T 在这组基下的坐标。即解 x1β1+x2β2=γ:
{x1+x2=3x1−x2=1⇒x1=2, x2=1
故 γ 在基 {β1,β2} 下的坐标是 (2,1)T,即 γ=2β1+β2。
例(过渡矩阵):从基 B1={e1,e2}(标准基)换到 B2={β1,β2}。过渡矩阵 P 的列就是 新基向量在旧基下的坐标,所以 P=(β1,β2)=(111−1)。它把「B2 下的坐标」换算成「B1 下的坐标」:若向量在新基下坐标为 y,则在旧基(即原始分量)下为 x=Py。验证 y=(2,1)T 时 Py=(111−1)(21)=(31)=γ,与上一例一致。反向换算用 y=P−1x。