第 8 课 求解 $Ax=b$ :可解性和解的结构

本章将系统讲解线性方程组的求解,也即 $Ax = b$。首先课程讲述了可解性的概念,然后给出求解 $Ax=b$ 的具体算法($x_p+x_n$),最后从秩的角度来理解解的结构

我们已经知道, $Ax=b$ 是不一定有解的,其可解性可以通过消元来反映(消元过程可以看出其可解性),如果有解,就需继续探究是唯一解还是多解并求出所有的解(通解)。

我们还是使用上节课的矩阵,那么易得 $Ax=b$ 的消元过程为:

从最后一行可以看出,要使 $Ax=b$ 有解,则必须满足 $b_3-b_2-b_1=0$,这也即消元过程中反映出的可解性。

  • 可解性:要使 $Ax=b$ 有解右侧向量 $b$ 必须要满足的条件。

    我们已经学习过列空间的知识并曾从列空间的角度给出 $b$ 需要满足的条件:$b$ 必须要属于 $A$ 的列空间。

    但这节课我们从一个更加具体更加实际的角度给出 $b$ 需要满足的条件:如果 $A$ 各行的线性组合得到零行,那么向量 $b$ 的分量在同样的线性组合后也必须为零。


上述可解性的讨论实际上已经包含了 $Ax=b$ 无解情况的分析:不满足可解性则无解。下面我们开始讨论有解的情况以及如何求解。

我们继续考虑上面的矩阵,假设 $b=\left[\begin{array}{l}{1} \\ {5} \\ {6}\end{array}\right]$ 满足可解性条件(也即满足 $b_3-b_2-b_1=0$)那么整个 $Ax=b$ 包括 $2$ 个方程,但未知数有 $4$ 个,理论上应该能够找出很多解。

  • 我们先找出一个特解,策略是将所有自由变量取 $0$,然后求出 $Ax=b$ 中的所有主变量的值。下面求出特解 $x_p$:

  • 将第一步所得的特解 $x_p$ 加上零空间中的任意向量(设为 $x_n$ )即可得到所有解(通解) $x=x_p+x_n$。下面给予这种做法的简单的解释:

    上面的等式是显然成立的,这是一个巧妙的转化,求解 $Ax=b$ 等若求解 $A(x_p+x_n)=b$!现在寻找所有可能(尽可能多)的 $x$ 就转化成了寻找所有可能(尽可能多)的 $x_p+x_n$,而 $x_p+x_n$ 中的 $x_p$ 是特解(只有一个),故 $x_p+x_n $ 的大小取决于 $x_n$,所以只要 $x_n$ 能够包括零空间中的任意向量,那么 $x_p+x_n$ 组成的就包含的所有的解。整理可得:

讲完 $Ax=b$ 的求解过程后,我们可以顺便回答一个问题,第一步寻找特解时,设定所有自由变量为 $0$ 的策略有其讲究的地方吗?我们可以简单地把自由变量赋予非 $0$ 值来简单探究一下:

新特解 $x_p’$ 与先前的 $x_p$ 不同,这很正常,但我们关注的是 $x_p’$ 和 $x_p$ 有什么联系呢?容易发现:

也即新特解 $x_p’$ 本身可由 $x_p$ 加上零空间中的向量来得到。

综上可知,取所有自由变量为 $0$ 只是便于运算而已,这一步中,对于所有的自由变量你赋予任何值都不影响我们最后能够得到满足 $Ax=b$ 的所有的 $x$。因为不管你赋予自由变量任何值,所求得的 $x_p$ 能确保 $Ax_p=b$,而用于配合 $x_p$ 来扩充解空间的零空间的大小也是不变的。

所以,求解 $Ax=b$ 想要获得所有解(通解)的关键在于:在求取零空间时,需要讲究地采用给某个自由变量赋值为 $1$,其余变量赋值为 $0$ 的策略以确保得到的所有特解都线性无关从而确保零空间被完全求得

最后我们可以想象一下上面所求的的解的图像:一个经过原点的平面表示零空间,然后整个零空间加上一个特解,这也即平面的平移,最后该平面不再经过原点,这也意味着所得解并非是一个向量空间。


考虑秩为 $r$ 的 $m\times n$ 矩阵 $A$。那么显然有 $r\le m$ 且 $r\le n$。我们现在来讨论满秩的情况。

  • 列满秩($r=n$)

    列满秩 $\Rightarrow$ 每一列都有主元 $\Rightarrow$ 没有自由列从而没有自由变量 $\Rightarrow$ 零空间只包含零向量 $\Rightarrow$ 若 $b$ 满足可解性,也即 $Ax=b$ 有解,那么解唯一(零空间只包含零向量,此时通解 $x=x_p+x_n=x_p+0=x_p$)

    总结:列满秩时,$Ax=b$ 存在唯一解或无解,解的存在与否取决于可解性。

  • 行满秩($r=m$)

    行满秩 $\Rightarrow$ 每一行都有主元 $\Rightarrow$ 消元时零行不会出现 $\Rightarrow$ 对 $b$ 没有要求 $\Rightarrow$ $Ax=b$ 必然有解

    • $r=m<n$:存在自由变量 $\Rightarrow$ 零空间除了包含零向量以外,还包含特解的线性组合 $\Rightarrow$ $Ax=b$ 存在多个解。

    • $r=m=n$:不存在自由变量 $\Rightarrow$ 零空间只包含零向量 $\Rightarrow$ $Ax=b$ 存在唯一解。

      从零空间只包含零向量且矩阵为方阵可知矩阵 $A$ 是一个可逆矩阵。

总结如下表($R$ 表示矩阵 $A$ 经过消元化简到 RREF 型):

$r=m=n$ $r=n<m$ $r=m<n$ $r<m,r<n$
$R=I$ $R=\begin{bmatrix}I\\0\end{bmatrix}$ $R=\begin{bmatrix}I&F\end{bmatrix}$ $R=\begin{bmatrix}I&F\\0&0\end{bmatrix}$
存在唯一解 存在唯一解或无解(出现 $0$ 行对 $b$ 有要求) 存在无穷解 存在无穷解或无解(出现 $0$ 行对 $b$ 有要求)