最后更新: 2025-01-09 21:16 查看: 270 次反馈刷题

附录3：再看线性代数的意义

在附录2里，介绍了矩阵等价。相似与合同的意义，这里进一步解释《线性变换》。线性变换可以有两种模式：（1）同一个空间里不同基坐标变换和（2）不同空间里不同基坐标变换。

> 通俗的说，第一种模式，类似A和B在戏台上看起，虽然看的角度不同，但是核心是同一个演员。第二种模式，一个蜡烛照在地球仪上，墙上出现地球的影子。这样球体的三维空间就被映射到平面上二维空间。

### 矩阵相似例题
上一节，介绍了一个坐标系镜像的例子，再来看一下这个例子。
`例` 设有一线性变换: 如图 5-49所示, 它将任意向量 $\left(\begin{array}{l}x \\ y\end{array}\right)$ 映射为关于 $45^{\circ}$ 直线的镜像 $\left(\begin{array}{l}y \\ x\end{array}\right)$ 。

![图片](/uploads/2024-01/image_202401042008205.png)

解：取直角坐标系, 其标准正交基 $\boldsymbol{e}_1=\left(\begin{array}{l}1 \\ 0\end{array}\right)$ 和 $\boldsymbol{e}_2=\left(\begin{array}{l}0 \\ 1\end{array}\right)$, 根据线性变换的矩阵定理, 则相应的线性变换矩阵 $A$ 容易求出。因为 $A$ 将 $e_1$ 映射为 $e_2$, 将 $e_2$ 映射为 $e_1$, 所以这个镜像映射在基 $e_1$ 和 $e_2$ 下的坐标表达式为

$$
\left(\begin{array}{l}
y \\
x
\end{array}\right)=\left[\begin{array}{ll}
0 & 1 \\
1 & 0
\end{array}\right]\left(\begin{array}{l}
x \\
y
\end{array}\right)
$$

其中把变换矩阵记为 $[\boldsymbol{A}]_e=\left[\begin{array}{ll}0 & 1 \\ 1 & 0\end{array}\right]$, 表示矩阵 $\boldsymbol{A}$ 是以 $\boldsymbol{e}_i$ 为基的。
下面我们再找一个新的基底 (见图 5-50), 使得新的基向量之一 $\boldsymbol{e}_1{ }^{\prime}$ 沿着 $45^{\circ}$ 直线, 即 $\boldsymbol{e}_1{ }^{\prime}=\left(\begin{array}{l}1 \\ 1\end{array}\right)$,而另一个基向量与之垂直, 即 $\boldsymbol{e}_2{ }^{\prime}=\left(\begin{array}{c}-1 \\ 1\end{array}\right)$ 。则新基与旧基的转换关系为

$$
\left\{\begin{array}{l}
\boldsymbol{e}_1^{\prime}=\boldsymbol{e}_1+\boldsymbol{e}_2 \\
\boldsymbol{e}_2^{\prime}=-\boldsymbol{e}_1+\boldsymbol{e}_2
\end{array}\right.
$$

将其改写为

$$
\left(e_1^{\prime}, e_2^{\prime}\right)=\left(e_1, e_2\right)\left[\begin{array}{cc}
1 & -1 \\
1 & 1
\end{array}\right]
$$

其中把基变换矩阵记为 $\boldsymbol{P}=\left[\begin{array}{cc}1 & -1 \\ 1 & 1\end{array}\right]$ 。
![图片](/uploads/2024-01/image_202401040481be4.png)
在这组新基上, 这个镜像运动的线性变换 $A$ 事实上被简化了。因为新基向量 $e_1{ }^{\prime}$ 在 $45^{\circ}$ 直线上,它是它本身的镜像, 即 $A e_1{ }^{\prime}=e_1{ }^{\prime}$ 。另一个新基向量 $\boldsymbol{e}_2{ }^{\prime}$ 正好被翻转过来, 即 $A e_2{ }^{\prime}=-e_2{ }^{\prime}$ 。于是,原矩阵 $\boldsymbol{A}$ 所表示的线性变换在新基 $\boldsymbol{e}_1{ }^{\prime}$ 和 $\boldsymbol{e}_2{ }^{\prime}$ 下的坐标表达式为

$$
\left(\begin{array}{c}
x^{\prime} \\
-y^{\prime}
\end{array}\right)=\left[\begin{array}{cc}
1 & 0 \\
0 & -1
\end{array}\right]\left(\begin{array}{l}
x^{\prime} \\
y^{\prime}
\end{array}\right)
$$

其中把线性变换矩阵记为 $[\boldsymbol{B}]_{e^{\prime}}=\left[\begin{array}{cc}1 & 0 \\ 0 & -1\end{array}\right]$, 表示矩阵 $\boldsymbol{B}$ 是以 $\boldsymbol{e}_{\boldsymbol{i}}{ }^{\prime}$ 为基的。
这个矩阵 $\boldsymbol{B}$ 与单位矩阵很接近, 确实比较简单。

**这里矩阵$A$  和$B$  是一对相似矩阵, 因为他们都是表示的同一变换 “关于固定的一直线的镜像映射”。**

好了, 下面把这个例子捋一捋:
(1) 矩阵 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 是一对相似矩阵, 因为哥俩都是表示的同一变换 “关于固定的一直线的镜像映射”。
(2) 矩阵 $\boldsymbol{P}$ 是基变换矩阵, 把一个旧基换成另一个新基, 乘以 $\boldsymbol{P}$;回去是乘以 $\boldsymbol{P}^{-1}$ 。详见[过渡矩阵](https://kb.kmath.cn/kbase/detail.aspx?id=490)
(3) 矩阵 $\boldsymbol{P}$ 的每个列都是由 $\boldsymbol{A}$ 的特征向量组成的，特征向量用旧基上的坐标表示。
(4) 矩阵 $\boldsymbol{B}$ 是简单的对角阵, 对角上的元素就是特征值, 从左上到右下排列的特征值分别对应着 $\boldsymbol{P}$ 矩阵的从左到右排列的特征向量。
(5) $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 俩矩阵既然表示同样的线性变换, 因此特征值也是同样的, 它和基没关系。

**相似矩阵 $A$ 和 $B$ 是同一个线性变换在两个不同基下的表示矩阵。**
这也是相似矩阵的几何意义啊。
打个比方说, 就像两个观众看一场演出, 台上演员的某一演出动作就是一个变换, 是实实在在的、唯物主义的不以谁看为转移的一个变换。但是两个观众张三和李四的位置不一样, 从不同角度观看, 这就是取的坐标不同, 基不同了。显然, 基不同, 看到的演员的动作也不同了。扮演猴子的演员在舞台中间从左往右翻跟头, 假设演员功夫好, 翻的是标准的圆周运动。左前方的张三看起来猴子的 “跟头” 变换是顺时针椭圆周运动, 此运动表示为矩阵 $A$; 在后方一角落的李四 (李四是剧团工作人员, 在帷幕后面闲看) 看起来猴子的 “跟头” 变换是逆时针椭圆周运动, 此运动表示为矩阵 $\boldsymbol{B}$ 。两个人看到的运动应是差不多的, 很相似, 因此 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 称为相似矩阵 (注意: 不止这两人, 所有的观众看到的运动都是相似矩阵)。

还有第三个人王二麻子很明智, 知道两个人看的运动有些走样了。就到观众席的正中央正襟危坐观看, 呵! 标准的圆周运动。王二麻子告诉我们: 在一大堆相似矩阵中, 正面的矩阵看起来不走样, 最爽 (矩阵有用啊, 证明了为何前排中间的位置票价最贵啊)。

下面咱们回归到两个基下的线性变换的讨论上来。

如图 5-48 所示, 矩阵 $\boldsymbol{A}$ 表示一个线性变换, 把一个向量 $\boldsymbol{x}$ 变换成另一个向量 $\boldsymbol{A x}: \boldsymbol{x} \rightarrow \boldsymbol{A x}$ (这是张三看到的演出动作); 在另外一个基下 (等于换了一个坐标系, 改变了观察角度), 同样的一个变换动作表示成了 $\boldsymbol{x^{\prime}}  \rightarrow \boldsymbol{B x'}$ (这是李四看到的演出动作)。

从张三的坐标系变换到李四的坐标系, 就要乘以一个 $\boldsymbol{P}$ (图 5-48中给出的是向量 $\boldsymbol{x}$ 的变换,因此乘以 $\boldsymbol{P}^{-1}$ ); 现实地操作就是张三跑到李四的座位上去就可以了。
![图片](/uploads/2024-01/image_202401045122a86.png)
这里就描述矩阵在现实世界对应的变化。

## 矩阵相似对角化
矩阵的对角化有不同的方法, 但我们常常讲的矩阵的对角化, 多数是所谓的相似对角化。
鉴于大家都有花大价钱买甲等票到王二麻子舞台正前方的位置看戏的习惯, 数学家当然也喜欢把一个矩阵相似变换到另一个比较爽的矩阵上去进一步研究这个线性变换。这个最爽的位置就是用特征向量当坐标轴, 最爽的矩阵就是对角阵, 次一些的当算约当阵了。实际上, 这是一个常见的工程处理方法, 把一个对象从一个领域变换到另外一个领域去以便研究（当然要保证被研究对象的本质不能被变换掉)。

1. 相似对角化的好处
   举个矩阵相似的事例, 比如我们开车郊游 (图 5-51), 到乡野别院度假。从地点 $\boldsymbol{x}$ 驾驶到目的地 $\boldsymbol{A x}$, 走眼前的小道不太方便, 那就绕个弯, 先从 $\boldsymbol{x}$ 过桥到 $\boldsymbol{x}^{\prime}$, 从 $\boldsymbol{x}^{\prime}$ 到 $\boldsymbol{B} \boldsymbol{x}^{\prime}$ 的行车就很方便, 处理简单。可到了 $B x^{\prime}$ 还没完啊, 度假目的地是 $A x$ 啊。好, 再过桥把 $B x^{\prime}$ 变到 $A x$ 。
   确实, 走笔直的马路当然比走九曲十八弯爽了。这里的马路也是对角阵。数学上的对角阵看起来爽, 除了对角线上外其他的元素都是 0 啊, 美的东西必然简洁, 观赏性较强。作为数学工具, 当然计算起来就比较好用了。
   ![图片](/uploads/2024-01/image_20240104544073c.png)
   
   假如一个矩阵对空间中一个向量作用, 得到一个新向量:

$$
\boldsymbol{A} \boldsymbol{d}=\left[\begin{array}{lll}
a_1 & a_2 & a_3 \\
b_1 & b_2 & b_3 \\
c_1 & c_2 & c_3
\end{array}\right]\left(\begin{array}{l}
d_1 \\
d_2 \\
d_3
\end{array}\right)=\left(\begin{array}{l}
a_1 d_1+a_2 d_2+a_3 d_3 \\
b_1 d_1+b_2 d_2+b_3 d_3 \\
c_1 d_1+c_2 d_2+c_3 d_3
\end{array}\right)
$$

而如果是一个对角阵对空间中一个向量作用的话, 计算简便规律明了:

$$
\boldsymbol{\Lambda} \boldsymbol{d}=\left[\begin{array}{ccc}
\lambda_1 & 0 & 0 \\
0 & \lambda_2 & 0 \\
0 & 0 & \lambda_3
\end{array}\right]\left(\begin{array}{l}
d_1 \\
d_2 \\
d_3
\end{array}\right)=\left(\begin{array}{l}
\lambda_1 d_1 \\
\lambda_2 d_2 \\
\lambda_3 d_3
\end{array}\right)
$$

另外, 对角阵 $\boldsymbol{\Lambda}$ 计算的简便性还体现在乘幂的时候, 我们有以下的简便公式:
$\boldsymbol{\Lambda}^n=\left[\begin{array}{llll}\lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_m\end{array}\right]^n=\left[\begin{array}{llll}\lambda_1^n & & \\ & \lambda_2^n & & \\ & & \ddots & \\ & & & \lambda_m^n\end{array}\right]$
$\begin{aligned} & \boldsymbol{A}^2=\left(\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}\right)\left(\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}\right)=\boldsymbol{P} \boldsymbol{\Lambda}\left(\boldsymbol{P}^{-1} \boldsymbol{P}\right) \boldsymbol{\Lambda} \boldsymbol{P}^{-1}=\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}=\boldsymbol{P} \boldsymbol{\Lambda}^2 \boldsymbol{P}^{-1} \\ & \boldsymbol{A}^3=\left(\boldsymbol{P} \boldsymbol{\Lambda}^2 \boldsymbol{P}^{-1}\right)\left(\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}\right)=\boldsymbol{P} \boldsymbol{\Lambda}^3 \boldsymbol{P}^{-1}\end{aligned}$

### 相似对角化
矩阵相似对角化，详见[此处](https://kb.kmath.cn/kbase/detail.aspx?id=498)

### 举例
 用前面镜像变换的例子验证一下如何相似对角化。如图 5-52 所示, 在原坐标系 $\{x o y\}$ 下的镜像变换矩阵和基变换距阵分别为

$$
\boldsymbol{A}=\left[\begin{array}{ll}
0 & 1 \\
1 & 0
\end{array}\right], \quad \boldsymbol{P}=\left[\begin{array}{cc}
1 & -1 \\
1 & 1
\end{array}\right]
$$

那么相似对角化的过程 $A \rightarrow A P \rightarrow P^{-1} A P=\boldsymbol{A}$ 具体是:
 ![图片](/uploads/2024-09/f650d2.jpg)
 镜像变换 $\boldsymbol{A}$ 左乘矩阵 $\boldsymbol{P}$, 就把特征向量组 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2\right\}=\left\{\binom{1}{1},\binom{-1}{1}\right\}$ 变换成了 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}=\left\{\binom{1}{1},\binom{1}{-1}\right\}$,这两个向量的元素都是原坐标系下的数值；再左乘逆矩阵 $\boldsymbol{P}^{-1}=\left[\begin{array}{rr}0.5 & 0.5 \\ -0.5 & 0.5\end{array}\right]$ ，就把 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}$ 变成了新坐标系 $\left\{x^{\prime} y^{\prime}\right\}$ 下的向量组 $\left\{\boldsymbol{p}_1^{\prime}, \boldsymbol{p}_3^{\prime}\right\}=\left\{\binom{1}{0},\binom{0}{-1}\right\}$ ，把 $\boldsymbol{P}_1^{\prime} 、 \boldsymbol{P}_3^{\prime}$ 组成矩阵，就得到了表示镜像变换的新矩阵 $\boldsymbol{\Lambda}=\left[\begin{array}{cc}1 & 0 \\ 0 & -1\end{array}\right]$ 。这是新坐标系 $\left\{x^{\prime} O y^{\prime}\right\}$ 下的镜像变换矩阵。

从图上看到没？镜像变换很简单，就那么三个向量在那里放着没动，就我们自个儿把矩阵啊向量啊乘过来除过去的, 折腾个没完——不为别的, 就为了那个传说中的对角阵。

其实，我们很朴素地想一想特征向量的定义式 $\boldsymbol{A x}=\lambda \boldsymbol{x}$ ，这公式本身就是一种简化：矩阵 $\boldsymbol{A}$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\boldsymbol{A x}$ 等于一个常数（特征值） $\lambda$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\lambda \boldsymbol{x}$ 。这样看来, 矩阵的对角简化与特征向量的联系就不突然了。实际上, 想把 $\boldsymbol{A}$ 对角化, 就要有足够的特征向量形成 $\mathbf{R}^n$ 的一个基。

因此, 线性变换的相似对角化实质是寻找一个适当的坐标系, 使得该变换对这个新的坐标系上的单位向量(或基向量)只做伸缩变换、不做旋转变换。一般实矩阵相似于对角阵的充要条件是它有 $n$ 个线性无关的特征向量这一基本结论, 正因为此, 要知道并不是任何实矩阵都可以相似于对角阵, 但实对称方阵一定可以与对角阵相似 (可对角化)。对这一点一定不要有所怀疑。

## 再看等价矩阵几何意义

等价矩阵的概念可以看成从**同解 (等价) 线性方程组**得来的。
我们知道, 对一个线性方程组经过下列若干个变换: (1) 变换方程的顺序; (2) 用一个非零的数乘以方程; (3) 用一个数乘以方程加到另一个方程上。方程组变为另一个方程组, 这些变换都不影响它的解, 变换前后的方程组都是同解方程组, 也是等价方程组。

把方程组改写成矩阵的形式, 上面的三种变换就是曾经讲过的初等行变换。因此我们可以得到这样的一个结论:
一个矩阵经过初等行变换后得到的任意一个矩阵都与原矩阵等价。
以上的结论大家都没有问题, 但是, 我们也知道另外一个结论就是: 一个矩阵经过初等列变换后得到的任意一个矩阵都与原矩阵等价。

这个结论不能从同解方程组得到, 因为我们解线性方程组只能用初等行变换而不能用初等列变换, 如果对方程组的矩阵进行初等列变换将会把未知量搞乱 (实质上是改变了坐标系), 显然就得不到所给线性方程组的解了 (因为所谓的解是在同一个坐标系下的数值)。

因此, 对矩阵进行初等变换 (包括初等行变换和初等列变换), 是等价变换, 是对方程组矩阵求解变换进行更大的推广。在这种情况下, 只有矩阵的秩是不变的量。

看来不能从解线性方程组得到理解了, 要理解等价矩阵还是需要从线性空间的角度得到彻底理解。前面说, 等价矩阵是在两个有限维向量空间之间的同一个线性映射的表示, 是线性映射在这两个向量空间上的不同基下所对应的矩阵。
理解起来蛮抽象的, 但我们必须要理清楚, 否则没法进一步理解相似和合同的来由。好了
不要怕麻烦, 下面我们就画出两个等价矩阵的图示出来, 见图 5-69。
图中给出了两个一般性的线性空间 $U 、 V$, 一个是三维的, 一个是二维的。在从三维空间到二维线性空间定义了一个线性映射 $\boldsymbol{\Gamma}$, 此映射把一个立方块变换成了一个平行四边形面。

此线性映射 $\boldsymbol{\Gamma}$ 在空间 $U$ 的基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 和 $V$ 的基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2\right\}$ 下的矩阵为 $A, \quad \Gamma$ 在 $U$ 的另外一个基 $\left\{\boldsymbol{s}_1, \boldsymbol{s}_2, \boldsymbol{s}_3\right\}$ 和 $V$ 的另外一个基 $\left\{\boldsymbol{t}_1, \boldsymbol{t}_2\right\}$ 下的矩阵为 $\boldsymbol{B}$ 。一个映射表示为两个矩阵只因基的不同。
![图片](/uploads/2023-11/image_202311074fa7d04.png)

另外, 空间 $U$ 下的基转换矩阵 (或称为过渡矩阵) 为 $\boldsymbol{P}$, 它把基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 转换为 $\left\{\boldsymbol{s}_1, \boldsymbol{s}_2, \boldsymbol{s}_3\right\}$;空间 $V$ 下的基转换矩阵为 $Q$, 它把基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2\right\}$ 转换为 $\left\{\boldsymbol{t}_1, \boldsymbol{t}_2\right\}$ 。

还有, 把映射前后的向量定义一下: 设任一个向量 $\alpha \in U$, 向量 $\alpha$ 在基 $\left\{x_1, x_2, x_3\right\}$ 和 $\left\{s_1, s_2, s_3\right\}$ 下的坐标式为 $x$ 和 $s$; 映射后的向量 $\Gamma(\alpha) \in V$, 向量 $\boldsymbol{\Gamma}(\alpha)$ 在基 $\left\{y_1, y_2\right\}$ 和 $\left\{t_1, t_2\right\}$ 下的坐标式为 $\boldsymbol{y}$ 和 $\boldsymbol{t}$ 。
好了, 矩阵和向量们都到位了, 我们开始研究它们之间的关系吧!
由图示和定义知道, 各个空间内部的向量之间的变换关系为

$$
\boldsymbol{x}=\boldsymbol{P} \boldsymbol{s}, \boldsymbol{y}=\boldsymbol{Q t}
$$

由于 $\boldsymbol{A}$ 是从基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 到基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2\right\}$ 下的映射矩阵，因此有

$$
\boldsymbol{y}=\boldsymbol{A x}
$$

把 $x=P s, y=Q t$ 代入上式, 得到

$$
Q t=A P s
$$

即

$$
\boldsymbol{t}=\left(\boldsymbol{Q}^{-1} A \boldsymbol{P}\right) \boldsymbol{s}
$$

上式的意思就是从向量 $\boldsymbol{s}$ 变换到 $\boldsymbol{t}$ 的矩阵是 $Q^{-1} A P$, 又知道前面的矩阵定义是 $\boldsymbol{t}=\boldsymbol{B} \boldsymbol{s}$, 对比两式, 可说明线性映射 $\Gamma$ 的两个表示矩阵 $A 、 B$ 之间的关系为

$$
\boldsymbol{B}=\boldsymbol{Q}^{-1} \boldsymbol{A P}
$$

因为 $\boldsymbol{P} 、 \boldsymbol{Q}^{-1}$ 都是可逆的方阵, 换个写法就和前面的等价矩阵的定义式 $\boldsymbol{B}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q}$ 相同了。别忘了 $\boldsymbol{P} 、 \boldsymbol{Q}$ 都是基转换矩阵, 看来同一个线性映射 $\boldsymbol{\Gamma}$ 的两个表示矩阵 $\boldsymbol{A} 、 \boldsymbol{B}$ 之间的关系还是与各个基及其变换有关的。

根据等价矩阵的定义 $\boldsymbol{B}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q}$, 其中 $\boldsymbol{P}$ 和 $\boldsymbol{Q}$ 都是满秩矩阵, 对矩阵 $\boldsymbol{A}$ 作等价变换, 相当于对矩阵 $\boldsymbol{A}$ 进行了行变换和列变换, 因为 $\boldsymbol{P}$ 和 $\boldsymbol{Q}$ 之间没有关系, 行变换和列变换各自独立进行,所以可以把任何矩阵化为 $\boldsymbol{E}$ 的形式即最终化为对角矩阵, 或者矩阵标准形。

对 $\boldsymbol{A}$ 进行行的初等运算相当于对 $\boldsymbol{A}$ 左乘相应的矩阵; 对 $\boldsymbol{A}$ 进行列的初等运算相当于对 $\boldsymbol{A}$右乘相应的矩阵。显然, 对任意矩阵 $\boldsymbol{A}$, 经过行 $(\boldsymbol{P})$ 初等运算与列 $(\boldsymbol{Q})$ 初等运算都可以变为一个对角线上是单位方阵或零的对角阵:

$$
\boldsymbol{B}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q}=\left[\begin{array}{cc}
\boldsymbol{E}_k & \mathbf{0} \\
\mathbf{0} & \mathbf{0}
\end{array}\right]
$$

现在看来, 行变换就是矩阵 $\boldsymbol{P}$ 左乘矩阵 $\boldsymbol{A}$, 相当于改变像空间的基坐标系; 列变换就是矩阵 $\boldsymbol{Q}$ 右乘矩阵 $\boldsymbol{A}$, 相当于改变原像空间的基坐标系。两个空间同时扭动坐标轴, 扭来改去, 总能找到一种改法, 让线性映射 $\boldsymbol{A}$ 变成 $\boldsymbol{E}$ 或 $\left[\begin{array}{ll}\boldsymbol{E}_k & 0 \\ 0 & 0\end{array}\right]$ 。比如把 $\boldsymbol{A}$ 变成 $\boldsymbol{E}$, 就是说两边空间的向量坐标完全一样了。

任一矩阵都可通过一系列的初等变换化非对角线上的元素为零, 从而成为对角阵。因此任一矩阵都等价于一个对角阵, 其对角线上非零元素的个数正好是原矩阵的秩。所以说秩是等价变换的不变量。由于对等价变换的限制少, 故适用的范围也广。然而除了秩不变外, 矩阵的其他性质在变换以后就很难反映出来了。

### 相似与等价矩阵几何意义的对比

和我们讲的相似矩阵的几何解释比较起来, 等价矩阵怎么看着跟相似矩阵的几何意义差不多呢? 确实意思很接近。相似矩阵是同一个向量空间里两个坐标基下的同一个线性映射。相似变换就是特殊的等价变换。
当然也可以认为相似变换是两个空间的线性映射, 我暂时同意这个观点, 画一画框图看看:
把上面的等价变换的框图中的基过渡矩阵 $\boldsymbol{Q}$ 改成 $\boldsymbol{P}$, 结果满足相似矩阵的定义式 $\boldsymbol{B}=\boldsymbol{P}^{-1} \boldsymbol{A P}$,成为如图 5-70 所示的结果。
![图片](/uploads/2023-11/image_202311076a3199c.png)
既然两个空间的基过渡矩阵都是方阵 $\boldsymbol{P}$, 这说明两个空间的维数是相同的, 而不应该是图中所画的那样。要么都是二维, 要么都是三维的空间。
好的, 我们引入同构的概念。
同构是线性代数中重要的概念。如果两个线性空间上的映射变换既是单射又是满射, 就称这两个向量空间同构。两个向量空间同构, 那么就有线性映射使这两个线性空间的向量 (或点)一一对应, 而且保持线性不变。这时往往将这两个向量空间看做同一个。对于向量空间, 同构也是等价关系。

因此我们应该将两个向量空间合二为一。所以说, 相似变换是同一个向量空间的变换, 是两个基上的同一个线性变换。

顺着现在的框图画法, 我们重新画一下相似矩阵的几何意义框图, 见图 5-71 (a)。试着和图 5-71（b）比较一下, 有没有更多的启发呢?
![图片](/uploads/2023-11/image_2023110713a0091.png)

### 合同与等价矩阵几何意义的对比

相似矩阵描述的是在不同参照系的同一个变换, 动作规则是相同的。类似地, 合同矩阵描述的是在不同参照系下的同一个内积的度量矩阵。前面我们在定义内积的推广式子时知道:

$$
(x, y)=x^{\mathrm{T}} S y, S=P^{\mathrm{T}} P
$$

其中方阵 $\boldsymbol{S}$ 就是度量矩阵, 度量矩阵是由基向量所构成的过渡方阵 $\boldsymbol{P}$ 与其转置的乘积得到的。
好了, 既然度量矩阵 $S$ 是由基的过渡矩阵所决定的, 那么每更换一次基坐标系就会有一个新的度量矩阵比如 $\boldsymbol{T}$ 出来。这些度量矩阵 $S 、 T$ 对应着同一个内积。有人会问, 这些度量矩阵肯定有关系, 这个关系是啥? 这个问题好, 太有关系了, 这个关系就是合同关系: $S$ 合同于 $\boldsymbol{T}$ 。

为了看出来合同关系也是等价关系, 我们也沿袭等价关系框图的画法给出空间中两个合同矩阵的示意图, 见图 5-72。
图中显示, 在一个基为 $\left\{x_1, x_2, x_3\right\}$ 的三维空间里, 首先有两个向量 $a 、 b$ 及其内积 $a \cdot b$ 的值。如果这个初始的基取所谓的世界坐标系, 那么向量 $\boldsymbol{a} 、 \boldsymbol{b}$ 的内积值就是一个通用的国际标准值。这个值在对基坐标系合同变换时将保持数值不变。
不确定? 参照图 5-72, 简单地推导一下就可以确认了:
显然, 图中显示了三个基坐标系互相转换的关系, 而合同矩阵作为内积度量矩阵, 也是和基联系在一起的。为了简化推导, 我们这里把基向量都看成行向量。因为度量矩阵的定义是矩阵及其转置的积, 当然列向量变成行向量, 度量矩阵仍然不变。

在基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 到基 $\left\{y_1, \boldsymbol{y}_2, \boldsymbol{y}_3\right\}$ 的转换时, 转换过渡矩阵定义为 $\boldsymbol{P}_1$, 那么内积度量矩阵定义为 $\boldsymbol{A}$, 且有 $\boldsymbol{A}=\boldsymbol{P}_1 \boldsymbol{P}_1^{\mathrm{T}}=\boldsymbol{P}_1^{\mathrm{T}} \boldsymbol{P}_1$ 。同时在基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 到另一个基 $\left\{z_1, z_2, z_3\right\}$ 的转换时, 转换过渡矩阵定义为 $\boldsymbol{P}_2$, 那么内积度量矩阵定义为 $\boldsymbol{B}$, 且有 $\boldsymbol{B}=\boldsymbol{P}_2 \boldsymbol{P}_2^{\mathrm{T}}=\boldsymbol{P}_2^{\mathrm{T}} \boldsymbol{P}_2$ 。

![图片](/uploads/2023-11/image_202311077af2324.png)
如果基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2, \boldsymbol{y}_3\right\}$ 到基 $\left\{\boldsymbol{z}_1, \boldsymbol{z}_2, \boldsymbol{z}_3\right\}$ 的过渡矩阵为 $\boldsymbol{P}$, 则有 $\boldsymbol{P}_2=\boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}$ 。好, 至此我们把这三个基之间的互换关系都定义好了, 下面推导 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 之间的关系了。把 $\boldsymbol{P}_2=\boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}$ 代入 $\boldsymbol{B}=\boldsymbol{P}_2^{\mathrm{T}} \boldsymbol{P}$, 有

$$
\boldsymbol{B}=\boldsymbol{P}_2^{\mathrm{T}} \boldsymbol{P}_2=\left(\boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}\right)^{\mathrm{T}} \boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}=\boldsymbol{P} \boldsymbol{P}_1 \boldsymbol{P}_1^{\mathrm{T}} \boldsymbol{P}^{\mathrm{T}}=\boldsymbol{P}\left(\boldsymbol{P}_1 \boldsymbol{P}_1^{\mathrm{T}}\right) \boldsymbol{P}^{\mathrm{T}}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{P}^{\mathrm{T}}
$$

## 后续课程
《复变函数与积分》变换是线性代数的后续可成，理解了线性变换后，就可以理解“复变函数”了
复数$f(z)$ 表示一个平面到另外一个平面的图像变换
 ![图片](/uploads/2025-01/c52438.jpg){width=400px}
 有兴趣的可以参考[复变函数](https://kb.kmath.cn/kbase/detail.aspx?id=1864)

比如一个复数$f(z)$ 可以变换为各种图形。
 
 ![图片](/uploads/2025-01/12c7dd.jpg){width=400px}

刷题

做题，是检验是否掌握数学的唯一真理

上一篇：附录2：矩阵的等价、相似与合同意义

下一篇：线性代数公式

本文对您是否有用？有用 (0) 无用 (0)