科数网
学习
高中数学
高中物理
微积分
线性代数
概率论
人工智能
赞助本站
在线教程
线性代数
第二篇 矩阵
矩阵的等价、相似与合同意义
日期:
2024-01-12 16:29
查看:
260
次
编辑
矩阵的等价、相似与合同意义
据说, 整个线性代数里矩阵之间有三种最典型的关系: 矩阵相似 (similar)、矩阵等价 (equivalent) 和矩阵合同(congruent)。具体的定义如下: (1) $\boldsymbol{A}$ 和 $B$ 等价 $\Leftrightarrow$ 存在可逆矩阵 $\boldsymbol{P}$ 和 $\boldsymbol{Q}$, 使得 $B=P A Q$; (2) $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 相似 $\Leftrightarrow$ 存在可逆矩阵 $\boldsymbol{P}$, 使得 $\boldsymbol{B}=\boldsymbol{P}^{-1} \boldsymbol{A P}$; (3) $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 合同 $\Leftrightarrow$ 存在可逆矩阵 $\boldsymbol{C}$, 使得 $\boldsymbol{B}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{C}$ 。 注意这三种关系的联系和差别。据定义可以知道, 这三种矩阵关系都是等价关系。其中等价关系是最弱的一个关系: 两个矩阵相似, 或两个矩阵合同, 那这两个矩阵一定是等价的, 但是反过来不成立。相似与合同矩阵之间不能够互相推导。但是如果两个实对称矩阵是相似的,那肯定是合同的; 反之也成立。如果从整体上来看矩阵之间的三种关系, 我们会想到用集合来表示三者之间的关系(见图 5-68)。集合的表示更加清晰地展现了矩阵等价、相似、合同三者之间的关系。 ![图片](/uploads/2023-11/image_20231107ff573ba.png) 图中显示, 相似的矩阵不一定合同, 合同的矩阵不一定相似。但相似和合同有交集, 就是有既相似又合同的矩阵。若转换矩阵 $\boldsymbol{P}^{-1}=\boldsymbol{P}^{\mathrm{T}}$, 这两定义变成相同, 则 $\boldsymbol{A} 、 \boldsymbol{B}$ 两个矩阵既是相似的又是合同的, 但具备这种性质的矩阵 $\boldsymbol{P}$, 只有正交矩阵一类, 因为这正是正交矩阵的定义。 接着, 实对称矩阵一定存在正交转换矩阵 $\boldsymbol{P}$, 满足相似和合同的定义式, 因此, 如果两个实对称矩阵是相似的, 那肯定是合同的。 关于这三个矩阵的关系的几何意义已有结论, 包括我们前面刚讨论过的相似矩阵的几何意义也一起合并在这里, 就是: 两个有限维向量空间之间的同一个线性映射,其在这两个向量空间上的不同基下所对应的矩阵之间的关系就是等价关系。 一个有限维向量空间上的同一个线性变换( 或称线性算子 ), 其在不同基下所对应的矩阵之间的关系是相似关系。 一个有限维向量空间上的同一个双线性函数或内积 其在两个基下的度量矩阵是相合关系。 下面分别研究它们几何意义之间的区别和联系。 ## 等价矩阵几何意义 等价矩阵的概念可以看成从同解 (等价) 线性方程组得来的。 我们知道, 对一个线性方程组经过下列若干个变换: (1) 变换方程的顺序; (2) 用一个非零的数乘以方程; (3) 用一个数乘以方程加到另一个方程上。方程组变为另一个方程组, 这些变换都不影响它的解, 变换前后的方程组都是同解方程组, 也是等价方程组。 把方程组改写成矩阵的形式, 上面的三种变换就是曾经讲过的初等行变换。因此我们可以得到这样的一个结论: 一个矩阵经过初等行变换后得到的任意一个矩阵都与原矩阵等价。 以上的结论大家都没有问题, 但是, 我们也知道另外一个结论就是: 一个矩阵经过初等列变换后得到的任意一个矩阵都与原矩阵等价。 这个结论不能从同解方程组得到, 因为我们解线性方程组只能用初等行变换而不能用初等列变换, 如果对方程组的矩阵进行初等列变换将会把未知量搞乱 (实质上是改变了坐标系), 显然就得不到所给线性方程组的解了 (因为所谓的解是在同一个坐标系下的数值)。 因此, 对矩阵进行初等变换 (包括初等行变换和初等列变换), 是等价变换, 是对方程组矩阵求解变换进行更大的推广。在这种情况下, 只有矩阵的秩是不变的量。 看来不能从解线性方程组得到理解了, 要理解等价矩阵还是需要从线性空间的角度得到彻底理解。前面说, 等价矩阵是在两个有限维向量空间之间的同一个线性映射的表示, 是线性映射在这两个向量空间上的不同基下所对应的矩阵。 理解起来蛮抽象的, 但我们必须要理清楚, 否则没法进一步理解相似和合同的来由。好了 不要怕麻烦, 下面我们就画出两个等价矩阵的图示出来, 见图 5-69。 图中给出了两个一般性的线性空间 $U 、 V$, 一个是三维的, 一个是二维的。在从三维空间到二维线性空间定义了一个线性映射 $\boldsymbol{\Gamma}$, 此映射把一个立方块变换成了一个平行四边形面。 此线性映射 $\boldsymbol{\Gamma}$ 在空间 $U$ 的基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 和 $V$ 的基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2\right\}$ 下的矩阵为 $A, \quad \Gamma$ 在 $U$ 的另外一个基 $\left\{\boldsymbol{s}_1, \boldsymbol{s}_2, \boldsymbol{s}_3\right\}$ 和 $V$ 的另外一个基 $\left\{\boldsymbol{t}_1, \boldsymbol{t}_2\right\}$ 下的矩阵为 $\boldsymbol{B}$ 。一个映射表示为两个矩阵只因基的不同。 ![图片](/uploads/2023-11/image_202311074fa7d04.png) 另外, 空间 $U$ 下的基转换矩阵 (或称为过渡矩阵) 为 $\boldsymbol{P}$, 它把基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 转换为 $\left\{\boldsymbol{s}_1, \boldsymbol{s}_2, \boldsymbol{s}_3\right\}$;空间 $V$ 下的基转换矩阵为 $Q$, 它把基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2\right\}$ 转换为 $\left\{\boldsymbol{t}_1, \boldsymbol{t}_2\right\}$ 。 还有, 把映射前后的向量定义一下: 设任一个向量 $\alpha \in U$, 向量 $\alpha$ 在基 $\left\{x_1, x_2, x_3\right\}$ 和 $\left\{s_1, s_2, s_3\right\}$ 下的坐标式为 $x$ 和 $s$; 映射后的向量 $\Gamma(\alpha) \in V$, 向量 $\boldsymbol{\Gamma}(\alpha)$ 在基 $\left\{y_1, y_2\right\}$ 和 $\left\{t_1, t_2\right\}$ 下的坐标式为 $\boldsymbol{y}$ 和 $\boldsymbol{t}$ 。 好了, 矩阵和向量们都到位了, 我们开始研究它们之间的关系吧! 由图示和定义知道, 各个空间内部的向量之间的变换关系为 $$ \boldsymbol{x}=\boldsymbol{P} \boldsymbol{s}, \boldsymbol{y}=\boldsymbol{Q t} $$ 由于 $\boldsymbol{A}$ 是从基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 到基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2\right\}$ 下的映射矩阵,因此有 $$ \boldsymbol{y}=\boldsymbol{A x} $$ 把 $x=P s, y=Q t$ 代入上式, 得到 $$ Q t=A P s $$ 即 $$ \boldsymbol{t}=\left(\boldsymbol{Q}^{-1} A \boldsymbol{P}\right) \boldsymbol{s} $$ 上式的意思就是从向量 $\boldsymbol{s}$ 变换到 $\boldsymbol{t}$ 的矩阵是 $Q^{-1} A P$, 又知道前面的矩阵定义是 $\boldsymbol{t}=\boldsymbol{B} \boldsymbol{s}$, 对比两式, 可说明线性映射 $\Gamma$ 的两个表示矩阵 $A 、 B$ 之间的关系为 $$ \boldsymbol{B}=\boldsymbol{Q}^{-1} \boldsymbol{A P} $$ 因为 $\boldsymbol{P} 、 \boldsymbol{Q}^{-1}$ 都是可逆的方阵, 换个写法就和前面的等价矩阵的定义式 $\boldsymbol{B}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q}$ 相同了。别忘了 $\boldsymbol{P} 、 \boldsymbol{Q}$ 都是基转换矩阵, 看来同一个线性映射 $\boldsymbol{\Gamma}$ 的两个表示矩阵 $\boldsymbol{A} 、 \boldsymbol{B}$ 之间的关系还是与各个基及其变换有关的。 根据等价矩阵的定义 $\boldsymbol{B}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q}$, 其中 $\boldsymbol{P}$ 和 $\boldsymbol{Q}$ 都是满秩矩阵, 对矩阵 $\boldsymbol{A}$ 作等价变换, 相当于对矩阵 $\boldsymbol{A}$ 进行了行变换和列变换, 因为 $\boldsymbol{P}$ 和 $\boldsymbol{Q}$ 之间没有关系, 行变换和列变换各自独立进行,所以可以把任何矩阵化为 $\boldsymbol{E}$ 的形式即最终化为对角矩阵, 或者矩阵标准形。 对 $\boldsymbol{A}$ 进行行的初等运算相当于对 $\boldsymbol{A}$ 左乘相应的矩阵; 对 $\boldsymbol{A}$ 进行列的初等运算相当于对 $\boldsymbol{A}$右乘相应的矩阵。显然, 对任意矩阵 $\boldsymbol{A}$, 经过行 $(\boldsymbol{P})$ 初等运算与列 $(\boldsymbol{Q})$ 初等运算都可以变为一个对角线上是单位方阵或零的对角阵: $$ \boldsymbol{B}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q}=\left[\begin{array}{cc} \boldsymbol{E}_k & \mathbf{0} \\ \mathbf{0} & \mathbf{0} \end{array}\right] $$ 现在看来, 行变换就是矩阵 $\boldsymbol{P}$ 左乘矩阵 $\boldsymbol{A}$, 相当于改变像空间的基坐标系; 列变换就是矩阵 $\boldsymbol{Q}$ 右乘矩阵 $\boldsymbol{A}$, 相当于改变原像空间的基坐标系。两个空间同时扭动坐标轴, 扭来改去, 总能找到一种改法, 让线性映射 $\boldsymbol{A}$ 变成 $\boldsymbol{E}$ 或 $\left[\begin{array}{ll}\boldsymbol{E}_k & 0 \\ 0 & 0\end{array}\right]$ 。比如把 $\boldsymbol{A}$ 变成 $\boldsymbol{E}$, 就是说两边空间的向量坐标完全一样了。 任一矩阵都可通过一系列的初等变换化非对角线上的元素为零, 从而成为对角阵。因此任一矩阵都等价于一个对角阵, 其对角线上非零元素的个数正好是原矩阵的秩。所以说秩是等价变换的不变量。由于对等价变换的限制少, 故适用的范围也广。然而除了秩不变外, 矩阵的其他性质在变换以后就很难反映出来了。 ## 相似与等价矩阵几何意义的对比 和我们讲的相似矩阵的几何解释比较起来, 等价矩阵怎么看着跟相似矩阵的几何意义差不多呢? 确实意思很接近。相似矩阵是同一个向量空间里两个坐标基下的同一个线性映射。相似变换就是特殊的等价变换。 当然也可以认为相似变换是两个空间的线性映射, 我暂时同意这个观点, 画一画框图看看: 把上面的等价变换的框图中的基过渡矩阵 $\boldsymbol{Q}$ 改成 $\boldsymbol{P}$, 结果满足相似矩阵的定义式 $\boldsymbol{B}=\boldsymbol{P}^{-1} \boldsymbol{A P}$,成为如图 5-70 所示的结果。 ![图片](/uploads/2023-11/image_202311076a3199c.png) 既然两个空间的基过渡矩阵都是方阵 $\boldsymbol{P}$, 这说明两个空间的维数是相同的, 而不应该是图中所画的那样。要么都是二维, 要么都是三维的空间。 好的, 我们引入同构的概念。 同构是线性代数中重要的概念。如果两个线性空间上的映射变换既是单射又是满射, 就称这两个向量空间同构。两个向量空间同构, 那么就有线性映射使这两个线性空间的向量 (或点)一一对应, 而且保持线性不变。这时往往将这两个向量空间看做同一个。对于向量空间, 同构也是等价关系。 因此我们应该将两个向量空间合二为一。所以说, 相似变换是同一个向量空间的变换, 是两个基上的同一个线性变换。 顺着现在的框图画法, 我们重新画一下相似矩阵的几何意义框图, 见图 5-71 (a)。试着和图 5-71(b)比较一下, 有没有更多的启发呢? ![图片](/uploads/2023-11/image_2023110713a0091.png) ## 合同与等价矩阵几何意义的对比 相似矩阵描述的是在不同参照系的同一个变换, 动作规则是相同的。类似地, 合同矩阵描述的是在不同参照系下的同一个内积的度量矩阵。前面我们在定义内积的推广式子时知道: $$ (x, y)=x^{\mathrm{T}} S y, S=P^{\mathrm{T}} P $$ 其中方阵 $\boldsymbol{S}$ 就是度量矩阵, 度量矩阵是由基向量所构成的过渡方阵 $\boldsymbol{P}$ 与其转置的乘积得到的。 好了, 既然度量矩阵 $S$ 是由基的过渡矩阵所决定的, 那么每更换一次基坐标系就会有一个新的度量矩阵比如 $\boldsymbol{T}$ 出来。这些度量矩阵 $S 、 T$ 对应着同一个内积。有人会问, 这些度量矩阵肯定有关系, 这个关系是啥? 这个问题好, 太有关系了, 这个关系就是合同关系: $S$ 合同于 $\boldsymbol{T}$ 。 为了看出来合同关系也是等价关系, 我们也沿袭等价关系框图的画法给出空间中两个合同矩阵的示意图, 见图 5-72。 图中显示, 在一个基为 $\left\{x_1, x_2, x_3\right\}$ 的三维空间里, 首先有两个向量 $a 、 b$ 及其内积 $a \cdot b$ 的值。如果这个初始的基取所谓的世界坐标系, 那么向量 $\boldsymbol{a} 、 \boldsymbol{b}$ 的内积值就是一个通用的国际标准值。这个值在对基坐标系合同变换时将保持数值不变。 不确定? 参照图 5-72, 简单地推导一下就可以确认了: 显然, 图中显示了三个基坐标系互相转换的关系, 而合同矩阵作为内积度量矩阵, 也是和基联系在一起的。为了简化推导, 我们这里把基向量都看成行向量。因为度量矩阵的定义是矩阵及其转置的积, 当然列向量变成行向量, 度量矩阵仍然不变。 在基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 到基 $\left\{y_1, \boldsymbol{y}_2, \boldsymbol{y}_3\right\}$ 的转换时, 转换过渡矩阵定义为 $\boldsymbol{P}_1$, 那么内积度量矩阵定义为 $\boldsymbol{A}$, 且有 $\boldsymbol{A}=\boldsymbol{P}_1 \boldsymbol{P}_1^{\mathrm{T}}=\boldsymbol{P}_1^{\mathrm{T}} \boldsymbol{P}_1$ 。同时在基 $\left\{\boldsymbol{x}_1, \boldsymbol{x}_2, \boldsymbol{x}_3\right\}$ 到另一个基 $\left\{z_1, z_2, z_3\right\}$ 的转换时, 转换过渡矩阵定义为 $\boldsymbol{P}_2$, 那么内积度量矩阵定义为 $\boldsymbol{B}$, 且有 $\boldsymbol{B}=\boldsymbol{P}_2 \boldsymbol{P}_2^{\mathrm{T}}=\boldsymbol{P}_2^{\mathrm{T}} \boldsymbol{P}_2$ 。 ![图片](/uploads/2023-11/image_202311077af2324.png) 如果基 $\left\{\boldsymbol{y}_1, \boldsymbol{y}_2, \boldsymbol{y}_3\right\}$ 到基 $\left\{\boldsymbol{z}_1, \boldsymbol{z}_2, \boldsymbol{z}_3\right\}$ 的过渡矩阵为 $\boldsymbol{P}$, 则有 $\boldsymbol{P}_2=\boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}$ 。好, 至此我们把这三个基之间的互换关系都定义好了, 下面推导 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 之间的关系了。把 $\boldsymbol{P}_2=\boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}$ 代入 $\boldsymbol{B}=\boldsymbol{P}_2^{\mathrm{T}} \boldsymbol{P}$, 有 $$ \boldsymbol{B}=\boldsymbol{P}_2^{\mathrm{T}} \boldsymbol{P}_2=\left(\boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}\right)^{\mathrm{T}} \boldsymbol{P}_1 \boldsymbol{P}^{\mathrm{T}}=\boldsymbol{P} \boldsymbol{P}_1 \boldsymbol{P}_1^{\mathrm{T}} \boldsymbol{P}^{\mathrm{T}}=\boldsymbol{P}\left(\boldsymbol{P}_1 \boldsymbol{P}_1^{\mathrm{T}}\right) \boldsymbol{P}^{\mathrm{T}}=\boldsymbol{P} \boldsymbol{A} \boldsymbol{P}^{\mathrm{T}} $$ 更多意义请参考 http://kb.kmath.cn/kbase/detail.aspx?id=497
上一篇:
初等矩阵与逆矩阵的应用
下一篇:
雅可比矩阵及其行列式的几何意义
本文对您是否有用?
有用
(
0
)
无用
(
0
)
赞助我们
0
篇笔记
写笔记
更多笔记
提交笔记