科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
线性代数
附录3:再看线性代数的意义
最后
更新:
2025-01-09 21:16
查看:
393
次
反馈
同步训练
附录3:再看线性代数的意义
在附录2里,介绍了矩阵等价。相似与合同的意义,这里进一步解释《线性变换》。线性变换可以有两种模式:(1)同一个空间里不同基坐标变换和(2)不同空间里不同基坐标变换。 > 通俗的说,第一种模式,类似A和B在戏台上看起,虽然看的角度不同,但是核心是同一个演员。第二种模式,一个蜡烛照在地球仪上,墙上出现地球的影子。这样球体的三维空间就被映射到平面上二维空间。 ### 矩阵相似例题 上一节,介绍了一个坐标系镜像的例子,再来看一下这个例子。 `例` 设有一线性变换: 如图 5-49所示, 它将任意向量 $\left(\begin{array}{l}x \\ y\end{array}\right)$ 映射为关于 $45^{\circ}$ 直线的镜像 $\left(\begin{array}{l}y \\ x\end{array}\right)$ 。  解:取直角坐标系, 其标准正交基 $\boldsymbol{e}_1=\left(\begin{array}{l}1 \\ 0\end{array}\right)$ 和 $\boldsymbol{e}_2=\left(\begin{array}{l}0 \\ 1\end{array}\right)$, 根据线性变换的矩阵定理, 则相应的线性变换矩阵 $A$ 容易求出。因为 $A$ 将 $e_1$ 映射为 $e_2$, 将 $e_2$ 映射为 $e_1$, 所以这个镜像映射在基 $e_1$ 和 $e_2$ 下的坐标表达式为 $$ \left(\begin{array}{l} y \\ x \end{array}\right)=\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right]\left(\begin{array}{l} x \\ y \end{array}\right) $$ 其中把变换矩阵记为 $[\boldsymbol{A}]_e=\left[\begin{array}{ll}0 & 1 \\ 1 & 0\end{array}\right]$, 表示矩阵 $\boldsymbol{A}$ 是以 $\boldsymbol{e}_i$ 为基的。 下面我们再找一个新的基底 (见图 5-50), 使得新的基向量之一 $\boldsymbol{e}_1{ }^{\prime}$ 沿着 $45^{\circ}$ 直线, 即 $\boldsymbol{e}_1{ }^{\prime}=\left(\begin{array}{l}1 \\ 1\end{array}\right)$,而另一个基向量与之垂直, 即 $\boldsymbol{e}_2{ }^{\prime}=\left(\begin{array}{c}-1 \\ 1\end{array}\right)$ 。则新基与旧基的转换关系为 $$ \left\{\begin{array}{l} \boldsymbol{e}_1^{\prime}=\boldsymbol{e}_1+\boldsymbol{e}_2 \\ \boldsymbol{e}_2^{\prime}=-\boldsymbol{e}_1+\boldsymbol{e}_2 \end{array}\right. $$ 将其改写为 $$ \left(e_1^{\prime}, e_2^{\prime}\right)=\left(e_1, e_2\right)\left[\begin{array}{cc} 1 & -1 \\ 1 & 1 \end{array}\right] $$ 其中把基变换矩阵记为 $\boldsymbol{P}=\left[\begin{array}{cc}1 & -1 \\ 1 & 1\end{array}\right]$ 。  在这组新基上, 这个镜像运动的线性变换 $A$ 事实上被简化了。因为新基向量 $e_1{ }^{\prime}$ 在 $45^{\circ}$ 直线上,它是它本身的镜像, 即 $A e_1{ }^{\prime}=e_1{ }^{\prime}$ 。另一个新基向量 $\boldsymbol{e}_2{ }^{\prime}$ 正好被翻转过来, 即 $A e_2{ }^{\prime}=-e_2{ }^{\prime}$ 。于是,原矩阵 $\boldsymbol{A}$ 所表示的线性变换在新基 $\boldsymbol{e}_1{ }^{\prime}$ 和 $\boldsymbol{e}_2{ }^{\prime}$ 下的坐标表达式为 $$ \left(\begin{array}{c} x^{\prime} \\ -y^{\prime} \end{array}\right)=\left[\begin{array}{cc} 1 & 0 \\ 0 & -1 \end{array}\right]\left(\begin{array}{l} x^{\prime} \\ y^{\prime} \end{array}\right) $$ 其中把线性变换矩阵记为 $[\boldsymbol{B}]_{e^{\prime}}=\left[\begin{array}{cc}1 & 0 \\ 0 & -1\end{array}\right]$, 表示矩阵 $\boldsymbol{B}$ 是以 $\boldsymbol{e}_{\boldsymbol{i}}{ }^{\prime}$ 为基的。 这个矩阵 $\boldsymbol{B}$ 与单位矩阵很接近, 确实比较简单。 **这里矩阵$A$ 和$B$ 是一对相似矩阵, 因为他们都是表示的同一变换 “关于固定的一直线的镜像映射”。** 好了, 下面把这个例子捋一捋: (1) 矩阵 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 是一对相似矩阵, 因为哥俩都是表示的同一变换 “关于固定的一直线的镜像映射”。 (2) 矩阵 $\boldsymbol{P}$ 是基变换矩阵, 把一个旧基换成另一个新基, 乘以 $\boldsymbol{P}$;回去是乘以 $\boldsymbol{P}^{-1}$ 。详见[过渡矩阵](https://kb.kmath.cn/kbase/detail.aspx?id=490) (3) 矩阵 $\boldsymbol{P}$ 的每个列都是由 $\boldsymbol{A}$ 的特征向量组成的,特征向量用旧基上的坐标表示。 (4) 矩阵 $\boldsymbol{B}$ 是简单的对角阵, 对角上的元素就是特征值, 从左上到右下排列的特征值分别对应着 $\boldsymbol{P}$ 矩阵的从左到右排列的特征向量。 (5) $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 俩矩阵既然表示同样的线性变换, 因此特征值也是同样的, 它和基没关系。 **相似矩阵 $A$ 和 $B$ 是同一个线性变换在两个不同基下的表示矩阵。** 这也是相似矩阵的几何意义啊。 打个比方说, 就像两个观众看一场演出, 台上演员的某一演出动作就是一个变换, 是实实在在的、唯物主义的不以谁看为转移的一个变换。但是两个观众张三和李四的位置不一样, 从不同角度观看, 这就是取的坐标不同, 基不同了。显然, 基不同, 看到的演员的动作也不同了。扮演猴子的演员在舞台中间从左往右翻跟头, 假设演员功夫好, 翻的是标准的圆周运动。左前方的张三看起来猴子的 “跟头” 变换是顺时针椭圆周运动, 此运动表示为矩阵 $A$; 在后方一角落的李四 (李四是剧团工作人员, 在帷幕后面闲看) 看起来猴子的 “跟头” 变换是逆时针椭圆周运动, 此运动表示为矩阵 $\boldsymbol{B}$ 。两个人看到的运动应是差不多的, 很相似, 因此 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 称为相似矩阵 (注意: 不止这两人, 所有的观众看到的运动都是相似矩阵)。 还有第三个人王二麻子很明智, 知道两个人看的运动有些走样了。就到观众席的正中央正襟危坐观看, 呵! 标准的圆周运动。王二麻子告诉我们: 在一大堆相似矩阵中, 正面的矩阵看起来不走样, 最爽 (矩阵有用啊, 证明了为何前排中间的位置票价最贵啊)。 下面咱们回归到两个基下的线性变换的讨论上来。 如图 5-48 所示, 矩阵 $\boldsymbol{A}$ 表示一个线性变换, 把一个向量 $\boldsymbol{x}$ 变换成另一个向量 $\boldsymbol{A x}: \boldsymbol{x} \rightarrow \boldsymbol{A x}$ (这是张三看到的演出动作); 在另外一个基下 (等于换了一个坐标系, 改变了观察角度), 同样的一个变换动作表示成了 $\boldsymbol{x^{\prime}} \rightarrow \boldsymbol{B x'}$ (这是李四看到的演出动作)。 从张三的坐标系变换到李四的坐标系, 就要乘以一个 $\boldsymbol{P}$ (图 5-48中给出的是向量 $\boldsymbol{x}$ 的变换,因此乘以 $\boldsymbol{P}^{-1}$ ); 现实地操作就是张三跑到李四的座位上去就可以了。  这里就描述矩阵在现实世界对应的变化。 ## 矩阵相似对角化 矩阵的对角化有不同的方法, 但我们常常讲的矩阵的对角化, 多数是所谓的相似对角化。 鉴于大家都有花大价钱买甲等票到王二麻子舞台正前方的位置看戏的习惯, 数学家当然也喜欢把一个矩阵相似变换到另一个比较爽的矩阵上去进一步研究这个线性变换。这个最爽的位置就是用特征向量当坐标轴, 最爽的矩阵就是对角阵, 次一些的当算约当阵了。实际上, 这是一个常见的工程处理方法, 把一个对象从一个领域变换到另外一个领域去以便研究(当然要保证被研究对象的本质不能被变换掉)。 1. 相似对角化的好处 举个矩阵相似的事例, 比如我们开车郊游 (图 5-51), 到乡野别院度假。从地点 $\boldsymbol{x}$ 驾驶到目的地 $\boldsymbol{A x}$, 走眼前的小道不太方便, 那就绕个弯, 先从 $\boldsymbol{x}$ 过桥到 $\boldsymbol{x}^{\prime}$, 从 $\boldsymbol{x}^{\prime}$ 到 $\boldsymbol{B} \boldsymbol{x}^{\prime}$ 的行车就很方便, 处理简单。可到了 $B x^{\prime}$ 还没完啊, 度假目的地是 $A x$ 啊。好, 再过桥把 $B x^{\prime}$ 变到 $A x$ 。 确实, 走笔直的马路当然比走九曲十八弯爽了。这里的马路也是对角阵。数学上的对角阵看起来爽, 除了对角线上外其他的元素都是 0 啊, 美的东西必然简洁, 观赏性较强。作为数学工具, 当然计算起来就比较好用了。  假如一个矩阵对空间中一个向量作用, 得到一个新向量: $$ \boldsymbol{A} \boldsymbol{d}=\left[\begin{array}{lll} a_1 & a_2 & a_3 \\ b_1 & b_2 & b_3 \\ c_1 & c_2 & c_3 \end{array}\right]\left(\begin{array}{l} d_1 \\ d_2 \\ d_3 \end{array}\right)=\left(\begin{array}{l} a_1 d_1+a_2 d_2+a_3 d_3 \\ b_1 d_1+b_2 d_2+b_3 d_3 \\ c_1 d_1+c_2 d_2+c_3 d_3 \end{array}\right) $$ 而如果是一个对角阵对空间中一个向量作用的话, 计算简便规律明了: $$ \boldsymbol{\Lambda} \boldsymbol{d}=\left[\begin{array}{ccc} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 0 \\ 0 & 0 & \lambda_3 \end{array}\right]\left(\begin{array}{l} d_1 \\ d_2 \\ d_3 \end{array}\right)=\left(\begin{array}{l} \lambda_1 d_1 \\ \lambda_2 d_2 \\ \lambda_3 d_3 \end{array}\right) $$ 另外, 对角阵 $\boldsymbol{\Lambda}$ 计算的简便性还体现在乘幂的时候, 我们有以下的简便公式: $\boldsymbol{\Lambda}^n=\left[\begin{array}{llll}\lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_m\end{array}\right]^n=\left[\begin{array}{llll}\lambda_1^n & & \\ & \lambda_2^n & & \\ & & \ddots & \\ & & & \lambda_m^n\end{array}\right]$ $\begin{aligned} & \boldsymbol{A}^2=\left(\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}\right)\left(\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}\right)=\boldsymbol{P} \boldsymbol{\Lambda}\left(\boldsymbol{P}^{-1} \boldsymbol{P}\right) \boldsymbol{\Lambda} \boldsymbol{P}^{-1}=\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}=\boldsymbol{P} \boldsymbol{\Lambda}^2 \boldsymbol{P}^{-1} \\ & \boldsymbol{A}^3=\left(\boldsymbol{P} \boldsymbol{\Lambda}^2 \boldsymbol{P}^{-1}\right)\left(\boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{P}^{-1}\right)=\boldsymbol{P} \boldsymbol{\Lambda}^3 \boldsymbol{P}^{-1}\end{aligned}$ ### 相似对角化 矩阵相似对角化,详见[此处](https://kb.kmath.cn/kbase/detail.aspx?id=498) ### 举例 用前面镜像变换的例子验证一下如何相似对角化。如图 5-52 所示, 在原坐标系 $\{x o y\}$ 下的镜像变换矩阵和基变换距阵分别为 $$ \boldsymbol{A}=\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right], \quad \boldsymbol{P}=\left[\begin{array}{cc} 1 & -1 \\ 1 & 1 \end{array}\right] $$ 那么相似对角化的过程 $A \rightarrow A P \rightarrow P^{-1} A P=\boldsymbol{A}$ 具体是:  镜像变换 $\boldsymbol{A}$ 左乘矩阵 $\boldsymbol{P}$, 就把特征向量组 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2\right\}=\left\{\binom{1}{1},\binom{-1}{1}\right\}$ 变换成了 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}=\left\{\binom{1}{1},\binom{1}{-1}\right\}$,这两个向量的元素都是原坐标系下的数值;再左乘逆矩阵 $\boldsymbol{P}^{-1}=\left[\begin{array}{rr}0.5 & 0.5 \\ -0.5 & 0.5\end{array}\right]$ ,就把 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}$ 变成了新坐标系 $\left\{x^{\prime} y^{\prime}\right\}$ 下的向量组 $\left\{\boldsymbol{p}_1^{\prime}, \boldsymbol{p}_3^{\prime}\right\}=\left\{\binom{1}{0},\binom{0}{-1}\right\}$ ,把 $\boldsymbol{P}_1^{\prime} 、 \boldsymbol{P}_3^{\prime}$ 组成矩阵,就得到了表示镜像变换的新矩阵 $\boldsymbol{\Lambda}=\left[\begin{array}{cc}1 & 0 \\ 0 & -1\end{array}\right]$ 。这是新坐标系 $\left\{x^{\prime} O y^{\prime}\right\}$ 下的镜像变换矩阵。 从图上看到没?镜像变换很简单,就那么三个向量在那里放着没动,就我们自个儿把矩阵啊向量啊乘过来除过去的, 折腾个没完——不为别的, 就为了那个传说中的对角阵。 其实,我们很朴素地想一想特征向量的定义式 $\boldsymbol{A x}=\lambda \boldsymbol{x}$ ,这公式本身就是一种简化:矩阵 $\boldsymbol{A}$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\boldsymbol{A x}$ 等于一个常数(特征值) $\lambda$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\lambda \boldsymbol{x}$ 。这样看来, 矩阵的对角简化与特征向量的联系就不突然了。实际上, 想把 $\boldsymbol{A}$ 对角化, 就要有足够的特征向量形成 $\mathbf{R}^n$ 的一个基。 因此, 线性变换的相似对角化实质是寻找一个适当的坐标系, 使得该变换对这个新的坐标系上的单位向量(或基向量)只做伸缩变换、不做旋转变换。一般实矩阵相似于对角阵的充要条件是它有 $n$ 个线性无关的特征向量这一基本结论, 正因为此, 要知道并不是任何实矩阵都可以相似于对角阵, 但实对称方阵一定可以与对角阵相似 (可对角化)。对这一点一定不要有所怀疑。 ## 再看等价矩阵几何意义 等价矩阵的概念可以看成从**同解 (等价) 线性方程组**得来的。 我们知道, 对一个线性方程组经过下列若干个变换: (1) 变换方程的顺序; (2) 用一个非零的数乘以方程; (3) 用一个数乘以方程加到另一个方程上。方程组变为另一个方程组, 这些变换都不影响它的解, 变换前后的方程组都是同解方程组, 也是等价方程组。 把方程组改写成矩阵的形式, 上面的三种变换就是曾经讲过的初等行变换。因此我们可以得到这样的一个结论: 一个矩阵经过初等行变换后得到的任意一个矩阵都与原矩阵等价。 以上的结论大家都没有问题, 但是, 我们也知道另外一个结论就是: 一个矩阵经过初等列变换后得到的任意一个矩阵都与原矩阵等价。 这个结论不能从同解方程组得到, 因为我们解线性方程组只能用初等行变换而不能用
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
附录2: 矩阵的等价、相似与合同意义
下一篇:
后记
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com