切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
线性代数
附录2: 矩阵的等价、相似与合同意义
最后
更新:
2025-07-20 08:54
查看:
2090
次
反馈
能力测评
会员8.2元/月
赞助
附录2: 矩阵的等价、相似与合同意义
整个《线性代数》研究的是什么?说起来相当简单,就是**解方程**。而且只解决两类方程:一次方程和二次方程。一次方程引入了行列式、矩阵的秩、线性相关与线性无关、向量空间等概念,二次方程里引入了特征值、特征向量、正交矩阵、合同、相似等概念。 >本篇介绍的是《线性代数》里的二次方程,对于解决一次方程请参考 [附录1:方程组的解、矩阵、行列式、与向量空间](https://kb.kmath.cn/kbase/detail.aspx?id=1234) ## 为什么要引入特征向量与特征值 > 以下内容节选自 [特征值与特征向量](https://kb.kmath.cn/kbase/detail.aspx?id=1393) 我们在研究线性变换时. 特别关心这样一个问题:对给定线性空间 $R^n$ 上的线性变换,能否找到 $R^n$ 的一组基,使得该线性变换在这组基下的表示矩阵**具有特别简单的形状**. 比如, 若我们能找到 $R^n$ 的一组基 $\left\{e_1, e_2, \cdots, e_n\right\}$, 使线性变换 $\varphi$ 在这组基下的表示矩阵为对角阵: $$ \left(\begin{array}{llll} a_1 & & & \\ & a_2 & & \\ & & \ddots & \\ & & & a_n \end{array}\right) . $$ 这时, 若 $\boldsymbol{\alpha}=k_1 \boldsymbol{e}_1+k_2 \boldsymbol{e}_2+\cdots+k_n \boldsymbol{e}_n$, 则 $$ \boldsymbol{\varphi}(\boldsymbol{\alpha})=a_1 k_1 \boldsymbol{e}_1+a_2 k_2 \boldsymbol{e}_2+\cdots+a_n k_n \boldsymbol{e}_n $$ 线性变换 $\varphi$ 的表达式非常简单. 线性变换 $\varphi$ 的许多性质也变得一目了然. 我们已经知道, 一个线性变换在不同基下的表示矩阵是相似的. 因此用矩阵的语言重述上面提到的问题就是: 能否找到一类特别简单的矩阵, 使任一矩阵与这类矩阵中的某一个相似?比如,我们可以问:是否所有的矩阵都相似于对角阵? 若不然, 哪一类矩阵可以相似于对角阵? 在分块矩阵里,我们曾经学过,每一个矩阵都可以按列进行分块,我们自然想到:我们提取矩阵的某一列作为行向量$\alpha$,上述的问题可以表述为:我们希望找到一个矩阵$A$和一个向量$\lambda$,使得$A \alpha= \lambda \alpha$ ,这样就相当于通过一个矩阵转换,把一个行向量转换为了一个数,这是最原始的想法。 ## 从线性空间角度理解坐标 以经典的 $A x=b$ 为例,假设 $A$ 是一个 $\mathrm{n} \times n$ 的矩阵, $x$ 和 $b$ 都是 $\mathrm{n} \times 1$ 的向量 $$ A=\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right], x=\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right], b=\left[\begin{array}{c} b_1 \\ b_2 \\ \vdots \\ b_n \end{array}\right] $$ 不难看出,矩阵就是由一列列向量组成的,所以在说矩阵之前我们再来简单说一下向量。 向量有长度有方向,但这个长度方向要有意义,或者说可度量,这就必须要有参考系,也就是坐标系。坐标系不是唯一的,但我们有一个标准坐标,叫笛卡尔坐标,简称 $I$ 坐标。那由一系列向量组成的矩阵到底代表什么意思呢? 可以从 2 个角度理解矩阵: (1)**矩阵是一个变换**,仔细盯着$A x=b$多看几次,这个等式表明,经过变换$A$,向量 $x$ 变成了向量 $b$ (在这里,$b$坐标终是隐含着使用$I$坐标)。你可以把$A$想象成一个传送门,任何向量经过这个传送门,嗖的一下就被瞬间传送到了另一个点成为另一个向量,而你到底能被传送到哪跟你本身的位置有关,也跟这个传送门的性能有关,换句话说同一个传送门,不同的向量被传送到不同的位置,同一个向量,换一个传送门,也会被传送到不同的位置。 (2)**矩阵本身就是一个坐标系**。这个不难理解,我们常见的 $I$ 坐标系,比如二维坐标,他的两个坐标轴就是 $(1,0) ,(0,1)$ 两个向量,把这两个向量按列排列就是一个矩阵,所以矩阵就代表了坐标系,每一个列向量就是他的一个坐标轴。 那一个矩阵乘以一个向量,比如 $A x$ 代表什么意思呢?我们说一个向量单看是没有意义的,你要放在一个坐标系下才能度量,而左乘一个矩阵$A$就代表它的坐标系是$A$,这个向量在$A$坐标系下的坐标为 $x$ ,也就是这个向量投影到 $A$ 的各个坐标轴的长度为 $x$ 。 $$ \begin{aligned} & A x=\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & \varepsilon_{1 n} \\ a_{21} & a_{22} & \cdots & \varepsilon_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right]\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right]=x_1\left[\begin{array}{c} a_{11} \\ a_{21} \\ \vdots \\ s_{n 1} \end{array}\right]+x_2\left[\begin{array}{c} a_{12} \\ a_{2 c} \\ \vdots \\ s_{n 2} \end{array}\right]+\cdots & +x_n\left[\begin{array}{c} a_{1 n} \\ a_{2 n} \\ \vdots \\ a_{n n} \end{array}\right] \end{aligned} $$ 我们再来看 $A x=b$ ,发现什么了吗?上面说一个向量单看是没有意义的,你要放在一个坐标系下才能度量, $b$ 前面没有任何矩阵,但它也需要坐标系,没有指定坐标系的时候坐标系是 $I$ ,所以 $b$ 前面其实被略去了一个 $I$ ,也就是 $A x=I b$ 。 $A x$ 描述的是一个向量,它在$A$坐标系下的坐标是 $x , I b$ 描述的也是一个向量,它在 $I$ 坐标系下的坐标是 $b$ ,二者相等,说明 $x$ 和 $b$ 其实是一个向量,他们只不过是在不同坐标系下的不同表示而已。 你可以理解为这个点从来没动过,它只是换了一个坐标系来看这个点而已。就好像拍照,你从正面拍侧面拍,仰拍俯拍,你拍的都是一个对象,但拍照角度不一样,你会得到不同的照片。 来看个数学上的例子 $$ A=\left[\begin{array}{cc} 1 & -1 \\ 1 & 1 \end{array}\right], x=\left[\begin{array}{l} 2 \\ 1 \end{array}\right], I=\left[\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right], b=\left[\begin{array}{l} 1 \\ 3 \end{array}\right] $$ 如果你计算,你会发现上面这个矩阵乘法 $Ax=Ib=b$, 换句话说,$(2,1)$ 和 $(1,3)$ 就是同一个向量,只不过前者是在$A$下的表示,后者是在 $I$ 下的表示。  ### 通过物理对上面进行解释 在高中学过运动,比如:甲在路边,乙在飞船上,一辆汽车以$v_汽$行驶,汽车里$A$质点在运动,问甲乙看到的$v_A$的速度是多少?当看到这个问题时,我们第一反应就是:你要以什么为参照物,同样一个汽车运动,选择的参照系不同,会有不同的运动速度。比如甲在地面上,以地面为参照物,$v_A=v_\text{汽} +v_{A-\text{汽}}$ ,也就是汽车的速度加上A点相对汽车的速度就是甲看到的速度。但是乙因为在飞船里,飞船也在运行,因此他看到的速度$v_A=v_{\text{飞船}} + v_\text{汽-船} +v_{A-\text{汽}}$ 这样他们看到的速度是不同的。 {width=380px} 再仔细的盯着上面这张图(如下)  现在把上图想象为物体的运动:蓝色单位坐标系$\left(\begin{array}{cc}1,0 \\0,1\end{array} \right)$ 相当于禁止的地面,甲在蓝色坐标系里,橙色坐标系相当于宇宙飞船,他的单位坐标系是$\left(\begin{array}{cc}1,-1 \\1,1\end{array} \right)$ ,乙在宇宙飞船里,这样甲看到的汽车运动速度$(1,3)$ 和乙在宇宙飞船里的看到的$(2,1)$是一样的。 现在的问题是:我们能否把乙坐标系里的运动,都用类甲坐标系表示,为何?因为简单,比如上图里,假设甲看到的汽车速度为(5,7),我们就可以立刻知道,汽车速度相当于沿着$x$轴为5,而沿着$y$轴为7. 这对后续的计算非常简单。 ### 再看特征向量 在上面坐标变换里(参考上图蓝色坐标系和橙色坐标系),这里的坐标系除了进行了**缩放**,还进行了**旋转**,我们自然想简化设计,能否只进行缩放而不进行旋转?请看下面的定义: 数学上定义当 $A x=\lambda x$ 时 $x$ 是 $A$ 的特征向量, $\lambda$ 是 $A$ 的特征值。事实上,这里的$x$可以成为“测量的基准单位”。就像数组我们用1表示基准单位一样。 我们用坐标系的角度来理解,那么 $A x=\lambda x$ 代表的意思是有一个向量,在$A$坐标下是 $x$ ,我换 $I$ 坐标去看它,发现它看着还是 $x$ 这个方向,只不过伸缩了 $\lambda$ 倍。 为了使得例子更有意义,先来看一个矩阵: $$ A=\left[\begin{array}{cc} 2 & 0 \\ 0 & 10 \end{array}\right] $$ 它互相独立的标准化特征向量有 2 个, $$ x_1=\left[\begin{array}{l} 1 \\ 0 \end{array}\right], x_2=\left[\begin{array}{l} 0 \\ 1 \end{array}\right] $$ 他们的特征值分别是 $2$ 和 $10$ 。 如下图,在上面说过,一个矩阵就相当于一个坐标系单位(注意不是坐标系里向量的值),既然 笛卡尔坐标系 $\left(\begin{array}{cc}1,0 \\0,1\end{array} \right)$ 是最方便的,我们能否把这个矩阵“压缩”为笛卡尔坐标系?这张图和上面相比,最主要是去除了“旋转”,直接把橙色坐标系转换为笛卡尔坐标系。要转换为笛卡尔坐标系 要么把橙色矩阵压缩为单位矩阵,要么是把单位矩阵扩大为橙色矩阵。但是,我们知道单位矩阵相当于数学里的“1”,因此以单位矩阵为基础“伸缩”为橙色矩阵更方便。  那一个向量它在 $A$ 坐标系下的坐标是 $(1,1)$ ,在 $I$ 坐标系下的坐标是 $(2,10)$ ,怎么从 $(1, 1)$变成 $(2,10)$ 的呢? 我们把$(1,1)$想象为速度,把他分解为水平方向的$(1,0)$和垂直方向上的$(0,1)$ 同时,把$(2,10)$ 坐标也分解为水平方向的$(2,0)$和垂直方向上的$(0,10)$ 这样,只要把水平方向扩大2倍,垂直方向扩大10倍,就可以把 $(1,1)$ 向量转换为$(2,10)$向量。 因此,这里2和10分别叫做矩阵A的特征值,而对应的$(1,0)$ 和$(0,1)$ 就叫做对应特征值的特征向量。 上面介绍的是二维矩阵,现在我们明白,2维矩阵通常有2个特征值,他们分别对向量的$(1,0)$,$(0,1)$ 进行变换,同样的,如果有一个3维矩阵,理论上,他应该有3个特征值,他会把一个向量A的三个分量,分别映射为$(1,0,0)$,$(0,1,0)$和$(0,0,1)$ 到这里我们似乎还可以得出一个不是很准确的结论:一个n维矩阵,他应该有n个特征值,这n个特征值分别把一个n维向量的各个坐标分解为单位矩阵。 而且还可以得到一个结论:所有特征值的和正好是主对角线元素的和,我们把这个和称作矩阵的“**迹**”,比如上面X轴放大2被,Y轴放大10被,而矩阵主对角线正好也是[2,10] 所以,矩阵所有特征值的和为2+10=12 但是,也不是每个矩阵都可以伸缩为单位矩阵I,这是矩阵特征值和特征向量要进一步解决的问题。 > 我们都背过一个结论:一个n维矩阵有n个特征值,如果这些特征值不同一定线性无关,但是如果特征值有重根就需要注意:有可能线性相关也可能线性无关,为什么呢?因为特征值不同可以认为有n个不同的特征向量,因此可以张成向量空间。但是如果有重根则不一定能长成向量空间,举一个简单反例, 考虑矩阵 $A = \begin{pmatrix} 2 & 1 \\ 0 & 2 \end{pmatrix}$ 计算 $|A - \lambda I| = \begin{vmatrix} 2 - \lambda & 1 \\ 0 & 2 - \lambda \end{vmatrix} = (2 - \lambda)^2 = 0$ 解得特征值为 $\lambda = 2$(重根)。 现在,我们有两个“看似不同”的特征向量,例如$v_1 = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$和$v_2 = \begin{pmatrix} 2 \\ 0 \end{pmatrix}$ 但实际上,它们是线性相关的,因为 $v_2 = 2v_1$,他们无法张成向量空间,详见[特征值子空间](https://kb.kmath.cn/kbase/detail.aspx?id=1870)  ### 再看矩阵相似 上面得到的一个向量,在A里他的向量$(2,10)$和在I里的$(1,1)$ 本质上是一个向量,这是我们从向量的角度看,现在我们就转换一个视角:从矩阵的角度看向量,同一个向量, 从飞船看时的矩阵是$A=\left[\b
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
附录1:线性方程组、行列式、矩阵、向量组的关系
下一篇:
附录3:再看线性代数的意义
本文对您是否有用?
有用
(
0
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com