科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
线性代数
第五篇 特征值与矩阵相似
为什么引入特征值与特征向量
最后
更新:
2025-08-26 11:52
查看:
39
次
反馈
同步训练
为什么引入特征值与特征向量
## 为什么引入特征值与特征向量 ### 引例1 **特征值与特征向量反映的是矩阵变换里的不变量(方向不变)**。这句话可能不好理解,所以,先看初中学过的凸透镜成像。 在初中物理里,我们都学过凸透镜成像,凸透镜成像核心口诀有2句: (1)平行于主轴的光线经过成像后经过焦点 (2)经过凸透镜中心的光线方向不变 这2个直线相交,就获得了“像”的位置,所以,物体成像虽然复杂,但是抓住**核心的几个不变点**,就能找到像的规律 {width=600px} ### 引例2 矩阵作用向量,会使得向量发生缩放与旋转,**但是总有一些向量只伸缩不旋转**。因为线性的关系,通常我们只需要抓住几个关键点,就能描述变换的规律。比如 [剪切矩阵](https://kb.kmath.cn/kbase/detail.aspx?id=2605) K $$ K=\left[\begin{array}{cc}1 & 1.5 \\ 0 & 1\end{array}\right] $$ $K$作用在 $OAG$上, 如果我们能找到 $A',G'$ 这两个关键点,那么 自然的 $ O A ' G'$ 就是 $OAG$ 变换后的像,如下图所示  直角三角形 $\triangle O A G$ 内部的无数向量被水平方向切变到 $\triangle O A^{\prime} G^{\prime}$ 钝角三角形内部的向量。图中,原向量与被变换的向量由一根根虚线段 $\left(A A^{\prime}, B B^{\prime}, \cdots, G G^{\prime}\right)$ 连接,因为是水平切变,因此这根虚线段所代表的向量差是水平的。 显然,这些虚线段 $A A^{\prime}, B B^{\prime}, \cdots, G G^{\prime}$ 所表示的向量变化量是由矩阵 $\left[\begin{array}{cc}1 & 1.5 \\ 0 & 1\end{array}\right]$ 带来的;这些变换量的特点是 $A A^{\prime}$ 线段最长,$B B^{\prime}$ 线段长度次之,$\cdots \cdots$ 直到 $G G^{\prime}$ 线段长度变为 0 。这时原向量 $\overrightarrow{O G}$ ( $x$ 坐标单位向量)和变换向量 $\overrightarrow{o G^{\prime}}$ 重合。由特征值和特征向量的定义可知,向量 $\overrightarrow{o G}=(1,0)$是矩阵 $\left[\begin{array}{cc}1 & 1.5 \\ 0 & 1\end{array}\right]$ 的特征向量,因为这个特征向量的变化量为 0 ,原向量与被变换向量相等,变换的比例为 1 ,所以特征值是 1 。 进一步的,复杂图像是由简单几何体构成而成,而几何体由一根根向量组成,这样,对微观向量的改变就会导致宏观图像的改变。下图展示了矩阵作用图片后的水平拉伸效果。 {width=500px} >**因此,矩阵的特征值和特征向量相当于帮助我们找到矩阵变换里的不变量。** ## 特征值和特征向量的作用 为了方便理解为什么要引入特征值与特性向量,我们先看一个结论:**如果有了特征值与特征向量他们有什么作用**。 一个简单的作用是可以找到一个新基,在新基下可以实现对图形进行“扶正”。 假设给你一个斜椭圆方程 $x^2+xy+y^2=1$ ,画出其图像如下,如果问椭圆长轴长和短轴长是多少,其实并不容易求出,因为他们不是我们遇到的标准椭圆(椭圆的标准方程是 $\frac{x^2}{a^2}+\frac{y^2}{b^2}=1$),但是利用特征值与特征向量就可以把图像扶正。 {width=500px} “扶正”的过程可能比较难理解,这时候我们反向思考,如果最开始是一个圆,它通过某个线性变换,拉伸并旋转成了上面的椭圆,我们现在要做的就是看看圆是怎么变成椭圆的。 在这里,要插入一个小知识(关于[二次型](https://kb.kmath.cn/kbase/detail.aspx?id=500)):因为笛卡尔直角坐标系是最基础的坐标系,所以,所有图形都是以该坐标系为基础,而 $$ \left[\begin{array}{ll} x & y \end{array}\right]\left[\begin{array}{cc} 1 & 0 \\ 0& 1 \end{array}\right]\left[\begin{array}{l} x \\ y \end{array}\right]=1 $$ 表示的正好是单位圆 (即$x^2+y^2=1$),所以上面的问题可以描述为圆是怎么通过下面的矩阵A变为斜椭圆的。 $$ A=\left[\begin{array}{cc} 1 & \frac{1}{2} \\ \frac{1}{2} & 1 \end{array}\right] $$ 提示:事实上,圆不应该把他当做由点组成,而应该把圆当做由一个个向量组成。这里直接说由点组成,只是为了方便理解。 {width=500px} ## 矩阵分解 矩阵分解和因式分解类似,比如$25 * 12 =25 * 4 * 3 $,把$12$分解为$4 * 3 $,然后利用$25 * 4=100$ 就很容易计算。 矩阵作用于向量,相当于对向量进行了“缩放”和“旋转”,而特征值相当于缩放倍数,特征向量相当于找到了一组正交基。 现在把上面的矩阵A进行分解的,参考下图 (矩阵A分解成了3个矩阵相乘,可能你会疑惑这3个矩阵相乘真的等于$A$吗?你可以自己验算一下,确实等于$A$,即$A=P \Lambda P^{-1}$) {width=500px} 对角矩阵的对角线上是特征值,一个矩阵表示的线性变换,只有特征值才有拉伸作用,拉伸方向就是对应的特征向量方向,显然特征值越大拉伸得越长,其它方向上的拉伸都是“被动拉伸”,所以椭圆的长轴就是最大特征值的拉伸结果。 两边的矩阵是旋转矩阵,这里进行了单位化,稍后进行解释, 至此,我们大致能了解“圆”是怎么变成“斜椭圆”的,首先坐标轴先逆时针旋转$45^{\circ}$,接着把圆想象为弹性皮筋,手捏住两端拉伸,往上拉伸了$\frac{3}{2}$, 往左右拉伸了$\frac{1}{2}$ , 即可得到斜椭圆。 注意: $$ P=\left[\begin{array}{cc} \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2} \\ \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{array}\right] $$ 是线性变换里常使用的一个旋转$45^{\circ}$ 矩阵, 关于旋转矩阵见[旋转矩阵](https://kb.kmath.cn/kbase/detail.aspx?id=2605) 当然后面又乘以了$P^{-1}$,他是顺时针旋转$45^{\circ}$,相当于再把坐标系再还原回来。 ## 特征值与特征向量的作用 通过上面的操作,可以看到**特征向量相当于帮助我们找到了一个正交基,而特征值相当于在找到的正交基里,各个维度缩放的倍数**,参考下图红色的虚坐标轴。 {
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
没有了
下一篇:
特征值与特征向量的几何意义
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com