切换科目
重点科目
主要科目
次要科目
科数网
首页
刷题
学习
VIP会员
赞助
组卷
集合
教材
VIP
写作
游客,
登录
注册
在线学习
线性代数
第六篇 特征值与矩阵相似
特征值与特征向量的几何意义
最后
更新:
2025-08-25 09:41
查看:
490
次
反馈
能力测评
会员8.2元/月
赞助
特征值与特征向量的几何意义
## 为什么要引入特征值与特征向量 我们在研究线性变换时. 特别关心这样一个问题:对给定线性空间 $R^n$ 上的线性变换,能否找到 $R^n$ 的一组基,使得该线性变换在这组基下的**表示矩阵**,他**具有特别简单的形状**. 比如, 若我们能找到 $R^n$ 的一组基 $\left\{e_1, e_2, \cdots, e_n\right\}$, 使线性变换 $\varphi$ 在这组基下的表示矩阵为对角阵: $$ \left(\begin{array}{llll} a_1 & & & \\ & a_2 & & \\ & & \ddots & \\ & & & a_n \end{array}\right) . $$ 这时, 若 $\boldsymbol{\alpha}=k_1 \boldsymbol{e}_1+k_2 \boldsymbol{e}_2+\cdots+k_n \boldsymbol{e}_n$, 则 $$ \boldsymbol{\varphi}(\boldsymbol{\alpha})=a_1 k_1 \boldsymbol{e}_1+a_2 k_2 \boldsymbol{e}_2+\cdots+a_n k_n \boldsymbol{e}_n $$ 线性变换 $\varphi$ 的表达式非常简单. 线性变换 $\varphi$ 的许多性质也变得一目了然. 如若 $a_1, a_2, \cdots, a_r$ 不为零, 而 $a_{r+1}=\cdots=a_n=0$, 则 $\boldsymbol{\varphi}$ 的秩为 $r$, 且 $\operatorname{Im} \boldsymbol{\varphi}$ 就是由 $\left\{e_1, e_2, \cdots, e_r\right\}$ 生成的子空间, 而 $\operatorname{Ker} \varphi$ 则是由 $\left\{e_{r+1}, \cdots, e_n\right\}$ 生成的子空间,等等. 我们已经知道, 一个线性变换在不同基下的表示矩阵是相似的. 因此用矩阵的语言重述上面提到的问题就是: 能否找到一类特别简单的矩阵, 使任一矩阵与这类矩阵中的某一个相似?比如,我们可以问:是否所有的矩阵都相似于对角阵? 若不然, 哪一类矩阵可以相似于对角阵? 在分块矩阵里,我们曾经学过,每一个矩阵都可以按列进行分块,我们自然想到:我们提取矩阵的某一列作为行向量$\alpha$,上述的问题可以表述为:我们希望找到一个矩阵$A$和一个向量$\lambda$,使得$A \alpha= \lambda \alpha$ ,这样就相当于通过一个矩阵转换,把一个行向量转换为了一个数,这是最原始的想法。 > 从因式分解的角度或许更容易理解特征值与特征向量? 比如,老师让我们求 $ 25 * 12 $ ,直接计算会比较麻烦,老师通常会要求我们对$12$进行分解,即 $12=4 * 3$ , 这样 $ 25 * 12 = 25 * 4 * 3= 100 *3 =300$ 可以看到,分解后, 充分利用了 $25 * 4 =100 $ 简化了计算。 同样,给我们一个对称矩阵$A$ 能否分解为$A=P \Lambda P^{-1}$ ,这样你会发现,计算矩阵会变的简单。求特征值与特征向量,就是求新坐标基的过程。 ## 从线性空间角度理解坐标 以经典的 $A x=b$ 为例,假设 $A$ 是一个 $\mathrm{n} \times n$ 的矩阵, $x$ 和 $b$ 都是 ${n} \times 1$ 的向量 $$ A=\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right], x=\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right], b=\left[\begin{array}{c} b_1 \\ b_2 \\ \vdots \\ b_n \end{array}\right] $$ 不难看出,矩阵就是由一列列向量组成的,所以在说矩阵之前我们再来简单说一下向量。 向量有长度有方向,但这个长度方向要有意义,或者说可度量,这就必须要有参考系,也就是坐标系。坐标系不是唯一的,但我们有一个标准坐标,叫笛卡尔坐标,简称 $I$ 坐标。那由一系列向量组成的矩阵到底代表什么意思呢? 可以从 2 个角度理解矩阵: (1)**矩阵是一个变换**,仔细盯着$A x=b$多看几次,这个等式表明,经过变换$A$,向量 $x$ 变成了向量 $b$ (在这里,$b$坐标终是隐含着使用$I$坐标)。你可以把$A$想象成一个传送门,任何向量经过这个传送门,嗖的一下就被瞬间传送到了另一个点成为另一个向量,而你到底能被传送到哪跟你本身的位置有关,也跟这个传送门的性能有关,换句话说同一个传送门,不同的向量被传送到不同的位置,同一个向量,换一个传送门,也会被传送到不同的位置。 (2)**矩阵本身就是一个坐标系**。这个不难理解,我们常见的 $I$ 坐标系,比如二维坐标,他的两个坐标轴就是 $(1,0) ,(0,1)$ 两个向量,把这两个向量按列排列就是一个矩阵,所以矩阵就代表了坐标系,每一个列向量就是他的一个坐标轴。 那一个矩阵乘以一个向量,比如 $A x$ 代表什么意思呢?我们说一个向量单看是没有意义的,你要放在一个坐标系下才能度量,而左乘一个矩阵$A$就代表它的坐标系是$A$,这个向量在$A$坐标系下的坐标为 $x$ ,也就是这个向量投影到 $A$ 的各个坐标轴的长度为 $x$ 。 $$ \begin{aligned} & A x=\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & \varepsilon_{1 n} \\ a_{21} & a_{22} & \cdots & \varepsilon_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right]\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right]=x_1\left[\begin{array}{c} a_{11} \\ a_{21} \\ \vdots \\ a_{n 1} \end{array}\right]+x_2\left[\begin{array}{c} a_{12} \\ a_{2 c} \\ \vdots \\ a_{n 2} \end{array}\right]+\cdots & +x_n\left[\begin{array}{c} a_{1 n} \\ a_{2 n} \\ \vdots \\ a_{n n} \end{array}\right] \end{aligned} $$ 我们再来看 $A x=b$ ,发现什么了吗?上面说一个向量单看是没有意义的,你要放在一个坐标系下才能度量, $b$ 前面没有任何矩阵,但它也需要坐标系,没有指定坐标系的时候坐标系是 $I$ ,所以 $b$ 前面其实被略去了一个 $I$ ,也就是 $A x=I b$ 。 $A x$ 描述的是一个向量,它在$A$坐标系下的坐标是 $x , I b$ 描述的也是一个向量,它在 $I$ 坐标系下的坐标是 $b$ ,二者相等,说明 $x$ 和 $b$ 其实是一个向量,他们只不过是在不同坐标系下的不同表示而已。 你可以理解为这个点从来没动过,它只是换了一个坐标系来看这个点而已。就好像拍照,你从正面拍侧面拍,仰拍俯拍,你拍的都是一个对象,但拍照角度不一样,你会得到不同的照片。 来看个数学上的例子 $$ A=\left[\begin{array}{cc} 1 & -1 \\ 1 & 1 \end{array}\right], x=\left[\begin{array}{l} 2 \\ 1 \end{array}\right], I=\left[\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right], b=\left[\begin{array}{l} 1 \\ 3 \end{array}\right] $$ 如果你计算,你会发现上面这个矩阵乘法 $Ax=Ib=b$, 换句话说,$(2,1)$ 和 $(1,3)$ 就是同一个向量,只不过前者是在$A$下的表示,后者是在 $I$ 下的表示。 {width=300px} 再看一个简单的类比, $(5)*1=5*1$ 前面这个$(5)$表示一个矩阵,后面这个$5$表示一个坐标值。这个等式告诉我们:有一个1,我用5个长度作为一个基准单位,等于以“1”为基准单位得5倍。同样 $(5)*2=10*1$ 等号右边表示,以1为基准单位,坐标为10的向量,等于“以5个单位为一个基准单位”,但是只需要2个这样的单位即可。 上式还可以简单类比,一件东西需要10元钱,我以1元人民币为单位,给他10次就可以了。但是我也可以以5元人民币为单位,只要给他2次就可以了。 ### 通过物理对上面进行解释 在高中学过运动,比如:甲在路边,乙在飞船上,一辆汽车以$v_汽$行驶,汽车里$A$质点在运动,问甲乙看到的$v_A$的速度是多少?当看到这个问题时,我们第一反应就是:你要以什么为参照物,同样一个汽车运动,选择的参照系不同,会有不同的运动速度(**这里的参照物可以理解为线性代数里的基坐标**)。比如甲在地面上,以地面为参照物,$
免费注册 查看余下70%
《高等数学》难点解析
高数教程
泰勒公式
切线与法线
切平面与法平面
驻点·拐点·极值点·零点
间断点
渐进线
瑕积分
欧拉方程
伯努利方程
Abel 收敛定理
偏导数的几何意义
偏导数的几何意义
梯度
数量场与向量场
多元函数极值
拉格朗日算子
通量与散度
环流量与旋度
格林公式
高斯公式
斯托克斯公式
三大公式比较
傅里叶级数
极坐标微元
点法式方程
变上限定积分
X型计算面积
Y型计算面积
微分的意义
渐近线
间断点
y''+py'+qy=f(x)方程
高斯
黎曼
傅里叶变换(复数)
拉普拉斯变换(复数)
高等数学测评
函数与极限
一元函数微分学
一元函数积分学
微分方程
空间向量与代数
多元微分学
多元积分学
无穷级数
《线性代数》难点解析
线代教程
近世代数对数学的整体思考
线性的意义
矩阵乘法(列视角)
矩阵乘法(行视角)
矩阵左乘
矩阵右乘
逆矩阵求解方程组
阶梯形矩阵的求法
方程组解的判定
四阶行列式的计算
线性变换的意义
线性空间
向量组的等价
线性空间的几何意义
基础解系的求法
施密特正交化
特征值与特征向量的意义
矩阵相似的几何意义
矩阵可对角化的理解
秩的意义(向量版)
秩的意义(方程版)
二次型的意义
线性代数测评
行列式
矩阵
向量空间
《概率论与数理统计》难点解析
概率教程
置信区间与上a分位数
概率中的“取”与“放”
贝叶斯公式
全概率公式
泊松分布
指数分布
伽玛分布
二维密度图的意义
卷积的意义
相关系数的意义
k阶矩是与矩母函数
卡方分布的作用
单正态区间估计理解
假设检验理解
切比雪夫不等式
中心极限定理
概率统计测评
事件与概率
一维随机变量与事件
多维随机变量与事件
随机变量的数字特征
大数定律与中心极限定理
统计量与抽样分布
参数估计
假设检验
上一篇:
为什么引入特征值与特征向量
下一篇:
特征值与特征向量的求法(★★★★★)
本文对您是否有用?
有用
(
1
)
无用
(
0
)
学习首页
数学试卷
同步训练
投稿
会议预约系统
数学公式
关于
Mathhub
赞助我们
科数网是专业专业的数学网站 版权所有
本站部分教程采用AI制作,请读者自行判别内容是否一定准确
如果页面无法显示请联系 18155261033 或 983506039@qq.com