科数网
数学题库
数学试卷
数学组卷
在线学习
电子教材
科数
试题
试卷
学习
教材
VIP
你好
游客,
登录
注册
在线学习
线性代数
第六篇 向量内积与矩阵正交化
方阵的相似对角化
最后
更新:
2024-11-29 22:23
●
参与者
查看:
417
次
纠错
分享
参与项目
词条搜索
方阵的相似对角化
## 方阵的相似对角化 把矩阵 $\boldsymbol{P}$ 列分块为 $\boldsymbol{P}=\left(\boldsymbol{p}_1, \boldsymbol{p}_2, \cdots, \boldsymbol{p}_n\right)$, 由 $P^{-1} A P=\Lambda$ 得 $A P=P \Lambda$ ,即 $$ \boldsymbol{A}\left(\boldsymbol{p}_1, \boldsymbol{p}_2, \cdots, \boldsymbol{p}_n\right)=\left(\boldsymbol{p}_1, \boldsymbol{p}_2, \cdots, \boldsymbol{p}_n\right)\left(\begin{array}{ccc} \lambda_1 & & \\ & \lambda_2 & \\ & \ddots & \\ & & \lambda_n \end{array}\right)=\left(\lambda_1 \boldsymbol{p}_1, \lambda_2 \boldsymbol{p}_2, \cdots, \lambda_n \boldsymbol{p}_n\right) $$ 于是有 $\boldsymbol{A} \boldsymbol{p}_i=\lambda_i \boldsymbol{p}_i \quad(i=1,2, \cdots, n)$. 可见 $\lambda_i$ 为 $A$ 的特征值,而 $P$ 的列向量 $p_i$ 就是 $A$ 对应于特征值 $\lambda_i$ 的特征向量. 反之,如果 $n$ 阶矩阵 $\boldsymbol{A}$ 恰好有 $n$ 个特征向量,则这 $n$ 个特征向量即可构成矩阵 $\boldsymbol{P}$, 使得 $\boldsymbol{A} \boldsymbol{P}=\boldsymbol{P} \Lambda$. 并且这 $n$ 个特征向量必定是线性无关的,从而 $P$ 可逆,因此有 $P^{-1} A P=\Lambda$. 由上面的讨论即有: ## 定理1 $n$ 阶矩阵 $A$ 与对角阵相似(即 $A$ 能对角化)的充分必要条件是 $A$ 有 $n$ 个线性无关的特征向量. ### 推论 如果 $n$ 阶矩阵 $A$ 的 $n$ 个特征值互不相等,则 $A$ 与对角阵相似. 证明:首先我们对于矩阵 $A$ 的特征值 $\lambda_1$ ,有等式满足 $A x_1=\lambda_1 x_1$ ,特征向量为 $x_1$. 对于特征值 $\lambda_2$ ,有等式满足 $A x_2=\lambda_2 x_2$ 。 下面用反证法进行证明!首先假设不同特征值对应的特征向量线性相关 如果对于不同的 $\lambda_1, \lambda_2$ 所对应的特征向量线性相关的话,那么满足下面等式: $k_1 x_1+k_2 x_2=0$ ,那么等式两边同时乘以矩阵A,得到 $A k_1 x_1+A k_2 x_2=0$ ,化简为: $\lambda_1 k_1 x_1+\lambda_2 k_2 x_2=0$ ,又因为根据等式 $k_1 x_1+k_2 x_2=0$ 可以得到, $k_2 x_2=-k_1 x_1$ ,带入到 $\lambda_1 k_1 x_1+\lambda_2 k_2 x_2=0$ ,得到 $k_1 x_1\left(\lambda_1-\lambda_2\right)=0$ ,又因为 $\lambda_1, \lambda_2$ 不相同,则造成矛盾。 所以不同特征值对应的特征向量线性相关是错误的。 所以:不同特征值对应的特征向量是线性无关的 ## 例题 `例`设 $A =\left(\begin{array}{lll}0 & 0 & 1 \\ x & 1 & y \\ 1 & 0 & 0\end{array}\right)$ 有三个线性无关的特征向量,求 $x$ 与 $y$ 应满足的条件. 解:因为矩阵 $A$ 是 3 阶矩阵,又有三个线性无关的特征向量,所以 $A$ 可以相似对角化. 由 $$ | A -\lambda E |=\left|\begin{array}{ccc} -\lambda & 0 & 1 \\ x & 1-\lambda & y \\ 1 & 0 & -\lambda \end{array}\right|=(1-\lambda)\left|\begin{array}{cc} -\lambda & 1 \\ 1 & -\lambda \end{array}\right|=-(\lambda-1)^2(\lambda+1), $$ 得到 $\bar{A}$ 的特征值为 $\bar{\lambda}_1=\bar{\lambda}_2=1, \lambda_3=-1$ 。 对应单根 $\lambda_3=-1$ ,可求得线性无关的特征向量恰好有 1 个,故对应重根 $\lambda_1=\lambda_2=1$ 应有 2 个线性无关的特征向量,即方程 $( A - E ) x =0$ 有 2 个线性无关的解,亦即系数矩阵 $A - E$的秩 $R( A - E )=1$ 。 $$ A - E =\left(\begin{array}{ccc} -1 & 0 & 1 \\ x & 0 & y \\ 1 & 0 & -1 \end{array}\right) r\left(\begin{array}{ccc} 1 & 0 & -1 \\ 0 & 0 & x+y \\ 0 & 0 & 0 \end{array}\right) $$ 可知,要使系数矩阵 $A - E$ 的秩 $R( A - E )=1$ ,必须 $x+y=0$ 。 ## 附:相似对角化定理的推导 总结前面的例子, 对角阵 $\boldsymbol{\Lambda}$ 的求解法当有下面的对角化定理: $n \times n$ 矩阵 $\boldsymbol{A}$ 可对角化的充分必要条件是 $\boldsymbol{A}$ 有 $n$ 个线性无关的特征向量。 具体讲, 对于 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}, \boldsymbol{\Lambda}$ 为对矩阵的充要条件是 $\boldsymbol{P}$ 的列向量是 $\boldsymbol{A}$ 的 $n$ 个线性无关的特征向量。这时, $A$ 的主对角线上的元素分别是 $A$ 的对应于 $\boldsymbol{P}$ 中特征向量的特征值 $\lambda_i$, 即 $$ \boldsymbol{P}^{-1} \boldsymbol{A P}=\left[\begin{array}{llll} \lambda_1 & & \\ { } & \lambda_2 & \\ & \ddots & \\ & & \lambda_n \end{array}\right] $$ 矩阵的对角化怎么就与矩阵的特征值、特征向量纠结在一起了呢? 其实是因为我们可以利用特征向量的定义来得到对角阵。示意性的推导如下: 把 $\boldsymbol{A}$ 的特征向量 $\boldsymbol{P}_1, \boldsymbol{P}_2, \cdots, \boldsymbol{P}_n$ 排成矩阵 $\boldsymbol{P}$ 的列, 运用分块运算技术, 把矩阵 $\boldsymbol{A}$ 作为一个整块,或作为一个常数; 把矩阵 $\boldsymbol{P}$ 中每个列看做一个块 (或元素), 运算如下: $$ A P=A\left[\begin{array}{llll} p_1 & p_2 & \ldots & p_n \end{array}\right]=\left[A p_1 A p_2 \ldots A p_n\right] $$ 好, 这时候用上了特征向量的定义式 $\boldsymbol{A P}=\lambda \boldsymbol{P}$, 上式继续有 $$ \boldsymbol{A P}=\left[\begin{array}{llll} \boldsymbol{A} \boldsymbol{p}_1 & \boldsymbol{A} \boldsymbol{p}_2 & \ldots & \boldsymbol{A} \boldsymbol{p}_n \end{array}\right]=\left[\begin{array}{llll} \lambda_1 \boldsymbol{p}_1 & \lambda_2 \boldsymbol{p}_2 & \ldots & \lambda_n \boldsymbol{p}_n \end{array}\right] $$ 把最后的矩阵按完全不同的方式分解: $$ \boldsymbol{A} \boldsymbol{P}=\left[\begin{array}{llll} \boldsymbol{P}_1 \lambda_1 & \boldsymbol{P}_2 \lambda_2 & \cdots & \boldsymbol{P}_n \lambda_n \end{array}\right]=\left[\begin{array}{llll} \boldsymbol{P}_1 & \boldsymbol{P}_2 & \cdots & \boldsymbol{P}_n \\ & & & \end{array}\right]\left[\begin{array}{cccc} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots & \\ & & \lambda_n \end{array}\right]=\boldsymbol{P}\left[\begin{array}{lllll} \lambda_1 & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & \lambda_n \end{array}\right] $$ 显然, 把最后的矩阵左乘一个 $\boldsymbol{P}$ 矩阵的逆, 把 $\boldsymbol{P}$ 消简成单位阵, 就得到了由特征值构成的对角阵 $\boldsymbol{\Lambda}$, 也即 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}$ 成立。 为了直接理解 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}$ 的变换过程, 首先, 咱回顾一下 “线性变换的矩阵定理”。想起来啦, 好, 由此定理, 我们理解一下下面似乎无聊的计算: $$ A=A E=A\left[\begin{array}{llll} e_1 & e_2 & \ldots & e_n \end{array}\right]=\left[\begin{array}{llll} A e_1 & A e_2 & \ldots & A e_n \end{array}\right] $$ 其中 $\left\{e_1, e_2, \ldots e_n\right\}$ 为单位基向量。 啥意思? 就这意思: 作为一线性变换, 矩阵 $\boldsymbol{A}$ 就等于自己逐个乘以坐标基向量 $\boldsymbol{e}_i$ 后得到的新矩阵。相当于对 $\boldsymbol{E}$ 内的每个列向量 $\boldsymbol{e}_i$ 进行了一次线性变换。 $\boldsymbol{E}$ 就是此坐标系下的单位基向量矩阵。 这和矩阵的几何意义相符: 一个矩阵就是把第一象限的单位立方体变换到其他象限的多面体, 单位立方体由单位基向量张成, 多面体由矩阵列向量张成; 而列向量是由基向量变换得到的。 回过头来, $\boldsymbol{P}$ 是原坐标系下的基向量矩阵 (但不一定是单位基向量矩阵)。一个 $\boldsymbol{A}$ 乘以 $\boldsymbol{P}$矩阵, 相当于对 $\boldsymbol{P}$ 内的每个列向量 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2, \ldots, \boldsymbol{p}_n\right\}$ 进行了一次线性变换, 也就是对基向量组进行了一次线性变换, 得到了一组新向量组 $\left\{A p_1, A p_2, \ldots, A p_n\right\}$ 。这组表达线性变换的向量组还在使用老的坐标系呢, 好, 再左乘个 $\boldsymbol{P}^{-1}$ 矩阵把它们统统变换到以 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2, \ldots, \boldsymbol{p}_n\right\}$ 为坐标系的空间里面去, 得到向量组 $\left\{P^{-1} A p_1, P^{-1} A p_2, \ldots, P^{-1} A p_n\right\}$, 把它们按序组成矩阵就是原线性变换在新基下的矩阵。 如果 $\boldsymbol{P}$ 矩阵的每个列向量 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2, \ldots, \boldsymbol{p}_n\right\}$ 都是特征向量, 则矩阵 $\left\{\boldsymbol{P}^{-1} A p_1, \boldsymbol{P}^{-1} A p_2, \ldots, \boldsymbol{P}^{-1} A p_n\right\}$ ## 相似对角化的例子 用前面[矩阵相似](https://kb.kmath.cn/kbase/detail.aspx?id=497)镜像变换的例子验证一下如何相似对角化。如图 5-52 所示, 在原坐标系 $\{x o y\}$ 下的镜像变换矩阵和基变换距阵分别为 $$ \boldsymbol{A}=\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right], \quad \boldsymbol{P}=\left[\begin{array}{cc} 1 & -1 \\ 1 & 1 \end{array}\right] $$ 那么相似对角化的过程 $\boldsymbol{A} \rightarrow \boldsymbol{A P} \rightarrow \boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{A}$ 具体是: ![图片](/uploads/2024-01/image_20240104ecb41fc.png) 镜像变换 $\boldsymbol{A}$ 左乘矩阵 $\boldsymbol{P}$, 就把特征向量组 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2\right\}=\left\{\left(\begin{array}{l}1 \\ 1\end{array}\right),\left(\begin{array}{c}-1 \\ 1\end{array}\right)\right\}$ 变换成了 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}=\left\{\left(\begin{array}{l}1 \\ 1\end{array}\right),\left(\begin{array}{c}1 \\ -1\end{array}\right)\right\}$,这两个向量的元素都是原坐标系下的数值; 再左乘逆矩阵 $\boldsymbol{P}^{-1}=\left[\begin{array}{rr}0.5 & 0.5 \\ -0.5 & 0.5\end{array}\right]$, 就把 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}$ 变成了新坐标系 $\left\{x^{\prime} o y^{\prime}\right\}$ 下的向量组 $\left\{\boldsymbol{p}_1^{\prime}, \boldsymbol{p}_3^{\prime}\right\}=\left\{\left(\begin{array}{l}1 \\ 0\end{array}\right),\left(\begin{array}{c}0 \\ -1\end{array}\right)\right\}$, 把 $\boldsymbol{P}_1^{\prime} 、 \boldsymbol{P}_3^{\prime}$ 组成矩阵, 就得到了表示镜像变换的新矩阵 $\boldsymbol{\Lambda}=\left[\begin{array}{rr}1 & 0 \\ 0 & -1\end{array}\right]$ 。这是新坐标系 $\left\{x^{\prime} o y^{\prime}\right\}$ 下的镜像变换矩阵。 从图上看到没? 镜像变换很简单, 就那么三个向量在那里放着没动, 就我们自个儿把矩阵啊向量啊乘过来除过去的, 折腾个没完——不为别的, 就为了那个传说中的对角阵。 其实, 我们很朴素地想一想特征向量的定义式 $A x=\lambda x$, 这公式本身就是一种简化: 矩阵 $\boldsymbol{A}$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\boldsymbol{A x}$ 等于一个常数(特征值) $\lambda$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\lambda \boldsymbol{x}$ 。这样看来, 矩阵的对角简化与特征向量的联系就不突然了。实际上, 想把 $\boldsymbol{A}$ 对角化, 就要有足够的特征向量形成 $\mathbf{R}^n$ 的一个基。 因此, 线性变换的相似对角化实质是寻找一个适当的坐标系, 使得该变换对这个新的坐标 > 一般实矩阵相似于对角阵的充要条件是它有 $n$ 个线性无关的特征向量这一基本结论, 正因为此, 要知道并不是任何实矩阵都可以相似于对角阵, 但实对称方阵一定可以与对角阵相似 (可对角化)。对这一点一定不要有所怀疑。
上一篇:
矩阵相似
下一篇:
对称矩阵的对角化
本文对您是否有用?
有用
(
0
)
无用
(
0
)
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数论
群论
纠错
题库
高考
考研
关于
下载
科数网是专业专业的数学网站。