科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
数学分析
复变函数
离散数学
实变函数
数论
群论
高中物理
词条搜索
科数
试题
高中数学
高数
线代
more
你好
游客,
登录
注册
在线学习
线性代数
第六篇 向量内积与矩阵正交化
方阵的相似对角化
最后
更新:
2025-03-06 14:23
查看:
456
次
高考专区
考研专区
公式专区
刷题专区
词条搜索
方阵的相似对角化
## 方阵的相似对角化 把矩阵 $\boldsymbol{P}$ 列分块为 $\boldsymbol{P}=\left(\boldsymbol{p}_1, \boldsymbol{p}_2, \cdots, \boldsymbol{p}_n\right)$, 由 $P^{-1} A P=\Lambda$ 得 $A P=P \Lambda$ ,即 $$ \boldsymbol{A}\left(\boldsymbol{p}_1, \boldsymbol{p}_2, \cdots, \boldsymbol{p}_n\right)=\left(\boldsymbol{p}_1, \boldsymbol{p}_2, \cdots, \boldsymbol{p}_n\right)\left(\begin{array}{ccc} \lambda_1 & & \\ & \lambda_2 & \\ & \ddots & \\ & & \lambda_n \end{array}\right)=\left(\lambda_1 \boldsymbol{p}_1, \lambda_2 \boldsymbol{p}_2, \cdots, \lambda_n \boldsymbol{p}_n\right) $$ 于是有 $\boldsymbol{A} \boldsymbol{p}_i=\lambda_i \boldsymbol{p}_i \quad(i=1,2, \cdots, n)$. 可见 $\lambda_i$ 为 $A$ 的特征值,而 $P$ 的列向量 $p_i$ 就是 $A$ 对应于特征值 $\lambda_i$ 的特征向量. 反之,如果 $n$ 阶矩阵 $\boldsymbol{A}$ 恰好有 $n$ 个特征向量,则这 $n$ 个特征向量即可构成矩阵 $\boldsymbol{P}$, 使得 $\boldsymbol{A} \boldsymbol{P}=\boldsymbol{P} \Lambda$. 并且这 $n$ 个特征向量必定是线性无关的,从而 $P$ 可逆,因此有 $P^{-1} A P=\Lambda$. 由上面的讨论即有: ## 定理1 $n$ 阶矩阵 $A$ 与对角阵相似(即 $A$ 能对角化)的充分必要条件是 $A$ 有 $n$ 个线性无关的特征向量. ### 推论 如果 $n$ 阶矩阵 $A$ 的 $n$ 个特征值互不相等,则 $A$ 与对角阵相似. 证明:首先我们对于矩阵 $A$ 的特征值 $\lambda_1$ ,有等式满足 $A x_1=\lambda_1 x_1$ ,特征向量为 $x_1$. 对于特征值 $\lambda_2$ ,有等式满足 $A x_2=\lambda_2 x_2$ 。 下面用反证法进行证明!首先假设不同特征值对应的特征向量线性相关 如果对于不同的 $\lambda_1, \lambda_2$ 所对应的特征向量线性相关的话,那么满足下面等式: $k_1 x_1+k_2 x_2=0$ ,那么等式两边同时乘以矩阵A,得到 $A k_1 x_1+A k_2 x_2=0$ ,化简为: $\lambda_1 k_1 x_1+\lambda_2 k_2 x_2=0$ ,又因为根据等式 $k_1 x_1+k_2 x_2=0$ 可以得到, $k_2 x_2=-k_1 x_1$ ,带入到 $\lambda_1 k_1 x_1+\lambda_2 k_2 x_2=0$ ,得到 $k_1 x_1\left(\lambda_1-\lambda_2\right)=0$ ,又因为 $\lambda_1, \lambda_2$ 不相同,则造成矛盾。 所以不同特征值对应的特征向量线性相关是错误的。 所以:不同特征值对应的特征向量是线性无关的 ## 例题 `例`设 $A =\left(\begin{array}{lll}0 & 0 & 1 \\ x & 1 & y \\ 1 & 0 & 0\end{array}\right)$ 有三个线性无关的特征向量,求 $x$ 与 $y$ 应满足的条件. 解:因为矩阵 $A$ 是 3 阶矩阵,又有三个线性无关的特征向量,所以 $A$ 可以相似对角化. 由 $$ | A -\lambda E |=\left|\begin{array}{ccc} -\lambda & 0 & 1 \\ x & 1-\lambda & y \\ 1 & 0 & -\lambda \end{array}\right|=(1-\lambda)\left|\begin{array}{cc} -\lambda & 1 \\ 1 & -\lambda \end{array}\right|=-(\lambda-1)^2(\lambda+1), $$ 得到 $\bar{A}$ 的特征值为 $\bar{\lambda}_1=\bar{\lambda}_2=1, \lambda_3=-1$ 。 对应单根 $\lambda_3=-1$ ,可求得线性无关的特征向量恰好有 1 个,故对应重根 $\lambda_1=\lambda_2=1$ 应有 2 个线性无关的特征向量,即方程 $( A - E ) x =0$ 有 2 个线性无关的解,亦即系数矩阵 $A - E$的秩 $R( A - E )=1$ 。 $$ A - E =\left(\begin{array}{ccc} -1 & 0 & 1 \\ x & 0 & y \\ 1 & 0 & -1 \end{array}\right) r\left(\begin{array}{ccc} 1 & 0 & -1 \\ 0 & 0 & x+y \\ 0 & 0 & 0 \end{array}\right) $$ 可知,要使系数矩阵 $A - E$ 的秩 $R( A - E )=1$ ,必须 $x+y=0$ 。 ## 附:相似对角化定理的推导 总结前面的例子, 对角阵 $\boldsymbol{\Lambda}$ 的求解法当有下面的对角化定理: $n \times n$ 矩阵 $\boldsymbol{A}$ 可对角化的充分必要条件是 $\boldsymbol{A}$ 有 $n$ 个线性无关的特征向量。 具体讲, 对于 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}, \boldsymbol{\Lambda}$ 为对矩阵的充要条件是 $\boldsymbol{P}$ 的列向量是 $\boldsymbol{A}$ 的 $n$ 个线性无关的特征向量。这时, $A$ 的主对角线上的元素分别是 $A$ 的对应于 $\boldsymbol{P}$ 中特征向量的特征值 $\lambda_i$, 即 $$ \boldsymbol{P}^{-1} \boldsymbol{A P}=\left[\begin{array}{llll} \lambda_1 & & \\ { } & \lambda_2 & \\ & \ddots & \\ & & \lambda_n \end{array}\right] $$ 矩阵的对角化怎么就与矩阵的特征值、特征向量纠结在一起了呢? 其实是因为我们可以利用特征向量的定义来得到对角阵。示意性的推导如下: 把 $\boldsymbol{A}$ 的特征向量 $\boldsymbol{P}_1, \boldsymbol{P}_2, \cdots, \boldsymbol{P}_n$ 排成矩阵 $\boldsymbol{P}$ 的列, 运用分块运算技术, 把矩阵 $\boldsymbol{A}$ 作为一个整块,或作为一个常数; 把矩阵 $\boldsymbol{P}$ 中每个列看做一个块 (或元素), 运算如下: $$ A P=A\left[\begin{array}{llll} p_1 & p_2 & \ldots & p_n \end{array}\right]=\left[A p_1 A p_2 \ldots A p_n\right] $$ 好, 这时候用上了特征向量的定义式 $\boldsymbol{A P}=\lambda \boldsymbol{P}$, 上式继续有 $$ \boldsymbol{A P}=\left[\begin{array}{llll} \boldsymbol{A} \boldsymbol{p}_1 & \boldsymbol{A} \boldsymbol{p}_2 & \ldots & \boldsymbol{A} \boldsymbol{p}_n \end{array}\right]=\left[\begin{array}{llll} \lambda_1 \boldsymbol{p}_1 & \lambda_2 \boldsymbol{p}_2 & \ldots & \lambda_n \boldsymbol{p}_n \end{array}\right] $$ 把最后的矩阵按完全不同的方式分解: $$ \boldsymbol{A} \boldsymbol{P}=\left[\begin{array}{llll} \boldsymbol{P}_1 \lambda_1 & \boldsymbol{P}_2 \lambda_2 & \cdots & \boldsymbol{P}_n \lambda_n \end{array}\right]=\left[\begin{array}{llll} \boldsymbol{P}_1 & \boldsymbol{P}_2 & \cdots & \boldsymbol{P}_n \\ & & & \end{array}\right]\left[\begin{array}{cccc} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots & \\ & & \lambda_n \end{array}\right]=\boldsymbol{P}\left[\begin{array}{lllll} \lambda_1 & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & \lambda_n \end{array}\right] $$ 显然, 把最后的矩阵左乘一个 $\boldsymbol{P}$ 矩阵的逆, 把 $\boldsymbol{P}$ 消简成单位阵, 就得到了由特征值构成的对角阵 $\boldsymbol{\Lambda}$, 也即 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}$ 成立。 为了直接理解 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}$ 的变换过程, 首先, 咱回顾一下 “线性变换的矩阵定理”。想起来啦, 好, 由此定理, 我们理解一下下面似乎无聊的计算: $$ A=A E=A\left[\begin{array}{llll} e_1 & e_2 & \ldots & e_n \end{array}\right]=\left[\begin{array}{llll} A e_1 & A e_2 & \ldots & A e_n \end{array}\right] $$ 其中 $\left\{e_1, e_2, \ldots e_n\right\}$ 为单位基向量。 啥意思? 就这意思: 作为一线性变换, 矩阵 $\boldsymbol{A}$ 就等于自己逐个乘以坐标基向量 $\boldsymbol{e}_i$ 后得到的新矩阵。相当于对 $\boldsymbol{E}$ 内的每个列向量 $\boldsymbol{e}_i$ 进行了一次线性变换。 $\boldsymbol{E}$ 就是此坐标系下的单位基向量矩阵。 这和矩阵的几何意义相符: 一个矩阵就是把第一象限的单位立方体变换到其他象限的多面体, 单位立方体由单位基向量张成, 多面体由矩阵列向量张成; 而列向量是由基向量变换得到的。 回过头来, $\boldsymbol{P}$ 是原坐标系下的基向量矩阵 (但不一定是单位基向量矩阵)。一个 $\boldsymbol{A}$ 乘以 $\boldsymbol{P}$矩阵, 相当于对 $\boldsymbol{P}$ 内的每个列向量 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2, \ldots, \boldsymbol{p}_n\right\}$ 进行了一次线性变换, 也就是对基向量组进行了一次线性变换, 得到了一组新向量组 $\left\{A p_1, A p_2, \ldots, A p_n\right\}$ 。这组表达线性变换的向量组还在使用老的坐标系呢, 好, 再左乘个 $\boldsymbol{P}^{-1}$ 矩阵把它们统统变换到以 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2, \ldots, \boldsymbol{p}_n\right\}$ 为坐标系的空间里面去, 得到向量组 $\left\{P^{-1} A p_1, P^{-1} A p_2, \ldots, P^{-1} A p_n\right\}$, 把它们按序组成矩阵就是原线性变换在新基下的矩阵。 如果 $\boldsymbol{P}$ 矩阵的每个列向量 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2, \ldots, \boldsymbol{p}_n\right\}$ 都是特征向量, 则矩阵 $\left\{\boldsymbol{P}^{-1} A p_1, \boldsymbol{P}^{-1} A p_2, \ldots, \boldsymbol{P}^{-1} A p_n\right\}$ ## 相似对角化的例子 用前面[矩阵相似](https://kb.kmath.cn/kbase/detail.aspx?id=497)镜像变换的例子验证一下如何相似对角化。如图 5-52 所示, 在原坐标系 $\{x o y\}$ 下的镜像变换矩阵和基变换距阵分别为 $$ \boldsymbol{A}=\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right], \quad \boldsymbol{P}=\left[\begin{array}{cc} 1 & -1 \\ 1 & 1 \end{array}\right] $$ 那么相似对角化的过程 $\boldsymbol{A} \rightarrow \boldsymbol{A P} \rightarrow \boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{A}$ 具体是:  镜像变换 $\boldsymbol{A}$ 左乘矩阵 $\boldsymbol{P}$, 就把特征向量组 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_2\right\}=\left\{\left(\begin{array}{l}1 \\ 1\end{array}\right),\left(\begin{array}{c}-1 \\ 1\end{array}\right)\right\}$ 变换成了 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}=\left\{\left(\begin{array}{l}1 \\ 1\end{array}\right),\left(\begin{array}{c}1 \\ -1\end{array}\right)\right\}$,这两个向量的元素都是原坐标系下的数值; 再左乘逆矩阵 $\boldsymbol{P}^{-1}=\left[\begin{array}{rr}0.5 & 0.5 \\ -0.5 & 0.5\end{array}\right]$, 就把 $\left\{\boldsymbol{p}_1, \boldsymbol{p}_3\right\}$ 变成了新坐标系 $\left\{x^{\prime} o y^{\prime}\right\}$ 下的向量组 $\left\{\boldsymbol{p}_1^{\prime}, \boldsymbol{p}_3^{\prime}\right\}=\left\{\left(\begin{array}{l}1 \\ 0\end{array}\right),\left(\begin{array}{c}0 \\ -1\end{array}\right)\right\}$, 把 $\boldsymbol{P}_1^{\prime} 、 \boldsymbol{P}_3^{\prime}$ 组成矩阵, 就得到了表示镜像变换的新矩阵 $\boldsymbol{\Lambda}=\left[\begin{array}{rr}1 & 0 \\ 0 & -1\end{array}\right]$ 。这是新坐标系 $\left\{x^{\prime} o y^{\prime}\right\}$ 下的镜像变换矩阵。 从图上看到没? 镜像变换很简单, 就那么三个向量在那里放着没动, 就我们自个儿把矩阵啊向量啊乘过来除过去的, 折腾个没完——不为别的, 就为了那个传说中的对角阵。 其实, 我们很朴素地想一想特征向量的定义式 $A x=\lambda x$, 这公式本身就是一种简化: 矩阵 $\boldsymbol{A}$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\boldsymbol{A x}$ 等于一个常数(特征值) $\lambda$ 对特征向量 $\boldsymbol{x}$ 的变换结果 $\lambda \boldsymbol{x}$ 。这样看来, 矩阵的对角简化与特征向量的联系就不突然了。实际上, 想把 $\boldsymbol{A}$ 对角化, 就要有足够的特征向量形成 $\mathbf{R}^n$ 的一个基。 因此, 线性变换的相似对角化实质是寻找一个适当的坐标系, 使得该变换对这个新的坐标 > 一般实矩阵相似于对角阵的充要条件是它有 $n$ 个线性无关的特征向量这一基本结论, 正因为此, 要知道并不是任何实矩阵都可以相似于对角阵, 但实对称方阵一定可以与对角阵相似 (可对角化)。对这一点一定不要有所怀疑。 `例`问下列矩阵哪个可以对角化: $$ A =\left[\begin{array}{ccc} -3 & 1 & -1 \\ -7 & 5 & -1 \\ -6 & 6 & -2 \end{array}\right] \quad B =\left[\begin{array}{lll} 1 & -3 & 3 \\ 3 & -5 & 3 \\ 6 & -6 & 4 \end{array}\right] $$ 解 对于 $A$ ,求其特征值与特征向量 $$ | A -\lambda I |=\left|\begin{array}{ccc} -3-\lambda & 1 & -1 \\ -7 & 5-\lambda & -1 \\ -6 & 6 & -2-\lambda \end{array}\right|=-(\lambda+2)^2(\lambda-4) $$ 令 $| A -\lambda I |=0$ .故 $A$ 有特征值:$\lambda_1=\lambda_2=-2, \lambda_3=4$ .对于二重根 $\lambda_1=-2$ .求其特征向量: 由 $( A -\lambda I ) X =0$ 得 $$ \left[\begin{array}{ccc} -1 & 1 & -1 \\ -7 & 7 & -1 \\ -6 & 6 & 0 \end{array}\right]\left[\begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array}\right]=0 $$ 或 $$ \left[\begin{array}{ccc} -1 & 1 & -1 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array}\right]\left[\begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array}\right]=0 $$ 只有一个线性无关的特征向量: $X =(1,1,0)^{ T }$ . 因此对于 $\lambda_1=-2$ ,其几何重数 $m_1$ 小于代数重数 $n_1$ 。因此 $A$ 不可对角化对于矩阵 $B$ .同样求其特征值与特征向量: $$ | B -\lambda I |=0:\left[\begin{array}{ccc} 1-\lambda & -3 & 3 \\ 3 & -5-\lambda & 3 \\ 6 & -6 & 4-\lambda \end{array}\right]=-(\lambda+2)^2(\lambda-4) $$ 对 $\lambda=-2$ .线性齐次方程组:$\left( B -\lambda_1 I\right) X = 0$ : $$ \left[\begin{array}{rrr} 3 & -3 & 3 \\ 3 & -3 & 3 \\ 6 & -6 & 6 \end{array}\right]\left[\begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array}\right]= 0 . $$ 解之,有两个线性无关的特征向量: $$ X _1=(1,1,0)^{T}, \quad X _2=(1,0,-1)^{T} $$ 对于 $\lambda_3=4$ ,有线性齐次方程组 $\left( B -\lambda_3 I \right) X =0$ $$ \left[\begin{array}{ccc} -3 & -3 & 3 \\ 3 & -9 & 3 \\ 6 & -6 & 0 \end{array}\right]\left[\begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array}\right]=0 $$ 解之,得 $$ X _3=(1,1,2)^{T} $$ 因此 B 有三个线性无关的特征向量,因此 B 可对角化。记 $$ P =\left( X _1, X _2, X _3\right)=\left[\begin{array}{ccc} 1 & 1 & 1 \\ 1 & 0 & 1 \\ 0 & -1 & 2 \end{array}\right] $$ $$ \begin{aligned} &\text { 则必有 }\\ &P ^{-1} B P =\left[\begin{array}{lll} -2 & & \\ & -2 & \\ & & 4 \end{array}\right] \end{aligned} $$
上一篇:
正交矩阵
下一篇:
对称矩阵的对角化
在线学习仅为您提供最基础的数学知识,
开通会员
可以挑战海量
超难试题
, 分享本文到朋友圈,邀请更多朋友一起学习。
本文对您是否有用?
有用
(
0
)
无用
(
0
)
评论
更多
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
留言
科数网是专业专业的数学网站。