科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
线性代数
第七篇 二次型与正定型
实对称矩阵的对角化
最后
更新:
2025-04-25 08:32
查看:
110
次
反馈
同步训练
实对称矩阵的对角化
## 矩阵为什么对角化 **矩阵对角化本质是找到一组正交坐标系,使矩阵作用简化为各坐标轴方向的伸缩变换** 矩阵对角化的通俗解释可以从“换坐标系”的角度理解,目的是让复杂的矩阵运算变得像“数数”一样简单。以下是分步说明: ### 为什么需要“对角化” 想象你有一个遥控器(矩阵),每个按键控制不同的功能(矩阵的列)。但遥控器设计得太复杂,按下按键时多个功能同时触发(矩阵运算混乱)。 对角化的目标:重新设计遥控器,让每个按键只控制一个独立功能(矩阵运算简化为缩放)。 对角矩阵就像一个“完美遥控器”,每个按键只负责放大或缩小某个信号,互不干扰。 ### 对角化的核心步骤 1. 找特征向量(新坐标轴) 特征向量是矩阵变换中方向不变的向量。例如,旋转矩阵的特征向量是旋转轴,拉伸矩阵的特征向量是拉伸方向。 特征值:对应方向上的缩放比例(比如拉伸2倍,缩放0.5倍)。 2. 用特征向量组成新基(新遥控器按键) 将特征向量排成矩阵 $P$,相当于建立一组新坐标系。例如,原坐标系是直角坐标系,新坐标系可能是倾斜的,但更符合矩阵的“性格”。 3. 对角矩阵(简化后的遥控器) 通过 $ P^{-1}AP = \Lambda $,原矩阵 $ A$ 被转化为对角矩阵 $ \Lambda $,对角线上的元素就是特征值。此时,矩阵运算(如求幂)只需对每个特征值单独操作。 --- ### **通俗类比** 1. 陀螺旋转 • 原坐标系下,陀螺的运动轨迹复杂。 • 若以旋转轴为新坐标系,陀螺的运动只是绕轴旋转,其他方向无变化(对角矩阵的“缩放”效果)。 2. 遥控器优化 • 原遥控器按键混乱(普通矩阵)。 • 对角化后,每个按键只控制音量、频道等单一功能(对角矩阵的独立缩放)。 ### **对角化的意义** 1. 简化计算 • 计算矩阵的100次幂:对角矩阵只需对每个特征值取100次幂,普通矩阵需连乘100次。 • 例子:计算 $ A^{100} $,若 $ A = PDP^{-1} $,则 $ A^{100} = PD^{100}P^{-1}$。 2. 揭示本质 • 特征值代表矩阵的“核心作用力”(如量子力学中的能量本征值)。 • 特征向量代表“作用方向”(如力学中的主应力方向)。 3. 解决实际问题 • 图像处理:PCA通过协方差矩阵对角化提取图像主特征。 • 微分方程:将方程组解耦为独立方程,便于求解。 ### 什么矩阵能对角化? • 实对称矩阵:必可对角化,且特征向量正交(如力学中的应力矩阵)。 • 一般矩阵:需满足有 $ n $ 个线性无关的特征向量(如非重复特征值的矩阵)。 总之,矩阵对角化就像给矩阵“换一副眼镜”,让它原本模糊的作用变得清晰可见。通过找到最自然的坐标系(特征向量基),复杂变换被分解为简单的缩放操作。无论是量子力学中的粒子行为,还是抖音推荐算法中的用户兴趣分析,对角化都在背后默默简化问题。 ## 实对称矩阵的对角化 在矩阵里,介绍了矩阵的转置,矩阵的转置最主要的作用就是判断一个矩阵是不是对称矩阵。 **如果矩阵$A$是对称矩阵,那么$A^T=A$,反之,如果$A^T=A$,那么这个矩阵是对称矩阵。** ,而二次型就是对称矩阵,所以,此时矩阵的转置就派上了用场。 **定理1** 不是每个矩阵都可以对角化,但是实对称矩阵一定可以对角化。这句话另外一个表述是:一个 $n \times n$ 矩阵 $A$ 可正交对角化的充分必要条件是 $A$ 是对称矩阵. 证明略。 这个定理相当奇妙,我们很难推断一个矩阵可以对角化,但是每个对称矩阵却可以对角化。即每个对称矩阵D都可以相似对角形 $$ D \sim \left[\begin{array}{cccc} \lambda_{11} & & & 0 \\ & \lambda_{22} & & \\ & & \ddots & \\ 0 & & & \lambda_{n n} \end{array}\right] $$ 我们为什么特别关心实对称矩阵?我们看一下相似与合同 合同是 $C^TAC=B$ 相似是 $C^{-1}AC=B$ 仔细看,如果$C^T=C^{-1}$ 多好啊,这样就又相似又合同,还真有,那就是正交相似,详见 [附录2](https://kb.kmath.cn/kbase/detail.aspx?id=772) ## 例题 `例` 对角化矩阵 $A=\left[\begin{array}{rrr}6 & -2 & -1 \\ -2 & 6 & -1 \\ -1 & -1 & 5\end{array}\right]$. 解:不难发现,这是一个对称矩阵。 $A$ 的特征方程是 $$ 0=-\lambda^3+17 \lambda^2-90 \lambda+144=-(\lambda-8)(\lambda-6)(\lambda-3) $$ 通过标准计算可得到每个特征子空间的一个基 ①当 $\lambda=8 $ ,特征向量为 $$ \alpha_1=\left[\begin{array}{r} -1 \\ 1 \\ 0 \end{array}\right] $$ ②当 $\lambda=6 $ ,特征向量为 $$ \alpha_2=\left[\begin{array}{r} -1 \\ -1 \\ 2 \end{array}\right] $$ ③ 当 $\lambda=3 $ ,特征向量为 $$ \alpha_3=\left[\begin{array}{l} 1 \\ 1 \\ 1 \end{array}\right] $$ 把$\alpha_1,\alpha_2,\alpha_3$竖着排列起来,形成一个矩阵, $\{\alpha_1,\alpha_2,\alpha_3\}$ 容易看到这是一个正交集(**这就相当于我们在三维空间里找到了3个两两互相垂直的坐标轴**,但还不是单位坐标轴)。 如果他是单位矩阵,可以有更多性质,现在对$\alpha_1,\alpha_2,\alpha_3$进行单位化,得到单位特征向量. $$ \begin{gathered} u _1=\left[\begin{array}{c} -1 / \sqrt{2} \\ 1 / \sqrt{2} \\ 0 \end{array}\right], \quad u _2=\left[\begin{array}{c} -1 / \sqrt{6} \\ -1 / \sqrt{6} \\ 2 / \sqrt{6} \end{array}\right], \quad u _3=\left[\begin{array}{l} 1 / \sqrt{3} \\ 1 / \sqrt{3} \\ 1 / \sqrt{3} \end{array}\right] \\ P=\left[\begin{array}{ccc} -1 / \sqrt{2} & -1 / \sqrt{6} & 1 / \sqrt{3} \\ 1 / \sqrt{2} & -1 / \sqrt{6} & 1 / \sqrt{3} \\ 0 & 2 / \sqrt{6} & 1 / \sqrt{3} \end{array}\right], \quad D=\left[\begin{array}{lll} 8 & 0 & 0 \\ 0 & 6 & 0 \\ 0 & 0 & 3 \end{array}\right] \end{gathered} $$ 那么有 $A=P D P^{-1}$, 和平常一样. 由于 $P$ 是方阵且有正交列, 所以, $P$ 是一个正交矩阵, 而 $P^{-1}$ 就是 $P^{\top}$ ### **定理2** 如果 $A$ 是对称矩阵, 那么不同特征空间的任意两个特征向量是正交的. 证 设 $v_1$ 和 $v_2$ 是对应不同特征值 $\lambda_1, \lambda_2$ 的特征向量. 为证明 $\nu_1 \cdot v_2=0$, 计算 $$ \begin{aligned} \lambda_1 v _1 \cdot v _2 & =\left(\lambda_1 v _1\right)^{T} v _2=\left(A v _1\right)^{T} \cdot v _2 \\ & =\left( v _1^{\top} A^{\top}\right) v _2= v _1^{\top}\left(A v _2\right) \\ & = v _1^{T}\left(\lambda_2 v _2\right) \\ & =\lambda_2 v _1^{\top} v _2=\lambda_2 v _1 \cdot v _2 \end{aligned} $$ 因此 $\left(\lambda_1-\lambda_2\right) v _1 \cdot v _2=0$, 但是 $\lambda_1 \neq \lambda_2$, 所以 $v _1 \cdot v _2=0$. 通过定理1和定理2我们得到如下一个重要结论: > **实对称矩阵的特征值都是实数,而且不同特征值对应的特征向量相互正交。这一点很重要,因为普通矩阵对角化不一定能找到正交矩阵,但实对称矩阵可以,这是一个关键点。** `例` 将 $A=\left[\begin{array}{rrr}3 & -2 & 4 \\ -2 & 6 & 2 \\ 4 & 2 & 3\end{array}\right]$ 正交对角化, 其特征方程为 $$ 0=-\lambda^3+12 \lambda^2-21 \lambda-98=-(\lambda-7)^2(\lambda+2) $$ 解 通过计算可得特征空间的基: $$ \lambda=7: v_1=\left[\begin{array}{l} 1 \\ 0 \\ 1 \end{array}\right], v_2=\left[\begin{array}{c} -1 / 2 \\ 1 \\ 0 \end{array
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
矩阵的合同
下一篇:
二次型化标准形(配方法)
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com