科数网
首页
题库
试卷
学习
VIP
你好
游客,
登录
注册
在线学习
线性代数
第七篇 二次型与正定型
二次型合同对角化的几何意义
最后
更新:
2024-09-06 19:05
查看:
444
次
反馈
同步训练
二次型合同对角化的几何意义
## 二次型合同对角化的几何意义 二次型对角化就是把二次型化简成标准形或规范形, 或者说把二次型度量矩阵化成对角矩阵, 这就是二次型的对角化问题。 对角化二次型必须要是矩阵的合同变换, 或者说度量矩阵和变换后的度量矩阵 (对角阵)必须是合同的。因为只有这样才能使二次型的函数值保持不变, 才能使向量长度保持不变。其他方法比如矩阵的相似对角化法能使矩阵对角化, 但这与二次型度量矩阵的对角化不是一回事,相似对角化法不能保证二次型的值不变。 从几何意义上讲, 相似对角化法是使矩阵本身所表示的某种线性变换不变进而对角化, 而二次型对角化法是保证矩阵背后所代表二次型的值不变。它们所要求的不变量是不同的。 什么样的合同变换可以保证二次型的值不变呢? 其实这是一个简单的变量替换过程: 对于一个二次型: $$ f(x)=x^{\mathrm{T}} A x $$ 有一个向量替换关系 $\boldsymbol{x}=\boldsymbol{C} \boldsymbol{y}$, 把它带入式 (7-4), 则函数值不变, 得到 $$ f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=(\boldsymbol{C} \boldsymbol{y})^{\mathrm{T}} \boldsymbol{A C} \boldsymbol{y}=\boldsymbol{y}^{\mathrm{T}} \boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C y}=\boldsymbol{y}^{\mathrm{T}}\left(\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\right) \boldsymbol{y} $$ 式 (7-5) 最后的表达式中的度量矩阵是 $\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}$, 这正是一个合同变换。 确实是矩阵的 “合同” 变换, 对矩阵 $\boldsymbol{A}$ 的左、右同时变换 (左乘 $\boldsymbol{C}^{\mathrm{T}}$ 和右乘 $\boldsymbol{C}$ ), 行和列的变换 “合同” 进行。 简单的变向量替换实际上就是基坐标系的变换: 基变了, 原来向量的坐标系当然变了, 即 $\boldsymbol{x} \rightarrow \boldsymbol{y}$, 这时如果仍然保持二次型值不变的话只能把原度量矩阵变成一个新的度量矩阵 $\boldsymbol{A} \rightarrow \boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}$ 。 和广义内积的度量矩阵是一样的, 选不同的基, 二次型度量矩阵就不同, 二次型的表达式 也就不同, 但二次型的值在不同基下是不变的。因此, 选何种基的问题就变成了对度量矩阵进行何种变换的问题, 二次型的化简就成了度量矩阵的对角化问题。 如果新的度量矩阵是一个对角矩阵 $\boldsymbol{C}^{\top} \boldsymbol{A C}=\boldsymbol{\Lambda}$, 我们就说把二次型合同对角化了。 合同变化的方法有多种, 比如正交变换、配方法、行列初等变换法等。 要选择什么样的合同变换对矩阵 $\boldsymbol{A}$ 进行对角化呢? 这与你应用目的有关系。 常见的二次型的应用主要有两类, 一类是与二次曲面相关的, 一类是与多元函数的极值有关的。比如, 在低维空间里如果要看这个几何图形是个什么二次曲线或二次曲面的话, 就只能对矩阵 $\boldsymbol{A}$ 进行正交变换, 即通过旋转或镜像变换来保持原几何图形不变形; 将这个二次型通过正交变换化成标准形, 然后通过这个标准形判断二次型代表何种曲面。主轴定理告诉我们, 标准形的参数就是二次型的矩阵的特征值。所以, 根据特征值的符号或者根据惯性定理就能确定或判断曲面的类型。 如果要判断这个函数是不是在任意变量下都是正值或是负值的情况或者求这个函数的极值,就可以使用其他的可逆变换对矩阵 $\boldsymbol{A}$ 进行各种合同变换, 比如初等变换、配方法等。这些变换在背景坐标系下看起来可能会改变图形的形状, 比如把一个球变成一个粗球, 但变换后的图形该凸的还是凸、该凹的还是凹,(复)向量的长度平方该正值仍正值、该负值还负值。 7. 3. 1 二次型对角化之正交变换 我们把二次型变换成标准形时, 要求的是合同变换, 而一般来说没有现成的方法可以直接求合同变换。但我们发现二次型对应的是一个实对称矩阵, 而实对称矩阵是一定可以通过相似变换为对角阵的, 更重要的是在实对称情况下, 这种相似变换还可以是正交的, 这时候相似变换就成了合同变换了。所以我们是用正交的相似变换代替了合同变换来求二次型的标准形的。因此, 正交变换既是相似变换同时又是合同变换。 对于一个正交矩阵 $\boldsymbol{Q}$, 因为 $\boldsymbol{Q}^{\mathrm{T}} \boldsymbol{Q}=\boldsymbol{E}$, 所以有 $\boldsymbol{Q}^{\mathrm{T}}=\boldsymbol{Q}^{-1}$ 。如果用正交矩阵进行合同变换, 那么有向量替换关系 $x=Q y$ 使 $$ f(x)=x^{\mathrm{T}} A \boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\left(Q^{\mathrm{T}} A Q\right) y=\boldsymbol{y}^{\mathrm{T}}\left(Q^{-1} A Q\right) y $$ 因此, 正交变换既是相似变换同时又是合同变换。 由于正交变换保持变换前后的向量内积不变, 从而保持向量的长度与夹角不变, 所以正交变换属于刚体变换, 是代表空间的一个旋转/镜像变换。利用矩阵乘积分解的方法, 这种变换的转轴、转角可以用矩阵的特征参数量化地表示出来。 和其他合同变换 (又称为可逆线性替换) 不保持图形的 “形状”, 如可以把祁圆变成圆的特点相比, 正交变换则保持原图形的 “形状”。 例如, 椭球面的方程为 $$ \frac{x^2}{1}+\frac{y^2}{4}+\frac{z^2}{9}=1 $$ 将其通过可逆线性替换 $\left(\begin{array}{l}x \\ y \\ z\end{array}\right)=\left(\begin{array}{ll}1 & \\ & 2 \\ & 3\end{array}\right)\left(\begin{array}{l}x^{\prime} \\ y^{\prime} \\ z^{\prime}\end{array}\right)$ 化为 $x^{\prime 2}+y^{\prime 2}+z^{\prime 2}=1$, 即椭球面变成了球面, 不保持图形的 “形状”。 椭球面方程也通过不可逆线性变换 $\left(\begin{array}{l}x \\ y \\ z\end{array}\right)=\left(\begin{array}{rr}1 & \\ & 2 \\ & 0\end{array}\right)\left(\begin{array}{l}x^{\prime} \\ y^{\prime} \\ z^{\prime}\end{array}\right)$ 化为 $x^{\prime 2}+y^{\prime 2}=1$, 即椭球面变成了圆柱面, 也不保持图形的 “形状”。 而正交变换保持向量长度和角度不变, 因此几何图形不变。所以在讨论二次方程决定的图形时, 必须用正交变换; 如果只考虑它所属的类型, 则可以用可逆的合同变换(当然也包括正交变换)。 用正交变换 $\boldsymbol{x}=\boldsymbol{Q} \boldsymbol{y}$ 把三元二次型 $f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}$ 化为标准形 $\lambda_1 y_1^2+\lambda_2 y_2^2+\lambda_3 y_3^2$, 在几何上就是把坐标轴变换到与二次曲面 $\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=1$ 的主轴(即对称轴)重合的位置。其中 $\boldsymbol{Q}$ 的列向量恰好给出了二次曲面的主轴的方向。因此, 关于用正交变换化二次型为标准形的定理也称为主轴定理。这同时也是主轴定理的几何意义。 下面插一下主轴定理的定义: 对于任意一个 $n$ 元二次型: $$ f\left(x_1, x_2, \cdots, x_n\right)=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x} $$ 存在正交变换 $x=Q y$ ( $Q$ 为 $n$ 元正交矩阵), 使得 $$ \boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\left(\boldsymbol{Q}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{Q}\right) \boldsymbol{y}=\lambda_1 y_1^2+\lambda_2 y_2^2+\cdots+\lambda_n y_n^2 $$ 其中: $\lambda_1, \lambda_2, \cdots, \lambda_n$ 是实对称矩阵 $\boldsymbol{A}$ 的 $n$ 个特征值; $\boldsymbol{Q}$ 的 $n$ 个列向量是对应于特征值 $\lambda_1, \lambda_2, \cdots, \lambda_n$的标准正交特征向量。 因此, 从几何图形上寻找二次型主轴的问题, 在线性代数中就等价于让矩阵 $A$ 经过正交变换 (同时也是相似变换) 使矩阵 $\boldsymbol{A}$ 对角化。要对角化就要找它的主轴的大小和方向, 也就是找它的特征值和特征向量。 找到了特征向量就可以用它们组成一个正交矩阵, 用这个正交矩阵就可以把二次型转到对角化, 实际上就是把坐标轴转到二次型曲面的主轴方向, 由此可以简化二次型。在许多工程问题中, 可以使它的某些物理意义变得清晰起来, 因而得到了广泛应用。 例 7.1 用正交变换化简下列二次曲面方程为标准形: $$ x_1^2+x_2^2+x_3^2-2 x_1 x_2=1 $$ 解 将左边的二次型表示为矩阵/向量形式: $$ x_1^2+x_2^2+x_3^2-2 x_1 x_2=\boldsymbol{x}^{\top} \boldsymbol{A} \boldsymbol{x}=\left(\begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array}\right)^T\left[\begin{array}{ccc} 1 & 0 & -1 \\ 0 & 1 & 0 \\ -1 & 0 & 1 \end{array}\right]\left(\begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array}\right) $$ 容易求出矩阵 $\boldsymbol{A}$ 的特征多项式: $$ |\lambda \boldsymbol{E}-\boldsymbol{A}|=\left|\begin{array}{ccc} \lambda-1 & 0 & -1 \\ 0 & \lambda-1 & 0 \\ -1 & 0 & \lambda-1 \end{array}\right|=\lambda(\lambda-1)(\lambda-2) $$ 其实到了这里得到了特征值, 我们就已经知道了二次型的标准形, 如果要知道正交矩阵的话, 继续: 由每个特征值 $\lambda=1,2,0$, 计算出对应的特征向量, 并单位化: $$ \boldsymbol{e}_1=\left(\begin{array}{l} 0 \\ 1 \\ 0 \end{array}\right), \boldsymbol{e}_2=\frac{1}{\sqrt{2}}\left(\begin{array}{c} -1 \\ 0 \\ 1 \end{array}\right
免费注册看余下 50%
非VIP会员每天15篇文章,开通VIP 无限制查看
上一篇:
特征值与图像的正定
下一篇:
阅读:正定定理
本文对您是否有用?
有用
(
0
)
无用
(
0
)
更多
学习首页
数学试卷
同步训练
投稿
题库下载
会议预约系统
数学公式
关于
科数网是专业专业的数学网站 版权所有 本站部分教程采用AI辅助生成,请学习时自行鉴别
如果页面无法显示请联系 18155261033 或 983506039@qq.com